Optimization of K Value in Clustering Using Silhouette Score (Case Study: Mall Customers Data)

  • Mulyani H
  • Setiawan R
  • Fathi H
N/ACitations
Citations of this article
119Readers
Mendeley users who have this article in their library.

Abstract

Clustering is an important phase in data mining. The grouping method commonly used in data mining concepts is using K-Means. Choosing the best value of k in the k-means algorithm can be difficult. In this study the technique used to determine the value of k is the silhouette score. Then, to evaluate the k-means model uses the Davies Bouldin Index (DBI) technique. The best DBI value is close to 0. The parameters used are total consumer income and spending. Based on the results of this study it can be concluded that the silhouette score method can provide a k value with optimal results. For mall customer data of 200 data, the most optimal silhouette score is obtained at K = 5 with a DBI = 0.57.Pengelompokan data merupakan salah satu bagian penting pada penerapan data mining, salah satu manfaatnya adalah untuk menentukan target pasar. Metode pengelompokan yang biasa digunakan dalam konsep data mining adalah menggunakan K-Means. Teknik K-Means mengelompokan data berdasarkan kemiripan. Data yang memiliki karakteristik yang sama akan dimasukan ke dalam cluster yang sama. Nilai K menunjukkan jumlah cluster yang akan dibentuk dari dataset yang dimiliki. Penentuan jumlah kelompok atau nilai K akan mempengaruhi kualitas hasil pengelompokan yang terbentuk. Sehingga untuk menentukan nilai K diperlukan teknik khusus agar hasil pengelompokan lebih optimal. Dalam penelitian ini teknik yang digunakan untuk menentukan nilai k menggunakan silhouette score. Untuk evaluasi model k-means menggunakan teknik Davies Bouldin Indek (DBI). Nilai DBI yang paling baik adalah mendekati 0. Parameter yang digunakan adalah jumlah pendapatan dan jumlah pengeluaran konsumen. Berdasarkan hasil penelitian ini dapat disimpulkan bahwa metode silhouette score dapat memberikan nilai k dengan hasil yang optimal. Untuk data mall customer sebanyak 200 data diperoleh nilai silhouette score paling optimal di K=5 dengan nilai DBI=0,57.

Cite

CITATION STYLE

APA

Mulyani, H., Setiawan, R. A., & Fathi, H. (2023). Optimization of K Value in Clustering Using Silhouette Score (Case Study: Mall Customers Data). Journal of Information Technology and Its Utilization, 6(2), 45–50. https://doi.org/10.56873/jitu.6.2.5243

Register to see more suggestions

Mendeley helps you to discover research relevant for your work.

Already have an account?

Save time finding and organizing research with Mendeley

Sign up for free