Abstract
Clustering is an important phase in data mining. The grouping method commonly used in data mining concepts is using K-Means. Choosing the best value of k in the k-means algorithm can be difficult. In this study the technique used to determine the value of k is the silhouette score. Then, to evaluate the k-means model uses the Davies Bouldin Index (DBI) technique. The best DBI value is close to 0. The parameters used are total consumer income and spending. Based on the results of this study it can be concluded that the silhouette score method can provide a k value with optimal results. For mall customer data of 200 data, the most optimal silhouette score is obtained at K = 5 with a DBI = 0.57.Pengelompokan data merupakan salah satu bagian penting pada penerapan data mining, salah satu manfaatnya adalah untuk menentukan target pasar. Metode pengelompokan yang biasa digunakan dalam konsep data mining adalah menggunakan K-Means. Teknik K-Means mengelompokan data berdasarkan kemiripan. Data yang memiliki karakteristik yang sama akan dimasukan ke dalam cluster yang sama. Nilai K menunjukkan jumlah cluster yang akan dibentuk dari dataset yang dimiliki. Penentuan jumlah kelompok atau nilai K akan mempengaruhi kualitas hasil pengelompokan yang terbentuk. Sehingga untuk menentukan nilai K diperlukan teknik khusus agar hasil pengelompokan lebih optimal. Dalam penelitian ini teknik yang digunakan untuk menentukan nilai k menggunakan silhouette score. Untuk evaluasi model k-means menggunakan teknik Davies Bouldin Indek (DBI). Nilai DBI yang paling baik adalah mendekati 0. Parameter yang digunakan adalah jumlah pendapatan dan jumlah pengeluaran konsumen. Berdasarkan hasil penelitian ini dapat disimpulkan bahwa metode silhouette score dapat memberikan nilai k dengan hasil yang optimal. Untuk data mall customer sebanyak 200 data diperoleh nilai silhouette score paling optimal di K=5 dengan nilai DBI=0,57.
Cite
CITATION STYLE
Mulyani, H., Setiawan, R. A., & Fathi, H. (2023). Optimization of K Value in Clustering Using Silhouette Score (Case Study: Mall Customers Data). Journal of Information Technology and Its Utilization, 6(2), 45–50. https://doi.org/10.56873/jitu.6.2.5243
Register to see more suggestions
Mendeley helps you to discover research relevant for your work.