Implementasi Clustering Data Kasus Covid 19 Di Indonesia Menggunakan Algoritma K-Means

Nofita Sari; Hanny Hikmayanti Handayani; Amril Mutoi Siregar

Journal ArticleOPEN ACCESS

Implementasi Clustering Data Kasus Covid 19 Di Indonesia Menggunakan Algoritma K-Means

Sari N
Handayani H
Siregar A

Bianglala Informatika (2023) 11(1) 7-12

DOI: 10.31294/bi.v11i1.14762

N/ACitations

36Readers

Abstract

Covid19 adalah virus pertama kali terdeteksi di Wuhan, Cina pada akhir Desember 2019. Kasus Covid-19 masuk di Indonesia pada Maret 2020, tercatat mencapai 1.511.712 dengan jumlah kematian 40,858 dan sembuh 1.348.330 kasus. Di Indonesia terdapat 34 provinsi yang menjadi persebaran kasus Covid19. Penelitian ini bertujuan untuk mengelompokkan setiap provinsi di Indonesia ke dalam beberapa cluster tertentu agar mengetahui daerah dengan jumlah kasus yang tergolong tinggi, sedang, rendah. Mengelompokan data kasus Covid19 di provinsi Indonesia menggunakan teknik clustering dengan menggunakan algoritma K-means. Data yang digunakan sebanyak 7098 data dari tanggal 1 Maret hingga 11 Oktober 2020. Dataset yang digunakan dari website AtapData (atapdata.ai). Mengolah data tersebut menggunakan Google Collaboratory dengan bahasa pemrograman python. Pada penelitian dilakukan optimasi menggunakan metode elbow yang menghasilkan jumlah cluster sebanyak 3 cluster. Pengujian dilakukan untuk mendapatkan nilai K yang optimal. Melakukan evaluasi menggunakan Sum of Square Error (SSE). Dari hasil evaluasi memiliki jumlah optimal K: 3 yaitu 228913736548657.56.Kata Kunci : Covid19, algoritma K means, Clustering, Metode ElbowCovid19 is a virus that was first detected in Wuhan, China at the end of December 2019. Covid-19 cases entered Indonesia in March 2020, it was recorded that it had reached 1,511,712 with 40,858 deaths and 1,348,330 cases of recovery. In Indonesia there are 34 provinces where the spread of Covid19 cases. This study aims to classify each province in Indonesia into certain clusters in order to identify areas with high, medium, low number of cases. The grouping of Covid19 case data in the Indonesian province uses a clustering technique using the K-means algorithm. The data used is 7098 data from March 1 to October 11 2020. The dataset used is from the AtapData website (atapdata.ai). Processing the data using Google Collaboratory with the python programming language. In this research, optimization was carried out using the elbow method which resulted in a total of 3 clusters. Tests are carried out to obtain optimal K values. Evaluation using Sum of Square Error (SSE). From the evaluation results, it has an optimal number of K: 3, namely 228913736548657.56.Keywords: Covid19, K mean algorithm, Clustering, Elbow Method

Cite

CITATION STYLE

APA

Sari, N., Handayani, H. H., & Siregar, A. M. (2023). Implementasi Clustering Data Kasus Covid 19 Di Indonesia Menggunakan Algoritma K-Means. Bianglala Informatika, 11(1), 7–12. https://doi.org/10.31294/bi.v11i1.14762

Implementasi Clustering Data Kasus Covid 19 Di Indonesia Menggunakan Algoritma K-Means

Abstract

Cite

Register to see more suggestions