PEMANFAATAN METODE WEIGHTED K-NEAREST NEIGHBOR IMPUTATION (WEIGHTED KNNI) UNTUK MENGATASI MISSING DATA

  • Fadillah I
  • Puspita C
N/ACitations
Citations of this article
14Readers
Mendeley users who have this article in their library.

Abstract

Pada tahun 2020, hampir semua negara di dunia menghadapi wabah COVID-19, termasuk Indonesia. Salah satu dampak yang terjadi karena adanya pandemi COVID-19 adalah terhambatnya kegiatan statistik, seperti tertundanya atau berhentinya pelaksanaan pengumpulan data survei dan sensus serta pengumpulan data lainnya. Sementara itu, untuk memenuhi permintaan dan kebutuhan data selama masa pandemi COVID-19, badan statistik nasional harus tetap melakukan pengumpulan data dan menyediakan data statistik. Oleh sebab itu, badan statistik nasional harus melakukan adaptasi untuk kegiatan proses sensus dan survei yang dilakukan, seperti mencari mode pengumpulan data alternatif, mengurangi ukuran sampel, memodifikasi desain sampel, mengurangi item pertanyaan di kuesioner, atau lainnya. Berdasarkan uraian tersebut, adaptasi kegiatan pengumpulan data sensus/survei yang dilakukan pada masa pandemi COVID-19 akan berpengaruh pada kualitas data yang dihasilkan. Salah satunya adanya missing data. Untuk mengatasi masalah missing data, salah satu metode yang dapat digunakan adalah imputasi data. Salah satu jenis metode imputasi berbasis machine learning yang sering digunakan adalah Weighted K-Nearest Neighbor Imputation (Weighted KNNI). Metode Weighted KNNI memiliki akurasi yang lebih baik dibandingkan kedua metode imputasi lainnya (Unweighted KNNI dan Mean Imputation) pada tiap persentase missing data baik akurasi dari sisi RMSE maupun akurasi dari sisi MAPE. Berdasarkan hasil tersebut yang dilihat dari akurasinya, metode Weighted KNNI dapat digunakan sebagai salah satu solusi untuk menangani ketidaklengkapan data pada masa pandemi COVID19 sekarang ini.

Cite

CITATION STYLE

APA

Fadillah, I. J., & Puspita, C. D. (2021). PEMANFAATAN METODE WEIGHTED K-NEAREST NEIGHBOR IMPUTATION (WEIGHTED KNNI) UNTUK MENGATASI MISSING DATA. Seminar Nasional Official Statistics, 2020(1), 511–518. https://doi.org/10.34123/semnasoffstat.v2020i1.409

Register to see more suggestions

Mendeley helps you to discover research relevant for your work.

Already have an account?

Save time finding and organizing research with Mendeley

Sign up for free