Dataset yang mempunyai jumlah record atau atribut dalam jumlah besar bisa disebut juga dengan dataset besar. Ukuran dataset besar memiliki jumlah dalam besaran dari terabyte sampai petabyte. Pengolahan dataset besar tersebut membutuhkan komputer yang memiliki spesifikasi tinggi. Untuk mengklasifikasikan objek baru berdasarkan atribut data training sample tersebut bisa menggunakan algoritma k-NN. Salah satu kelebihan algorotma kNN adalah efektif dan sering digunakan untuk mengatur permasalahan mengenai klasifikasi. Cukup lamanya waktu komputasi menjadi salah satu kelemahan algoritma kNN. Hal ini diakibatkan oleh proses kalkulasi algoritma kNN terhadap dataset yang besar. Dari masalah-masalah yang muncul tersebut, maka peneliti mengusulkan sistem pembelajaran kNN menggunakan boostraping dan Weighted Gini Index sebagai solusi untuk penanganan masalah pengolahan dataset besar. Pembelajaran kNN menggunakan Bootstrap-Weighted Gini Index dipakai untuk memangkas atribut maupun record berlandaskan hasil penyaringan atribut dan record yang mempunyai kuwalitas error sedikit. Penelitian ini membuktikan bahwa, hasil penambahan akurasi yang didapat dari pengolahan pada dataset Landsat (akurasi semula sebesar 91,40% menjadi 94,95%), Thyroid (akurasi semula 89,31% menjadi 96,61%), HTRU (akurasi semula 96,01% menjadi 98,18%) dan EEG Eye (akurasi semula 97,40% menjadi 97,80%).
CITATION STYLE
Bijanto, B., Abidin, Z., & Tamrin, T. (2022). PEMBELAJARAN ALGORITMA K-NN UNTUK BIG DATASET MENGGUNAKAN METODE SAMPLE BOOTSTRAP DAN WEIGHTED GINI INDEX. Jurnal DISPROTEK, 12(2), 71–77. https://doi.org/10.34001/jdpt.v12i2.2091
Mendeley helps you to discover research relevant for your work.