Machine learning adalah cabang ilmu komputer yang memanfaatkan pengalaman (peristiwa) pada masa lalu untuk dipelajari dan menggunakan pengetahuannya untuk membuat keputusan di masa depan. Pada machine learning, proses klasifikasi dilakukan untuk meminimalkan kesalahan klasifikasi maka dengan demikian akan memaksimalkan akurasi prediksi. Asumsi yang mendasari metode klasifikasi ini adalah bahwa data yang diteliti memiliki jumlah sampel yang seimbang setiap kelas yang tersedia. Random Oversampling adalah proses resamplingnya dengan cara memilih sampel dari kelas minoritas secara acak, sampel yang dipilih secara acak ini kemudian diduplikasi dan ditambahkan ke set pelatihan baru. Random Undersampling adalah proses resampling dengan sampel pada kelas mayoritas dalam set pelatihan dihilangkan secara acak sampai rasio antara kelas minoritas dan mayoritas berada pada tingkat yang diinginkan. Nilai AUC yang didapatkan pada klasifikasi naive bayes sebesar 0,5325 yang berarti klasifikasi gagal. Nilai AUC yang didapatkan pada klasifikasi random oversampling-naive bayes sebesar 0,62 yang berarti klasifikasi buruk. Nilai AUC yang didapatkan pada klasifikasi random undersampling-naive bayes sebesar 0,7013 yang berarti klasifikasi cukup baik.
CITATION STYLE
Prasetya, J. (2022). Penerapan Klasifikasi Naive Bayes dengan Algoritma Random Oversampling dan Random Undersampling pada Data Tidak Seimbang Cervical Cancer Risk Factors. Leibniz: Jurnal Matematika, 2(2), 11–22. https://doi.org/10.59632/leibniz.v2i2.173
Mendeley helps you to discover research relevant for your work.