Penerapan Klasifikasi Naive Bayes dengan Algoritma Random Oversampling dan Random Undersampling pada Data Tidak Seimbang Cervical Cancer Risk Factors

Jus Prasetya

Journal ArticleOPEN ACCESS

Penerapan Klasifikasi Naive Bayes dengan Algoritma Random Oversampling dan Random Undersampling pada Data Tidak Seimbang Cervical Cancer Risk Factors

Prasetya J

Leibniz: Jurnal Matematika (2022) 2(2) 11-22

DOI: 10.59632/leibniz.v2i2.173

N/ACitations

98Readers

Abstract

Machine learning adalah cabang ilmu komputer yang memanfaatkan pengalaman (peristiwa) pada masa lalu untuk dipelajari dan menggunakan pengetahuannya untuk membuat keputusan di masa depan. Pada machine learning, proses klasifikasi dilakukan untuk meminimalkan kesalahan klasifikasi maka dengan demikian akan memaksimalkan akurasi prediksi. Asumsi yang mendasari metode klasifikasi ini adalah bahwa data yang diteliti memiliki jumlah sampel yang seimbang setiap kelas yang tersedia. Random Oversampling adalah proses resamplingnya dengan cara memilih sampel dari kelas minoritas secara acak, sampel yang dipilih secara acak ini kemudian diduplikasi dan ditambahkan ke set pelatihan baru. Random Undersampling adalah proses resampling dengan sampel pada kelas mayoritas dalam set pelatihan dihilangkan secara acak sampai rasio antara kelas minoritas dan mayoritas berada pada tingkat yang diinginkan. Nilai AUC yang didapatkan pada klasifikasi naive bayes sebesar 0,5325 yang berarti klasifikasi gagal. Nilai AUC yang didapatkan pada klasifikasi random oversampling-naive bayes sebesar 0,62 yang berarti klasifikasi buruk. Nilai AUC yang didapatkan pada klasifikasi random undersampling-naive bayes sebesar 0,7013 yang berarti klasifikasi cukup baik.

Cite

CITATION STYLE

APA

Prasetya, J. (2022). Penerapan Klasifikasi Naive Bayes dengan Algoritma Random Oversampling dan Random Undersampling pada Data Tidak Seimbang Cervical Cancer Risk Factors. Leibniz: Jurnal Matematika, 2(2), 11–22. https://doi.org/10.59632/leibniz.v2i2.173

Penerapan Klasifikasi Naive Bayes dengan Algoritma Random Oversampling dan Random Undersampling pada Data Tidak Seimbang Cervical Cancer Risk Factors

Abstract

Cite

Register to see more suggestions