Masalah ketidakseimbangan kelas telah menjadi salah satu tantangan dalam kinerja banyak algoritma klasifikasi. Kelas tidak seimbang merupakan suatu kondisi dimana terdapat dataset yang jumlah kelasnya terdapat perbedaan yang signifikan terhadap masing-masing jumlah kelas. Dalam kumpulan data yang terdiri dari dua kelas, ukuran sampel kategori mayoritas (lebih besar) mendominasi sampel kategori minoritas (lebih kecil) dengan rasio sebesar 1:100, 1:1.000 atau 1:10.000. Dampak ketidakseimbangan ini menyebabkan klasifikasi menjadi buruk dan tidak optimal. Sebagian besar algoritma klasifikasi standar cenderung mengklasifikasikan kelas mayoritas dengan tingkat akurasi tinggi dan kelas minoritas dengan tingkat akurasi rendah, sehingga mengakibatkan terjadinya bias. Dalam banyak aplikasi, lebih penting untuk mengidentifikasi kelas minoritas dari pada kelas mayoritas. Pada penelitian ini diusulkan pendekatan berbasis ensemble dengan pengklasifikasi yang digunakan adalah LightGBM dan XGBoost, kedua metode ini merupakan metode gradien efisien yang beberapa tahun terakhir telah disarankan berdasarkan pohon keputusan sehingga mampu menangani masalah data dengan skala besar. Data yang digunakan diperoleh dari UCI Repository dengan 5 data, 3 diantaranya memiliki tingkat ketidakseimbangan tinggi dan sisanya dengan tingkat ketidakseimbangan rendah. Jumlah kelas yang digunakan pada penelitian adalah dua kelas. Hasil penelitian menunjukkan bahwa kinerja metode XGBoost dalam akurasi dan sensitivitas lebih baik dibandingkan LightGBM di hampir seluruh data. Sedangkan kemampuan dalam menebak kelas minoritas (spesifisitas), metode LightGBM lebih baik dibandingkan XGBoost dengan nilai keseluruhan rata-rata sebesar 80,41% : 74,64%.
CITATION STYLE
Septiana Rizky, P., Haiban Hirzi, R., & Hidayaturrohman, U. (2022). Perbandingan Metode LightGBM dan XGBoost dalam Menangani Data dengan Kelas Tidak Seimbang. J Statistika: Jurnal Ilmiah Teori Dan Aplikasi Statistika, 15(2), 228–236. https://doi.org/10.36456/jstat.vol15.no2.a5548
Mendeley helps you to discover research relevant for your work.