Tantangan meningkatnya kebutuhan akan air bersih di tengah ketersediaan yang terbatas mendorong penelitian ini. Pencemaran air, terutama oleh limbah rumah tangga, menyebabkan penurunan kualitas air dan kelangkaan sumber air bersih. Dampak buruknya terhadap kesehatan masyarakat, terutama diare, menunjukkan urgensi identifikasi dini kualitas air yang tidak layak konsumsi. Oleh karena itu, penelitian ini menerapkan algoritma Random Forest untuk klasifikasi kualitas air dan prediksi kelayakan air minum. Penggunaan teknik data mining, khususnya Random Forest, diharapkan dapat mengidentifikasi pola kompleks dalam data dan faktor-faktor yang mempengaruhi kualitas air. Menggunakan dataset Water Quality dari Kaggle, hasil penelitian menunjukkan akurasi sebesar 69%. Analisis Feature Importance Score memperlihatkan kontribusi relatif fitur terhadap prediksi. Kurva ROC menggambarkan optimalitas klasifikasi, sementara Confusion Matrix memberikan gambaran kinerja model. Confusion Matrix yang merinci hasil klasifikasi model Random Forest Classifier. Diagonal utama menunjukkan jumlah instance yang benar-benar diprediksi dengan benar untuk kategori "Potabel" dan "Tidak Potabel", masing-masing 370 dan 84. Namun, terdapat 160 instance yang salah diklasifikasikan sebagai "Potabel" dan 42 sebagai "Tidak Potabel".
Mendeley helps you to discover research relevant for your work.
CITATION STYLE
Abdi, K., Warjaya, A., Muthmainnah, I., & Pahutar, P. H. (2024). Penerapan Algoritma Random Forest dalam Prediksi Kelayakan Air Minum. Jurnal Ilmu Komputer Dan Informatika, 3(2), 81–88. https://doi.org/10.54082/jiki.81