Diabetes menjadi salah satu penyakit yang mematikan. Penyakit ini masuk dalam sepuluh besar penyebab kematian secara global. Pada tahun 2045, pasien diabetes akan meningkat sebanyak 12,2%, dengan jumlah penderita penyakit diabetes sebesar 642,7 juta. Selain itu, penderita penyakit diabetes di Indonesia akan menempati ranking kelima di dunia. Oleh karena itu, masyarakat perlu waspada terhadap penyakit ini. Dari data diabetes yang ada, dapat diklasifikasikan menggunakan data mining. Metode yang digunakan yaitu Random Forest dan Support Vector Machine. Data yang digunakan pada penelitian ini merupakan data sekunder dari Kaggle, yang berasal dari Rumah Sakit Sylhet Bangladesh, dengan jumlah data sebesar 520 dan 17 variabel, dimana 1 variabel merupakan label. Data dibagi dengan tiga kondisi, yaitu 80%:20%, 75%:25%, dan 70%:30%. Data diseimbangkan menggunakan Synthetic Minority Oversampling (SMOTE). Dari hasil penelitian didapatkan bahwa algoritma Random Forest dengan split data 80%:20% mendapatkan hasil terbaik dengan akurasi yang didapatkan sebesar 0,98, presisi sebesar 0,96, recall sebesar 1, specificity sebesar 0,95, dan F1-score sebesar 0,98. Tiga variabel yang paling berpengaruh dalam klasifikasi penyakit diabetes ini secara berturut turut adalah polyuria, polydipsia, dan jenis kelamin.
CITATION STYLE
Ghozali, A., Pratiwi, H., & Handajani, S. S. (2023). Implementasi Data Mining Menggunakan Metode Random Forest Dan Support Vector Machine Dalam Klasifikasi Penyakit Diabetes. Delta: Jurnal Ilmiah Pendidikan Matematika, 11(2), 147. https://doi.org/10.31941/delta.v11i2.2686
Mendeley helps you to discover research relevant for your work.