Abstrak Penderita diabetesmelitus mengalami gangguan pada sistem metabolisme yang disebabkan oleh pankreas yang tidak memproduksi insulin atau penggunakan insulin dalam metabolisme belum efektif semakin banyak. Kepedulian akan hidup sehat menurun drastis, sehingga lonjakan kematian penyakit tersebut tinggi. Banyak orang belum memahami gejala dini yang muncul sehingga sulit untuk sembuh. Hal ini dikarenakan belum adanya prediksi dini penderita penyakit tersebut. Dalam kajian ini menjelaskan pengaruh analisis komponen utama (PCA) untuk menemukan fitur optimal dalam klasifikasi prediksi dini diabetes melitus pada naïve bayers dan k-nearest neighbor ditambah aplikasi rapidminer yang bersifat terbuka bisa digunakan sebagai alat uji keakuratan data. Bahan penelitian yang digunakan bersumber dari Dataset Prediksi Risiko Diabetes Tahap Awal Learning Repository dari website Kaggle yaitu diabet_data_upload.csv. Jumlah record yang digunakan adalah 520 baris data dan 17 nama tabel untuk setiap baris data yang ada. Tujuan penggunaan kedua metode pengelompokan adalah untuk menunjukkan akurasi paling akurat dari data yang diolah. Hasil penelitian memberikan kajian bahwa formula k-nearest-neighbor dengan principal component analysis dapat bekerja lebih baik dibandingkan dengan k-nearest-neighbor saja. Performansi k-nearest neighbor dengan principal component analysis (PCA) lebih baik dengan nilai akurasi sebesar 93.27%, sedangkan akurasi tanpa analisis komponen utama dalam hal ini hanya menggunakan algoritma k-nearest-neighbor hanya sebesar 90.70. Hasil ini diperoleh dengan mempertimbangkan record yang ada dan nilai k = 5, kemudian diperoleh hasil bahwa algoritma k-nearest neighbor menggunakan metode principal component analysis (PCA) untuk mengklasifikasikan diagnosis diabetes didapatkan tinggi. Hasil nilai yang tepat. Abstract Patients with diabetes mellitus experience disturbances in the metabolic system caused by the pancreas not producing insulin or using insulin in metabolism that is not effective more and more. Concern for healthy living has decreased drastically, so the spike in deaths from this disease is high. Many people do not understand the early symptoms that appear, making it difficult to recover. This is because there is no early prediction of sufferers of the disease. This study explains the effect of principal component analysis (PCA) to find optimal features in the classification of early prediction of diabetes mellitus in naïve Bayers and k-nearest neighbors plus the open rapidminer application that can be used as a test tool for data accuracy. The research material used comes from the Learning Repository Early Stage Diabetes Risk Prediction Dataset from the Kaggle website, namely diabet_data_upload.csv. The number of records used is 520 rows of data and 17 table names for each existing row of data. The purpose of using the two grouping methods is to show the most accurate accuracy of the processed data. The results of the study provide a study that the k-nearest-neighbor formula with principal component analysis can work better than just k-nearest-neighbor. The performance of k-nearest neighbor with principal component analysis (PCA) is better with an accuracy value of 93.27%, while the accuracy without principal component analysis in this case only 2 uses the k-nearest-neighbor algorithm is only 90.70. These results are obtained by considering the existing records and the value of k = 5, then the result is that the k-nearest neighbor algorithm uses the principal component analysis (PCA) method to classify diabetes diagnoses as high. Exact value result..
CITATION STYLE
Rokhanah, S., Hermawan, A., & Avianto, D. (2023). Pengaruh Principal Component Analysis Pada Naïve Bayes dan K-Nearest Neighbor Untuk Prediksi Dini Diabetes Melitus Menggunakan Rapidminer. EVOLUSI : Jurnal Sains Dan Manajemen, 11(1). https://doi.org/10.31294/evolusi.v11i1.14728
Mendeley helps you to discover research relevant for your work.