Machine learning atau pembelajaran mesin dikategorikan sebagai salah satu cabang dari artificial intelligence atau kecerdasan buatan dan algoritma yang populer diantaranya adalah melakukan prediksi dengan menggunakan regresi linear. Penelitian yang dilakukan mengimplementasikan prediksi biaya asuransi kesehatan yang dipengaruhi berbagai faktor seperti umur, jenis kelamin, bmi (kategori berat badan), banyak anak, apakah seorang perokok dan wilayah. Prediksi yang dilakukan adalah di awal diantaranya seorang perokok dan orang yang mempunyai berat badan tidak ideal akan membayar biaya asuransi yang lebih besar jika dibandingkan dengan orang yang tidak merokok dan orang mempunyai berat badan ideal. Data diolah dari www.kaggle.com, data disimpan dalam file csv (insurance.csv). Dataset terdiri dari 1338 dan 7 kolom. Metode penelitian dilakukan dengan memeriksa data dari data yang salah atau dapat mengganggu proses analisis, melakukan analisis pada dataset serta membagi data menjadi data training dan data test. Proses pembagian data adalah 80% digunakan untuk data training dan 20% untuk data test. Semua proses diolah dengan menggunakan pemrograman Python. Library Python yang digunakan numpy, pandas, matplotlib, seaborn, sklearn. Proses analisis dikerjakan dengan Jupyter Notebook. Hasil penelitian menghasilkan model regresi linear ganda y = -12436.85+ 270.35 X1 -188.37 X2+342.77 X3+474.07 X4+24320.10 X5 -385.60 X6 dengan Coefficient of determination 0.7244150380582826 dan MSE 34608265.193358265. Hasil akhir analisis dilakukan perbandingan antara y aktual dengan y prediksi baik dalam bentuk tabel maupun grafik.
CITATION STYLE
Sholeh, M., Suraya, S., & Andayati, D. (2022). Machine Linear untuk Analisis Regresi Linier Biaya Asuransi Kesehatan dengan Menggunakan Python Jupyter Notebook. Jurnal Edukasi Dan Penelitian Informatika (JEPIN), 8(1), 20. https://doi.org/10.26418/jp.v8i1.48822
Mendeley helps you to discover research relevant for your work.