Abstract
Syntax Jurnal Informatika merupakan salah satu sistem informasi yang berisikan sekumpulan artikel ilmiah yang dikelola oleh Program Studi Teknik Informatika, Universitas Singaperbangsa Karawang. Saat ini Syntax Jurnal Informatika tidak memiliki fitur untuk kategorisasi artikel ilmiah berdasarkan fokus dan ruang lingkupnya. Penelitian ini dilakukan untuk mengklasifikasi artikel ilmiah ke dalam kategori sesuai dengan fokus dan ruang lingkup yang terdapat pada laman Syntax Jurnal Informatika secara otomatis dengan memanfaatkan proses text mining. Text mining merupakan proses yang bertujuan untuk mendapatkan informasi penting dari teks. Metodologi penelitian yang digunakan adalah Knowledge Discovery Database (KDD) dengan tahapan data selection, preprocessing, transformation, modeling dan evaluation. Penelitian ini akan membandingkan klasifikasi berdasarkan judul pada artikel. Adapun algoritma yang digunakan adalah Support Vector Machine (SVM) dengan menggunakan empat kernel SVM, diantaranya adalah kernel linear, kernel polynomial, kernel sigmoid dan kernel RBF. Pembagian data menggunakan traintestsplit dibagi menjadi empat skenario yaitu 60:40, 70:30, 80:30 dan 90:10. Hasil penelitian setelah dilakukan pengujian terhadap model diukur dengan nilai Accuracy, Precision, Recall dan F-measure. Hasil terbaik adalah accuracy sebesar 70%, precision sebesar 75%, recall sebesar 69% dan f-measure sebesar 71% pada skenario perbandingan 90:10 dan kernel linear.
Cite
CITATION STYLE
Arifin, N., Enri, U., & Sulistiyowati, N. (2021). Penerapan Algoritma Support Vector Machine (SVM) dengan TF-IDF N-Gram untuk Text Classification. STRING (Satuan Tulisan Riset Dan Inovasi Teknologi), 6(2), 129. https://doi.org/10.30998/string.v6i2.10133
Register to see more suggestions
Mendeley helps you to discover research relevant for your work.