Abstract
Fenomena judi online terus menunjukkan perkembangan dengan tren yang semakin mengkhawatirkan. Salah satu tantangan yang dihadapi adalah maraknya komentar promosi judi pada platform YouTube akibat belum optimalnya kinerja sistem pendeteksi spam dalam mengenali pola bahasa yang manipulatif. Untuk mengatasi hal tersebut, penelitian ini mengusulkan model deteksi komentar spam berbahasa Indonesia menggunakan kombinasi Term Frequency–Inverse Document Frequency (TF-IDF) dan Extreme Gradient Boosting (XGBoost). Dataset berisi 10.220 komentar YouTube yang dilabeli secara manual dan diproses melalui tahapan preprocessing, termasuk normalisasi unicode dan pembersihan karakter non-relevan. Model dievaluasi menggunakan 20% data uji dan menghasilkan accuracy 91%, precision 92%, recall 91%, serta F1-score 91%. Hasil tersebut menunjukkan bahwa kombinasi TF-IDF dan XGBoost efektif untuk mengklasifikasikan teks pendek pada komentar YouTube. Dengan demikian, penelitian ini memberikan kontribusi terhadap pengembangan model deteksi komentar spam berbahasa Indonesia yang masih jarang diteliti, sekaligus dapat menjadi acuan bagi platform media dalam meningkatkan efektivitas penghentian penyebaran konten ilegal melalui kolom komentar media sosial.
Cite
CITATION STYLE
Arrayyan, D. R., Guntara, R. G., & Nugraha, M. R. (2025). Deteksi Komentar Spam Judi Online Berbahasa Indonesia Menggunakan XGBoost dan TF-IDF. Jurnal Algoritma, 22(2). https://doi.org/10.33364/algoritma/v.22-2.3012
Register to see more suggestions
Mendeley helps you to discover research relevant for your work.