Deteksi Komentar Spam Judi Online Berbahasa Indonesia Menggunakan XGBoost dan TF-IDF

  • Arrayyan D
  • Guntara R
  • Nugraha M
N/ACitations
Citations of this article
27Readers
Mendeley users who have this article in their library.

Abstract

Fenomena judi online terus menunjukkan perkembangan dengan tren yang semakin mengkhawatirkan. Salah satu tantangan yang dihadapi adalah maraknya komentar promosi judi pada platform YouTube akibat belum optimalnya kinerja sistem pendeteksi spam dalam mengenali pola bahasa yang manipulatif. Untuk mengatasi hal tersebut, penelitian ini mengusulkan model deteksi komentar spam berbahasa Indonesia menggunakan kombinasi Term Frequency–Inverse Document Frequency (TF-IDF) dan Extreme Gradient Boosting (XGBoost). Dataset berisi 10.220 komentar YouTube yang dilabeli secara manual dan diproses melalui tahapan preprocessing, termasuk normalisasi unicode dan pembersihan karakter non-relevan. Model dievaluasi menggunakan 20% data uji dan menghasilkan accuracy 91%, precision 92%, recall 91%, serta F1-score 91%. Hasil tersebut menunjukkan bahwa kombinasi TF-IDF dan XGBoost efektif untuk mengklasifikasikan teks pendek pada komentar YouTube. Dengan demikian, penelitian ini memberikan kontribusi terhadap pengembangan model deteksi komentar spam berbahasa Indonesia yang masih jarang diteliti, sekaligus dapat menjadi acuan bagi platform media dalam meningkatkan efektivitas penghentian penyebaran konten ilegal melalui kolom komentar media sosial.

Cite

CITATION STYLE

APA

Arrayyan, D. R., Guntara, R. G., & Nugraha, M. R. (2025). Deteksi Komentar Spam Judi Online Berbahasa Indonesia Menggunakan XGBoost dan TF-IDF. Jurnal Algoritma, 22(2). https://doi.org/10.33364/algoritma/v.22-2.3012

Register to see more suggestions

Mendeley helps you to discover research relevant for your work.

Already have an account?

Save time finding and organizing research with Mendeley

Sign up for free