Abstract
Dalam penelitian ini, kami akan melaporkan penelitian kami pada segmentasi teks pada dokumen pidato bahasa Indonesia. Sebagai hasil dari penggunaan Automatic Speech Recognition (ASR), dokumen pidato ditranskripsi menjadi teks tanpa batas untuk setiap dokumen. Dokumen-dokumen tersebut tentunya perlu disegmentasi sesuai dengan topiknya. Kami menerapkan metode TextTiling dengan berbagai teknik pembobotan istilah seperti TF-IDF, TF-IDF-Mutual Information, TF-IDF Mutual Information-Word Similarity, dan TF-IDF-Word Frequency untuk mengukur kemiripan antar segmen. Hasilnya menunjukkan TF-IDF-Mutual Information berkinerja lebih baik di sebagian besar koleksi.
Cite
CITATION STYLE
Magdalena, C., & Tambun, B. H. (2022). SEGMENTASI DOKUMEN TEKS DENGAN METODE TEXTTILING. JURNAL ILMIAH INFORMATIKA, 10(01), 8–14. https://doi.org/10.33884/jif.v10i01.4509
Register to see more suggestions
Mendeley helps you to discover research relevant for your work.