SEGMENTASI DOKUMEN TEKS DENGAN METODE TEXTTILING

  • Magdalena C
  • Tambun B
N/ACitations
Citations of this article
12Readers
Mendeley users who have this article in their library.

Abstract

Dalam penelitian ini, kami akan melaporkan penelitian kami pada segmentasi teks pada dokumen pidato bahasa Indonesia. Sebagai hasil dari penggunaan Automatic Speech Recognition (ASR), dokumen pidato ditranskripsi menjadi teks tanpa batas untuk setiap dokumen. Dokumen-dokumen tersebut tentunya perlu disegmentasi sesuai dengan topiknya. Kami menerapkan metode TextTiling dengan berbagai teknik pembobotan istilah seperti TF-IDF, TF-IDF-Mutual Information, TF-IDF Mutual Information-Word Similarity, dan TF-IDF-Word Frequency untuk mengukur kemiripan antar segmen. Hasilnya menunjukkan TF-IDF-Mutual Information berkinerja lebih baik di sebagian besar koleksi.

Cite

CITATION STYLE

APA

Magdalena, C., & Tambun, B. H. (2022). SEGMENTASI DOKUMEN TEKS DENGAN METODE TEXTTILING. JURNAL ILMIAH INFORMATIKA, 10(01), 8–14. https://doi.org/10.33884/jif.v10i01.4509

Register to see more suggestions

Mendeley helps you to discover research relevant for your work.

Already have an account?

Save time finding and organizing research with Mendeley

Sign up for free