Analisa Penggunaan K-Gram pada Karakter, Kata dan Kalimat untuk Mendeteksi Kesamaan Dokumen

Ida Widaningrum; Dyah Mustikasari; Rizal Arifin; Erika Dyah Cahyani

Journal ArticleOPEN ACCESS

Analisa Penggunaan K-Gram pada Karakter, Kata dan Kalimat untuk Mendeteksi Kesamaan Dokumen

Widaningrum I
Mustikasari D
Arifin R
et al.

Prosiding Seminar Nasional Teknoka (2020) 5 59-64

DOI: 10.22236/teknoka.v5i.333

N/ACitations

7Readers

Abstract

Pemanfaatan teknologi digital menjadi sebuah kebutuhan saat ini, salah satu komponennya berupa dokumen. Pendeteksian kesamaan bisa menggunakan berbagi macam cara, diantaranya adalah metode fingerprinting. Fingerprint memiliki prinsip kerja menggunakan teknik hashing dan K-gram. Penelitian ini difokuskan pada model deteksi menggunakan K-gram dengan menggunakan algoritma winnowing dan python sebagai bahasa pemrograman. Pengujian parsing k-gram menggunakan 5 buah k yaitu k=2 k=3 k=4 k=5 k=6. Hasilnya, parsing karakter mendapatkan presentase lebih besar dari presentase manual karakter. Presentase parsing kata, memiliki presentase yang paling mendekati dari presentase manual. Sedangkan pada kalimat, presentasenya paling rendah dari presentase manual

Cite

CITATION STYLE

APA

Widaningrum, I., Mustikasari, D., Arifin, R., & Dyah Cahyani, E. (2020). Analisa Penggunaan K-Gram pada Karakter, Kata dan Kalimat untuk Mendeteksi Kesamaan Dokumen. Prosiding Seminar Nasional Teknoka, 5, 59–64. https://doi.org/10.22236/teknoka.v5i.333

Analisa Penggunaan K-Gram pada Karakter, Kata dan Kalimat untuk Mendeteksi Kesamaan Dokumen

Abstract

Cite

Register to see more suggestions