Abstract
Publikasi ilmiah dapat mengandung lebih dari satu topik atau kategori bidang penelitian. Identifikasi topik atau bidang penelitian dapat dilihat hanya dari membaca judul publikasi ilmiah tersebut. Namun, judul publikasi ilmiah tidak dapat digunakan untuk menentukan kemiripannya dengan kategori bidang penelitian tertentu karena judul publikasi ilmiah belum tentu dapat mencerminkan bidang penelitiannya. Hal ini membuat pencarian judul publikasi ilmiah yang dilakukan oleh penulis jurnal menjadi kurang efektif. Kemiripan publikasi ilmiah dengan kategori bidang penelitiannya dapat ditentukan menggunakan Vector Space Model. Permasalahan pertama yang terjadi adalah skema pembobotan TFIDF pada Vector Space Model tidak dapat diimplementasikan pada penelitian ini. Penyebabnya adalah skema tersebut belum dapat mewakili kategori bidang penelitian. Selain itu, matriks pembobotan TFIDF juga memerlukan penyesuaian kolom untuk memproses dataset yang berjumlah besar. Permasalahan kedua yaitu pengukuran kemiripan dokumen antara query dengan panjang vektor dokumen. Panjang vektor dokumen pada penelitian sebelumnya diperoleh dari jumlah kata yang ada pada suatu dokumen. Sedangkan pada penelitian ini dibutuhkan pengukuran kemiripan dokumen yang berupa judul publikasi ilmiah dengan kategori bidangnya. Oleh karena itu, penelitian ini bertujuan untuk mengembangkan Vector Space Model dalam mengukur kemiripan judul publikasi ilmiah dengan kategori bidang penelitiannya. Penelitian ini menghasilkan nila rata-rata recall sebesar 89,7 % dan presisi sebesar 90%. Keyword : Vector Space Model,Pembobotan TFIDF, Publikasi Ilmiah
Cite
CITATION STYLE
Hersianie, S. B. (2022). Pengembangan Vector Space Model Pada Pengukuran Kemiripan Publikasi Ilmiah. Technologia : Jurnal Ilmiah, 13(2), 121. https://doi.org/10.31602/tji.v13i2.6471
Register to see more suggestions
Mendeley helps you to discover research relevant for your work.