Abstrak: Dalam beberapa tahun belakangan, perangkat lunak open source semakin bertumbuh. Tidak hanya perangkat lunak dalam bentuk final, namun komponen dan library perangkat lunak semakin berkembang setiap tahunnya. Github merupakan salah satu lokasi populer dalam mempublikasikan project open source. Ketersediaan dataset yang besar ini merupakan peluang bagi peneliti di bidang perangkat lunak development dalam mengembangkan risetnya. Perkembangan variasi artefak perangkat lunak membuat metode yang bersifat supervised menjadi sulit. Penilitian ini mencoba untuk melakukan pengelompokkan secara unsupervised dengan teknik clustering K-Means dan representasi paragraph vector. Langkah ini merupakan awalan dalam pembentukan model klasifikasi yang membutuhkan supervisi dalam pelabelan dokumennya. Hasil clustering menunjukkan dokumen dapat dapat di kelompokkan menjadi beberapa cluster dan hasil yang terbaik dilihat pada cluster dengan k berjumlah 6. Kata Kunci: document clustering, doc2vec, k-means clustering, artefak perangkat lunak. Abstract: In recent years, open source software is growing. Not only is software in its final form, but components and software libraries are growing every year. Github is one of the popular locations for publishing open source projects. The availability of this large dataset is an opportunity for researchers in the field of software development in developing their research. The development of variations in software artifacts makes supervised methods difficult. This research tries to do unsupervised grouping with K-Means clustering technique and paragraph vector representation. This step is a start in the formation of a classification model that requires supervision in labeling documents. Clustering results show documents can be grouped into clusters and the best results are seen in clusters with k equal 6.
CITATION STYLE
Herwanto, G. B. (2019). Pengelompokan Artefak Dokumen Perangkat Lunak Open Source Dengan Vektor Paragraf. Pseudocode, 6(2), 181–185. https://doi.org/10.33369/pseudocode.6.2.181-185
Mendeley helps you to discover research relevant for your work.