Abstract
Hepatitis C Virus (HCV) is a virus which capable of infecting RNA that can lead to changes in the DNA sequence. This change of DNA arrangement is called genetic mutation. Every mutation occurs in HCV, it will be called a new subtype. Over time, HCV subtypes increase, and will continue to grow as the HCV mutation cycle progresses faster. Therefore, a way to find a mutation in millions of sequences in the gene bank is needed. This study tested six types of Support Vector Machine (SVM) methods to determine the best SVM kernel performance in the application of HCV DNA sequence detection in isolated DNA. The tested SVM kernel was linear, quadratic, cubic, fine Gaussian, median Gaussian, and coarse Gaussian. The data set is 1000 isolated DNA consisting of 500 isolated Homo Sapiens and 500 isolated HCV. Firstly, the data set will go through the pattern search process using the Edit Levenshtein Distance method, then the result of the processing will be the variable x in SVM. The target or variable y on SVM is the positive or negative value of the isolated against HCV. The results show that among the six types of SVM methods being tested, the method of fine Gaussian SVM has the lowest performance of 77.4%. The SVM method is tested by performing optimizations on the determination of the hyperplane. The test results proved that the SVM method is able to analyze the presence of HCV mutations in isolated DNA with an accuracy of 99.8%. Intisari-Hepatitis C Virus (HCV) adalah virus yang mampu menginfeksi RNA sehingga dapat mengakibatkan perubahan susunan DNA. Perubahan susunan DNA inilah yang disebut dengan mutasi genetik. Setiap terjadi mutasi pada HCV, akan disebut dengan subtipe baru. Semakin lama, subtipe HCV semakin banyak, dan akan terus bertambah seiring dengan semakin cepatnya siklus mutasi HCV. Oleh karena itu, dibutuhkan sebuah cara yang dapat menemukan adanya mutasi pada jutaan sequence di dalam bank gen. Makalah ini menguji coba enam jenis metode Support Vector Machine (SVM) untuk mengetahui kinerja terbaik kernel SVM dalam penerapan deteksi sequence DNA HCV di dalam isolated DNA. Kernel SVM yang diuji yaitu linear, quadratic, cubic, fine Gaussian, median Gaussian, dan coarse Gaussian. Data set yang digunakan adalah 1000 isolated DNA yang terdiri atas 500 isolated Homo Sapiens dan 500 isolated HCV. Data set tersebut akan melalui proses pencarian pola terlebih dahulu menggunakan metode Edit Levenshtein Distance, kemudian hasil dari pengolahan tersebut akan menjadi variabel x pada SVM. Target atau variabel y pada SVM adalah nilai positif atau negatifnya isolated DNA tersebut terhadap HCV. Hasil penelitian menunjukkan bahwa dari keenam jenis metode SVM yang diujikan, metode fine Gaussian SVM memiliki kinerja paling rendah, yaitu sebesar 77.4%. Metode SVM diuji coba dengan melakukan optimasi pada penentuan hyperplane-nya. Hasil uji coba membuktikan bahwa metode SVM mampu menganalisis adanya mutasi HCV pada isolated DNA dengan menghasilkan akurasi sebesar 99,8%. Kata Kunci-SVM, Mesin Pembelajaran, sequence DNA, Semantic Similarity.
Cite
CITATION STYLE
Al Kindhi, B., Sardjono, T. A., & Purnomo, M. H. (2018). Optimasi Support Vector Machine untuk Memprediksi Adanya Mutasi pada DNA Hepatitis C Virus. Jurnal Nasional Teknik Elektro Dan Teknologi Informasi (JNTETI), 7(3). https://doi.org/10.22146/jnteti.v7i3.441
Register to see more suggestions
Mendeley helps you to discover research relevant for your work.