Dataset Suara dan Teks Berbahasa Indonesia Pada Rekaman Podcast dan Talk show

Martin Novela; undefined T. Basaruddin

Journal ArticleOPEN ACCESS

Dataset Suara dan Teks Berbahasa Indonesia Pada Rekaman Podcast dan Talk show

Novela M
T. Basaruddin

JURNAL FASILKOM (2021) 11(2) 61-66

DOI: 10.37859/jf.v11i2.2628

N/ACitations

42Readers

Abstract

Salah satu faktor keberhasilan suatu model pembelajaran dalam machine learning atau deep learning adalah dataset yang digunakan. Pada tulisan ini menyajikan dataset suara dari rekaman podcast dan talk show beserta transkripsi berbahasa Indonesia. Dataset ini disajikan karena belum adanya ketersediaan dataset berbahasa Indonesia yang dapat diakses secara publik untuk digunakan pada pembelajaran model Text-to-Speech ataupun Audio Speech Recognition. Dataset terdiri dari 3270 rekaman yang diproses untuk mendapatkan transkripsi berupa teks atau kalimat berbahasa Indonesia. Dalam pembuatan dataset ini dilakukan beberapa tahapan seperti pra-pemrosesan, tahapan translasi, tahapan validasi pertama dan tahapan validasi kedua. Dataset dibuat dengan format yang mengikuti format dari dataset LJSpeech untuk memudahkan pemrosesan dataset ketika digunakan dalam suatu model sebagai input. Dataset ini diharapkan dapat membantu meningkatkan kualitas pembelajaran untuk pemrosesan Text-to-Speech seperti pada model Tacotron2 ataupun pada pemrosesan Audio Speech Recognition untuk bahasa Indonesia.

Cite

CITATION STYLE

APA

Novela, M., & T. Basaruddin. (2021). Dataset Suara dan Teks Berbahasa Indonesia Pada Rekaman Podcast dan Talk show. JURNAL FASILKOM, 11(2), 61–66. https://doi.org/10.37859/jf.v11i2.2628

Dataset Suara dan Teks Berbahasa Indonesia Pada Rekaman Podcast dan Talk show

Abstract

Cite

Register to see more suggestions