OCR merupakan sebuah sistem yang digunakan untuk mengekstraksi tulisan yang terdapat pada sebuah gambar sehingga dapat mempercepat proses input data. Sistem OCR merupakan sebuah sistem yang terdiri dari 2 proses yaitu pendeteksian teks dan pengenalan teks. Pada perancangan ini, digunakan 2 model CNN untuk melakukan pendeteksian dan pengenalan teks. Digunakan CNN dengan struktur Feature Pyramid Network yang menggunakan Backbone VGG19 untuk mendeteksi lokasi teks pada gambar. Untuk mengenali teks pada gambar akan digunakan CNN dengan LSTM untuk melakukan pengenalan teks pada area gambar yang telah terdeteksi. Kedua CNN dilatih ddengan menggunakan dataset ICDAR 2015, COCO-Text, dan ICDAR 2019. Pada akhir pelatihan, didapatkan model pendeteksian teks dengan besaran F1-Score sebesar 49.18%, dan model pengenalan teks dengan besar Correctly Recognized Word sebesar 55.80%
CITATION STYLE
Wijaya, I., & Lubis, C. (2022). PENGIMPLEMENTASIAN OCR MENGGUNAKAN CNN UNTUK EKSTRAKSI TEKS PADA GAMBAR. Jurnal Ilmu Komputer Dan Sistem Informasi, 10(1). https://doi.org/10.24912/jiksi.v10i1.17836
Mendeley helps you to discover research relevant for your work.