Prediksi Jeda dalam Ucapan Kalimat Bahasa Melayu Pontianak Menggunakan Hidden Markov Model Berbasis Part of Speech
DOI:
https://doi.org/10.25126/jtiik.2020742166Abstrak
Informasi jeda adalah salah satu faktor pendukung dari ucapan berkualitas yang dihasilkan oleh sistem Text to Speech. Penelitian ini bertujuan untuk memprediksi jeda pada ucapan kalimat bahasa Melayu Pontianak berbasis part of speech dengan menggunakan tools Hidden Markov Model (HMM). HMM akan menghitung nilai probabilitas dari setiap kemungkinan yang ada. Penelitian ini menggunakan data berupa file rekaman ucapan penutur yang membacakan 500 kalimat berbahasa Melayu Pontianak. Hasil yang didapatkan dari sistem ini yaitu teks kalimat bahasa Melayu Pontianak beserta prediksi jedanya. Indeks jeda dikategorikan menjadi 5 kategori yaitu indeks jeda “0” menandakan tidak ada jeda, “1” menandakan jeda singkat, “2” menandakan jeda panjang, “,” menandakan tanda baca koma, dan “.” menandakan akhir kalimat. Hasil prediksi kemudian diuji menggunakan pengujian akurasi kecocokan jeda ucapan dalam satu kalimat penuh dan pengujian precision, recall dan f-measure. Frasa jeda ucapan yang diuji yaitu frasa jeda 1+2 dan frasa jeda 2. Pengujian dilakukan dengan membandingkan hasil model bigram dan trigram. Berdasarkan pengujian yang telah dilakukan, model trigram lebih baik dalam menghasilkan prediksi jeda ucapan pada kalimat bahasa Melayu Pontianak.
Abstract
Pause information is one of the supporting factors of quality speech produced by the Text to Speech system. Previously there had been research to predict pauses in Pontianak Malay language using other methods, but it still did not get good results. This study aims to predict pauses in Pontianak Malay language sentences using the Hidden Markov Model (HMM) tools based on part of speech. HMM will calculate the probability value of each possibility. This research uses recording file of speeches from speakers who read 500 Pontianak Malay sentences and a new PoS set developed from several existing PoS sets. The results are Pontianak Malay language sentence along with the pause prediction. The pause indices are categorized into 5 categories, the pause index "0" indicates that there is no pause, "1" indicates a short pause, "2" indicates a long pause, "," indicates the comma punctuation, and "." indicates the end of the sentence. The prediction results are then tested using a speech pause match accuracy test in one full sentence and testing of precision, recall and f-measure. The speech pause phrases that are tested are the pause phrase 1+2 and the pause phrase 2. The test is done by comparing the results of the bigram and trigram models. Based on the tests that have been done, the trigram model is better at producing predictions of speech pauses in Pontianak Malay language sentences.
Downloads
Referensi
ADRIANI, M. 2009. Developing Postag for Bahasa Indonesia. Jakarta: PAN Localization Project.
CHRISTIANTI M, V., J. Pragantha dan Victor. 2016. Part-of-Speech Tagging untuk Bahasa Indonesia Menggunakan Stanford POS-Tagging. Jakarta: Universitas Tarumanegara.
DO, Q. T., et al. 2015. Improving Translation of Emphasis with Pause Prediction in Speech-to-speech Translation Systems. Japan: Nagoya University.
KAMILUDIN, M. I. 2017. Prediksi Jeda pada Ucapan Bahasa Melayu Pontianak dengan Menggunakan Metode Shallow Parsing. Pontianak: Universitas Tanjungpura.
LI, J. F., et al. 2004. Chinese Prosody Phrase Break Prediction Based on Maximum Entropy Model. China: University of Science and Technology of China.
MANURUNG, R. 2016. Tutorial: Pengenalan terhadap POS tagging dan Probabilistic Parsing. Workshop Nasional INACL.
NA'IM, A. dan Syahputra, H. 2011. Hasil Sensus Penduduk 2010: Kewarganegaraan, Suku Bangsa, Agama dan Bahasa Sehari-Hari Penduduk Indonesia, Jakarta: Badan Pusat Statistik.
NUGRAHA, A. T. 2014. Prediksi Jeda dalam Ucapan Kalimat Bahasa Indonesia dengan Hidden Markov Model. Pontianak: Universitas Tanjungpura.
PRASETYO, M. E. B. 2010. Teori Dasar Hidden Markov Model. Institut Teknologi Bandung, Bandung.
SARKAR, P. dan Rao, K. S. 2015. Data-Driven Pause Prediction for Speech Synthesis in Storytelling Style Speech. India: Indian Institute od Technology Kharagpur.
SETYANINGSIH, E. 2017. Part of Speech Tagger untuk Bahasa Indonesia dengan Menggunakan Modifikasi Brill. Surabaya: Sekolah Tinggi Teknik Surabaya.
WIBISONO, Y. 2008. Penggunaan Hidden Markov Model untuk Kompresi Kalimat. Bandung: Institut Teknologi Bandung.
WICAKSONO, A. F. dan Purwarianti, A. 2010. HMM Based Part-of-Speech Tagger for Bahasa Indonesia. Proceedings of 4th International MALINDO (Malay and Indonesian Language) Workshop.
YU, J. dan Tao, J. 2005. The Pause Duration Prediction for Mandarin Text-to-Speech System. China: Chinese Academi of Science.
ZHANG, Y. 2004. Prediction of Financial Time Series with Hidden Markov Models. Canada: Simon Fraser University.
Unduhan
Diterbitkan
Terbitan
Bagian
Lisensi
Artikel ini berlisensi Creative Common Attribution-ShareAlike 4.0 International (CC BY-SA 4.0)
Penulis yang menerbitkan di jurnal ini menyetujui ketentuan berikut:
- Penulis menyimpan hak cipta dan memberikan jurnal hak penerbitan pertama naskah secara simultan dengan lisensi di bawah Creative Common Attribution-ShareAlike 4.0 International (CC BY-SA 4.0) yang mengizinkan orang lain untuk berbagi pekerjaan dengan sebuah pernyataan kepenulisan pekerjaan dan penerbitan awal di jurnal ini.
- Penulis bisa memasukkan ke dalam penyusunan kontraktual tambahan terpisah untuk distribusi non ekslusif versi kaya terbitan jurnal (contoh: mempostingnya ke repositori institusional atau menerbitkannya dalam sebuah buku), dengan pengakuan penerbitan awalnya di jurnal ini.
- Penulis diizinkan dan didorong untuk mem-posting karya mereka online (contoh: di repositori institusional atau di website mereka) sebelum dan selama proses penyerahan, karena dapat mengarahkan ke pertukaran produktif, seperti halnya sitiran yang lebih awal dan lebih hebat dari karya yang diterbitkan. (Lihat Efek Akses Terbuka).