Modifikasi Fonem Vokal Pada Stemming Kata Tidak Baku
Penulis
Ahmad Fikri Iskandar, Ema Utami, Wahyu Hidayat, Agung Prasetio Budi, Anggit Dwi Hartanto Download PDFAbstrak
Bahasa Indonesia termasuk bahasa yang paling populer digunakan di dunia. Bahasa Indonesia dapat berupa bahasa baku dan tidak baku. Bahasa tidak baku dapat dikarenakan oleh penyerapan dari bahasa asing atau bahasa daerah. Penyerapan ini dapat terjadi perganti huruf vokal. Kontribusi pada penelitian ini adalah melakukan modifikasi fonem pada huruf vokal untuk mengembalikan kata tidak baku ke dalam bentuk kata dasar yang baku disebut sebagai Modified Vocal Phonemes Non Formal. Percobaan dilakukan dengan 60 kata tidak baku yang sudah dilakukan preprocessing pada penelitian sebelumnya terlebih dahulu. Penelitian ini membandingkan hasil algoritma dengan algoritma pada penelitian sebelumnya. Algoritma Modified Vocal Phonemes Non Formal telah berhasil melakukan stemming dengan presisi 90.00% dengan 54 kata tidak baku yang sukses dikonversi ke kata dasar sesuai dengan Kamus Besar Bahasa Indonesia (KBBI) dan 6 kata masih belum berhasil dikonversi.
Abstract
Indonesian is one of the most popular languages spoken in the world. Indonesian can be standard and non-standard language. Non-standard language can be caused by absorption of foreign languages or village languages. This absorption can occur as a substitute for vowels. The contribution to this research is to modify the phonemes of vowels to return non-formal words into formal root forms known as Modified Vocal Phonemes in Non-Formal. The experiment was carried out with 60 non-formal words that have been preprocessed in the previous research. This research will compare the results of the algorithm with the algorithm in previous research. Algorithm Modified Vocal Phenomes Non-Formal has succeeded in performing stemming with 90.0% precision with 54 words that were successfully converted to base words according to the Big Indonesian Dictionary and 6 words were still not converted.
Teks Lengkap:
PDFReferensi
ADRIANI, M., ASIAN, J., NAZIEF, B., TAHAGHOGHI, S. M., & WILLIAMS, H. E. 2007. Stemming Indonesian: A confix-stripping approach. ACM Transactions on Asian Language Information Processing (TALIP), 6(4), 1-33.
HEINZ, H. C. M. G. H. R. 2013. Persepsi Masyarakat Terhadap Perawatan Ortodontik Yang Dilakukan Oleh Pihak Non Profesional, 53(9), 1689–1699.
IRIANANDA, S. W., MUSLIM, M. A., & DACHLAN, H. S. 2017. Similarity Based on Class-Based Indexing. 9(1).
ISKANDAR, A. F., UTAMI, E., & PRASETIO, A. B. 2020. Word Analysis of Indonesian Keirsey Temperament. 14(4), 365–376.
NEGARA, A. B. P., MUHARDI, H., & PUTRI, I. M. 2020. Analisis Sentimen Maskapai Penerbangan Menggunakan Metode Naive Bayes dan Seleksi Fitur Information Gain. Jurnal Teknologi Informasi Dan Ilmu Komputer, 7(3), 599. https://doi.org/10.25126/jtiik.2020711947
NURHAPITUDIN, I. 2017. Penggunaan Kosa Kata Bahasa Daerah Dalam Komunikasi Berbahasa Indonesia Sebagai Bahasa Tuturan. Jurnal Al-Tsaqafa, 14, 265–274.
PRASETYO, A. R., INDRIANTI, & ADIKARA, P. P. 2018. Klasifikasi Hoax Pada Berita Kesehatan Berbahasa Indonesia Dengan Menggunakan Metode Modified K-Nearest Neighbor. Jurnal Pengembangan Teknologi Informasi Dan Ilmu Komputer (J-PTIIK) Universitas Brawijaya, 2(12), 7466–7473.
PRASETYOWATI, R. 2020. Kesalahan Pengucapan Diftong dan Vokal U pada Pidato Gubernur Jawa Tengah Ganjar Pranowo Dalam Rangka HUT Ke-74 Republik Indonesia. https://doi.org/10.31219/osf.io/g3f68
PUTRA, R. B. S., & UTAMI, E. 2018. Non-formal affixed word stemming in Indonesian language. 2018 International Conference on Information and Communications Technology, ICOIACT 2018, 2018-Janua, 531–536.
https://doi.org/10.1109/ICOIACT.2018.8350735
PUTRA, R. B. S., UTAMI, E., & RAHARJO, S. 2019. Accuracy measurement on Indonesian non-formal affixed word stemming with levenhstein. 2019 International Conference on Information and Communications Technology, ICOIACT 2019, 486–490. https://doi.org/10.1109/ICOIACT46704.2019.8938423
PUTRADI, A. W. A. 2016. Pola-Pola Perubahan Fonem Vokal Dan Konsonan Dalam Penyerapan Kata-Kata Bahasa Asing Ke Dalam Bahasa Indonesia: Kajian Fonologi. Jurnal Arbitrer, 3(2), 95. https://doi.org/10.25077/ar.3.2.95-112.2016
QULUB, M., UTAMI, E., & SUNYOTO, A. 2020. Stemming Kata Berimbuhan Tidak Baku Bahasa Indonesia Menggunakan Algoritma Jaro-Winkler Distance. Creative Information Technology Journal, 5(4), 254. https://doi.org/10.24076/citec.2018v5i4.218
SETIAWAN, R., KURNIAWAN, A., BUDIHARTO, W., KARTOWISASTRO, I. H., & PRABOWO, H. 2016. Flexible affix classification for stemming Indonesian Language. 2016 13th International Conference on Electrical Engineering/Electronics, Computer, Telecommunications and Information Technology, ECTI-CON 2016. doi.org/10.1109/ECTICon.2016.7561257
UTAMI, E., HARTANTO, A. D., ADI, S., OYONG, I., & RAHARJO, S. 2019. Profiling analysis of DISC personality traits based on Twitter posts in Bahasa Indonesia. Journal of King Saud University - Computer and Information Sciences, doi.org/10.1016/j.jksuci.2019.10.008
UTOMO, F. S., SURYANA, N., & AZMI, M. S. 2020. Stemming impact analysis on Indonesian Quran translation and their exegesis classification for ontology instances. IIUM Engineering Journal, 21(1), 33–50. https://doi.org/10.31436/iiumej.v21i1.1170
VOCKET. 2020. 10 bahasa yang paling banyak digunakan di Internet. TheVocket.Com, 2020. https://www.thevocket.com/10-bahasa-paling-banyak-internet/, akses 6 Juli 2021 jam 10.22.
WINARTI, T., INDRIYAWATI, H., VYDIA, V., & CHRISTANTO, F. W. 2021. Performance comparison between naive bayes and k-nearest neighbor algorithm for the classification of indonesian language articles. IAES International Journal of Artificial Intelligence, 10(2), 452–457. doi.org/10.11591/IJAI.V10. I2.PP452-457
ZEN, E. L. 2011. Afiks Tidak Baku Dalam Bahasa Indonesia Ragam Informal. LiNGUA: Jurnal Ilmu Bahasa Dan Sastra, 6(1). https://doi.org/10.18860/ling.v6i1.1300
DOI: http://dx.doi.org/10.25126/jtiik.20231015028