Klasifikasi Intensi dengan Metode Ling Short-Term Memory pada Chatbot Bahasa Indonesia
DOI:
https://doi.org/10.25126/jtiik.1078000Kata Kunci:
LSTM, embedding, augmentasi data, BERT, klasifikasi intensiAbstrak
E-government merupakan sebuah konsep pemerintahan yang menyelenggarakan layanan publik secara digital yang didukung oleh teknologi informasi, sehingga menjadi lebih prima. Salah satu bentuk layanan publik digital yang umum ada di berbagai sektor adalah helpdesk. Helpdesk memungkinkan pengguna dapat bertanya atau melaporkan sesuatu untuk kemudian dijawab oleh staf. Permasalahan yang ada adalah ketersediaan staf yang hanya dapat menjawab pada jam kerja, sedangkan pengguna bisa jadi menemukan permasalahan yang urgent di luar jam kerja. Oleh karena itu, solusi yang ditawarkan adalah penerapan chatbot, sehingga dapat melayani kapan pun, sekaligus meringankan kerja dari staf. Penelitian ini mencoba untuk merancang salah satu komponen pada chatbot, yaitu model klasifikasi intensi, dengan metode Long Short-Term Memory. Data yang digunakan merupakan 501 teks riwayat pertanyaan dari database Helpdesk TIK UB yang termasuk ke dalam 7 kelas intensi yang ditentukan. Data akan melalui beberapa tahap prapemrosesan sebelum kemudian dilakukan pemodelan dan beberapa pengujian. Tahap pengujian meliputi pemilihan embedding yang digunakan, pemilihan teknik augmentasi data, dan penyetelan hyperparameter. Hasil dari keseluruhan pengujian, didapatkan model terbaik yang mampu menghasilkan akurasi sempurna untuk data latih dan data uji, serta loss 0,004 untuk data latih dan 0,044 untuk data uji.
Abstract
E-government is a government concept that organizes digital public services supported by information technology, so that they become more excellent. One form of digital public service that is common in various sectors is the helpdesk. Helpdesk allows users to ask questions or report something to be answered by staff. The problem that exists is the availability of staff who can only answer during working hours, while users may find urgent problems outside of working hours. Therefore, the solution offered is the implementation of a chatbot, so that it can serve at any time, while easing the work of staff. This study attempts to design one of the components of the chatbot, namely the intention classification model, using the Long Short-Term Memory method. The data used are 501 question history texts from the Helpdesk TIK UB database which fall into the 7 specified intensity classes. The data will go through several pre-processing stages before then being modeled and tested. The testing phase includes selecting the embedding used, data augmentation techniques selection, and hyperparameter tuning. The best model is obtained which can produce perfect accuracy for training data and test data, as well as a loss of 0.004 for training data and 0.044 for test data.
Downloads
Referensi
BHARTIYA, N., JANGID, N., JANNU, S., SHUKLA, P., & CHAPANERI, R. 2019Artificial Neural Network Based University Chatbot System. 2019 IEEE Bombay Section Signature Conference (IBSSC), 1–6. https://doi.org/10.1109/IBSSC47189.2019.8973095
BILAH, C. O., ADJI, T. B., & SETIAWAN, N. A. 2022. Intent Detection on Indonesian Text Using Convolutional Neural Network. 2022 IEEE International Conference on Cybernetics and Computational Intelligence (CyberneticsCom), 174–178. https://doi.org/10.1109/CyberneticsCom55287.2022.9865291
DENNY PRABOWO, Y., WARNARS, H. L. H. S., BUDIHARTO, W., KISTIJANTORO, A. I., HERYADI, Y., & LUKAS. 2018. Lstm And Simple Rnn Comparison In The Problem Of Sequence To Sequence On Conversation Data Using Bahasa Indonesia. 2018 Indonesian Association for Pattern Recognition International Conference (INAPR), 51–56. https://doi.org/10.1109/INAPR.2018.8627029
DEVLIN, J., CHANG, M.-W., LEE, K., & TOUTANOVA, K. 2018. BERT: Pre-training of Deep Bidirectional Transformers for Language Understanding.
DI GENNARO, G., BUONANNO, A., DI GIROLAMO, A., OSPEDALE, A., & PALMIERI, F. A. N. 2021. Intent Classification in Question-Answering Using LSTM Architectures. In Progresses in Artificial Intelligence and Neural Systems (pp. 115–124). https://doi.org/10.1007/978-981-15-5093-5_11
FAUZIA, L., HADIPRAKOSO, R. B., & GIRINOTO. 2021. Implementation of Chatbot on University Website Using RASA Framework. 2021 4th International Seminar on Research of Information Technology and Intelligent Systems (ISRITI), 373–378. https://doi.org/10.1109/ISRITI54043.2021.9702821
GALITSKY, B. 2019. Chatbot Components and Architectures. In Developing Enterprise Chatbots (pp. 13–51). Springer International Publishing. https://doi.org/10.1007/978-3-030-04299-8_2
GUNTORO, G., COSTANER, L., & LISNAWITA, L. 2020. Aplikasi Chatbot untuk Layanan Informasi dan Akademik Kampus Berbasis Artificial Intelligence Markup Language (AIML). Digital Zone: Jurnal Teknologi Informasi Dan Komunikasi, 11(2), 291–300. https://doi.org/10.31849/digitalzone.v11i2.5049
HELPDESK TIK. (2023, February 22). Helpdesk TIK. Https://Helpdesk-Tik.Ub.Ac.Id/.
RACHMATULLAH, N., & PURWANI, F. 2022. Analisis Pentingnya Digitalisasi & Infrastruktur Teknologi Informasi Dalam Institusi Pemerintahan : E-Government. JURNAL FASILKOM, 12(1), 14–19. https://doi.org/10.37859/jf.v12i1.3512
SETYAWAN, M. Y. H., AWANGGA, R. M., & EFENDI, S. R. 2018. Comparison Of Multinomial Naive Bayes Algorithm And Logistic Regression For Intent Classification In Chatbot. 2018 International Conference on Applied Engineering (ICAE), 1–5. https://doi.org/10.1109/INCAE.2018.8579372
Unduhan
Diterbitkan
Terbitan
Bagian
Lisensi
Hak Cipta (c) 2024 Jurnal Teknologi Informasi dan Ilmu Komputer
Artikel ini berlisensiCreative Commons Attribution-ShareAlike 4.0 International License.
Artikel ini berlisensi Creative Common Attribution-ShareAlike 4.0 International (CC BY-SA 4.0)
Penulis yang menerbitkan di jurnal ini menyetujui ketentuan berikut:
- Penulis menyimpan hak cipta dan memberikan jurnal hak penerbitan pertama naskah secara simultan dengan lisensi di bawah Creative Common Attribution-ShareAlike 4.0 International (CC BY-SA 4.0) yang mengizinkan orang lain untuk berbagi pekerjaan dengan sebuah pernyataan kepenulisan pekerjaan dan penerbitan awal di jurnal ini.
- Penulis bisa memasukkan ke dalam penyusunan kontraktual tambahan terpisah untuk distribusi non ekslusif versi kaya terbitan jurnal (contoh: mempostingnya ke repositori institusional atau menerbitkannya dalam sebuah buku), dengan pengakuan penerbitan awalnya di jurnal ini.
- Penulis diizinkan dan didorong untuk mem-posting karya mereka online (contoh: di repositori institusional atau di website mereka) sebelum dan selama proses penyerahan, karena dapat mengarahkan ke pertukaran produktif, seperti halnya sitiran yang lebih awal dan lebih hebat dari karya yang diterbitkan. (Lihat Efek Akses Terbuka).