Klasifikasi Intensi dengan Metode Ling Short-Term Memory pada Chatbot Bahasa Indonesia

Penulis

  • Faiz Aulia Al Farisi Universitas Brawijaya, Malang
  • Rizal Setya Perdana Universitas Brawijaya, Malang
  • Putra Pandu Adikara Universitas Brawijaya, Malang

DOI:

https://doi.org/10.25126/jtiik.1078000

Kata Kunci:

LSTM, embedding, augmentasi data, BERT, klasifikasi intensi

Abstrak

E-government merupakan sebuah konsep pemerintahan yang menyelenggarakan layanan publik secara digital yang didukung oleh teknologi informasi, sehingga menjadi lebih prima. Salah satu bentuk layanan publik digital yang umum ada di berbagai sektor adalah helpdesk. Helpdesk memungkinkan pengguna dapat bertanya atau melaporkan sesuatu untuk kemudian dijawab oleh staf. Permasalahan yang ada adalah ketersediaan staf yang hanya dapat menjawab pada jam kerja, sedangkan pengguna bisa jadi menemukan permasalahan yang urgent di luar jam kerja. Oleh karena itu, solusi yang ditawarkan adalah penerapan chatbot, sehingga dapat melayani kapan pun, sekaligus meringankan kerja dari staf. Penelitian ini mencoba untuk merancang salah satu komponen pada chatbot, yaitu model klasifikasi intensi, dengan metode Long Short-Term Memory. Data yang digunakan merupakan 501 teks riwayat pertanyaan dari database Helpdesk TIK UB yang termasuk ke dalam 7 kelas intensi yang ditentukan. Data akan melalui beberapa tahap prapemrosesan sebelum kemudian dilakukan pemodelan dan beberapa pengujian. Tahap pengujian meliputi pemilihan embedding yang digunakan, pemilihan teknik augmentasi data, dan penyetelan hyperparameter. Hasil dari keseluruhan pengujian, didapatkan model terbaik yang mampu menghasilkan akurasi sempurna untuk data latih dan data uji, serta loss 0,004 untuk data latih dan 0,044 untuk data uji.

 

Abstract

 

E-government is a government concept that organizes digital public services supported by information technology, so that they become more excellent. One form of digital public service that is common in various sectors is the helpdesk. Helpdesk allows users to ask questions or report something to be answered by staff. The problem that exists is the availability of staff who can only answer during working hours, while users may find urgent problems outside of working hours. Therefore, the solution offered is the implementation of a chatbot, so that it can serve at any time, while easing the work of staff. This study attempts to design one of the components of the chatbot, namely the intention classification model, using the Long Short-Term Memory method. The data used are 501 question history texts from the Helpdesk TIK UB database which fall into the 7 specified intensity classes. The data will go through several pre-processing stages before then being modeled and tested. The testing phase includes selecting the embedding used, data augmentation techniques selection, and hyperparameter tuning. The best model is obtained which can produce perfect accuracy for training data and test data, as well as a loss of 0.004 for training data and 0.044 for test data.

Downloads

Download data is not yet available.

Referensi

BHARTIYA, N., JANGID, N., JANNU, S., SHUKLA, P., & CHAPANERI, R. 2019Artificial Neural Network Based University Chatbot System. 2019 IEEE Bombay Section Signature Conference (IBSSC), 1–6. https://doi.org/10.1109/IBSSC47189.2019.8973095

BILAH, C. O., ADJI, T. B., & SETIAWAN, N. A. 2022. Intent Detection on Indonesian Text Using Convolutional Neural Network. 2022 IEEE International Conference on Cybernetics and Computational Intelligence (CyberneticsCom), 174–178. https://doi.org/10.1109/CyberneticsCom55287.2022.9865291

DENNY PRABOWO, Y., WARNARS, H. L. H. S., BUDIHARTO, W., KISTIJANTORO, A. I., HERYADI, Y., & LUKAS. 2018. Lstm And Simple Rnn Comparison In The Problem Of Sequence To Sequence On Conversation Data Using Bahasa Indonesia. 2018 Indonesian Association for Pattern Recognition International Conference (INAPR), 51–56. https://doi.org/10.1109/INAPR.2018.8627029

DEVLIN, J., CHANG, M.-W., LEE, K., & TOUTANOVA, K. 2018. BERT: Pre-training of Deep Bidirectional Transformers for Language Understanding.

DI GENNARO, G., BUONANNO, A., DI GIROLAMO, A., OSPEDALE, A., & PALMIERI, F. A. N. 2021. Intent Classification in Question-Answering Using LSTM Architectures. In Progresses in Artificial Intelligence and Neural Systems (pp. 115–124). https://doi.org/10.1007/978-981-15-5093-5_11

FAUZIA, L., HADIPRAKOSO, R. B., & GIRINOTO. 2021. Implementation of Chatbot on University Website Using RASA Framework. 2021 4th International Seminar on Research of Information Technology and Intelligent Systems (ISRITI), 373–378. https://doi.org/10.1109/ISRITI54043.2021.9702821

GALITSKY, B. 2019. Chatbot Components and Architectures. In Developing Enterprise Chatbots (pp. 13–51). Springer International Publishing. https://doi.org/10.1007/978-3-030-04299-8_2

GUNTORO, G., COSTANER, L., & LISNAWITA, L. 2020. Aplikasi Chatbot untuk Layanan Informasi dan Akademik Kampus Berbasis Artificial Intelligence Markup Language (AIML). Digital Zone: Jurnal Teknologi Informasi Dan Komunikasi, 11(2), 291–300. https://doi.org/10.31849/digitalzone.v11i2.5049

HELPDESK TIK. (2023, February 22). Helpdesk TIK. Https://Helpdesk-Tik.Ub.Ac.Id/.

RACHMATULLAH, N., & PURWANI, F. 2022. Analisis Pentingnya Digitalisasi & Infrastruktur Teknologi Informasi Dalam Institusi Pemerintahan : E-Government. JURNAL FASILKOM, 12(1), 14–19. https://doi.org/10.37859/jf.v12i1.3512

SETYAWAN, M. Y. H., AWANGGA, R. M., & EFENDI, S. R. 2018. Comparison Of Multinomial Naive Bayes Algorithm And Logistic Regression For Intent Classification In Chatbot. 2018 International Conference on Applied Engineering (ICAE), 1–5. https://doi.org/10.1109/INCAE.2018.8579372

Diterbitkan

29-12-2023

Cara Mengutip

Klasifikasi Intensi dengan Metode Ling Short-Term Memory pada Chatbot Bahasa Indonesia. (2023). Jurnal Teknologi Informasi Dan Ilmu Komputer, 10(7), 1511-1518. https://doi.org/10.25126/jtiik.1078000