Automated Essay Scoring Menggunakan Semantic Textual Similarity Berbasis Transformer Untuk Penilaian Ujian Esai

Kharisma Ayu Pradani; Lya Hulliyyatus Suadaa

doi:10.25126/jtiik.2023107338

Penulis

Kharisma Ayu Pradani Politeknik Statistika STIS, Jakarta Timur
Lya Hulliyyatus Suadaa Politeknik Statistika STIS, Jakarta Timur

DOI:

https://doi.org/10.25126/jtiik.2023107338

Abstrak

Ujian berbasis esai seringkali digunakan untuk menguji pemahaman siswa dalam menyelesaikan permasalahan. Tak terkecuali dalam pelaksanaan ujian di Politeknik Statistika STIS. Dalam melakukan penilaian pada jawaban tipe ini, dibutuhkan waktu serta tenaga yang besar, dan sering kali menimbulkan ketidakkonsistenan dalam penilaian. Hal ini dapat terjadi salah satunya karena perbedaan cara penilaian yang dilakukan oleh orang yang berbeda. Oleh karena itu diperlukan penyelesaian yang bisa mengefektifkan waktu, tenaga serta menjaga kekonsistenan aspek penilaian, diantaranya yaitu dengan automated essay scoring (AES). AES merupakan suatu model yang dilatih untuk menilai suatu esai secara otomatis berdasarkan kemiripan jawaban dengan kunci jawaban. Pada penelitian ini, metode yang diusulkan untuk menghitung kemiripan semantik teks berbahasa Indonesia antara jawaban esai dan kunci jawabannya yaitu model berbasis Transformers IndoBERT. Sebagai baseline, digunakan teknik ekstraksi fitur Term Frequency - Inverse Document Frequency (TF-IDF) dan penghitungan kemiripan fitur menggunakan cosine similarity dan linear regression. Selanjutnya nilai kemiripan tersebut dikonversi ke rentang nilai yang diinginkan sebagai prediksi nilai dari setiap esai. Berdasarkan hasil evaluasi, diperoleh bahwa model fine-tuned IndoBERT merupakan model terbaik dengan nilai MAE dan RMSE sebesar 0.1285 dan 0.2001.

Abstract

Essay-based exams are often used to test students’ understanding of solving problems. However, assessing this type of answer takes a lot of time and effort and often results in inconsistencies. One of the reasons is the different ways between people while doing the assessment. Therefore, a solution is needed to streamline time, effort, and maintain consistency in aspects of assessment, including automated essay scoring (AES). AES is a model trained to assess an essay automatically based on the similarity of answers with the answer key. In this study, the method proposed to calculate the semantic similarity of Indonesian text between essay answers and answer keys is a model based on the Transformer BERT. As a baseline, the Term Frequency – Inverse Document Frequency (TF-IDF) feature extraction technique is used and calculating feature similarity using cosine similarity and linear regression. Then the similarity value is converted to the desired range of values as the predicted value of each essay. Based on the evaluation results, it was found that the fine-tuned IndoBERT model was the best model, with MAE and RMSE values of 0.1285 and 0.2001.

Downloads

Download data is not yet available.

Referensi

AHMAD, R., WARDI, dan DEWIANI, 2018. E-learning Automated Essay Scoring System Menggunakan Metode Searching Text Similarity Matching Text. Jurnal KPE, 22(1).

ARIFIN, A.R., PURNAMASARI, P.D., dan RATNA, A.A.P., 2021. Automatic Essay Scoring for Indonesian Short Answers using Siamese Manhattan Long Short-Term Memory. Proc. of the 3rd International Conference on Electrical, Communications and Computer Engineering (ICECCE).

BESEISO, M., dan ALZAHRANI, S., 2020. An Empirical Analysis of BERT Embedding for Automated Essay Scoring. International Journal of Advanced Computer Science and Applications, 11(10), p.204-210.

BRYAN, W., KARISSA, V., GENTA, I.W., SAMUEL, C., XIAOHONG, L., ZHI, Y.L., SIDIK, S. et al, 2020. IndoNLU: Benchmark and resources for evaluating Indonesian natural language understanding. arXiv preprint arXiv:2009.05387.

DEVLIN, J., CHANG, M.W., LEE, K., dan TOUTANOVA, K., 2018. BERT: Pre-training of deep bidirectional transformers for language understanding. arXiv preprint arXiv:1810.04805.

HACKELING, G., 2017. Mastering Machine Learning with scikit-learn. Packt Publishing Ltd.

KURNIAWATI, F.E., dan PRADNYA, W.M., 2020. Implementasi Algoritma Winnowing Pada Sistem Penilaian Otomatis Jawaban Esai Pada Ujian Online Berbasis Web. Jurnal Khatulistiwa Informatika, 6(2), pp.169-175.

LAHITANI, A.R., 2022. Automated Essay Scoring Menggunakan Cosine Similarity pada Penilaian Esai Multi Soal. Jurnal Kajian Ilmiah, 22(2), p.107-118.

MAHANA, M., JOHNS, M., dan APTE, A.,2012 Automated Essay Grading Using Machine Learning. CS229 Machine Learning - Autumn 2012 Stanford University.

MUSLICHA, C.C., PUTRI, P.C., SYADINAH, S., 2017. Tes Essay. Universitas Mulawarman.

PUTRI, H., SUSIANI, D., WANDANI, N.S., dan PUTRI, F.A., 2022. Instrumen Penilaian Hasil Pembelajaran Kognitif pada Tes Uraian dan Tes Objektif. Jurnal Papeda: Jurnal Publikasi Pendidikan Dasar, 4(2), p.139-148.

RAJAGEDE, R.A., 2021. Improving automatic essay scoring for Indonesian language using simpler model and richer feature. Kinetik: Game Technology, Information System, Computer Network, Computing, Electronics, and Control, p.11-18.

RODRIGUEZ, P.U., JAFARI, A., dan ORMEROD, C.M., 2019. Language model and automated essay scoring. arXiv preprint arXiv:1909.09482.

SAPUTRA, N., ADJI, T.B., dan PERMANASARI, A.E., 2015. Analisis sentimen data presiden Jokowi dengan preprocessing normalisasi dan stemming menggunakan metode naive bayes dan SVM. Jurnal Dinamika Informatika, 5(1).

Automated Essay Scoring Menggunakan Semantic Textual Similarity Berbasis Transformer Untuk Penilaian Ujian Esai

Penulis

DOI:

Abstrak

Downloads

Referensi

Unduhan

Diterbitkan

Terbitan

Bagian

Lisensi

Cara Mengutip

Kirim Naskah

side menu

sertifikat akreditasi

pengindeks

Mendeley

Citations & Reference Manager

pengunjung

Keywords

Information

Supported by

Technical Support

Laboratorium

Direktori UB