Preprocessing Data dan Klasifikasi untuk Prediksi Kinerja Akademik Siswa

Penulis

  • Takhamo Gori Universitas Amikom Yogyakarta

DOI:

https://doi.org/10.25126/jtiik.20241118074

Kata Kunci:

Prediksi, Correlation-Based Feature Selection, Naïve Buyes, Kinerja Akademik Siswa

Abstrak

Pendidikan merupakan aspek penting dalam kehidupan masyarakat dan memiliki peran yang sangat vital untuk menciptakan sumber daya manusia yang handal dan berkualitas dalam menghadapi berbagai tantangan pada era modernisasi. Namun, putus sekolah dan retensi siswa menjadi tantangan serius bagi perkembangan pendidikan saat ini. Salah satu faktor pemicu putus sekolah adalah kinerja akademik siswa yang rendah, mendorong perlunya tindakan pencegahan yang efektif untuk mengurangi tingkat kegagalan pendidikan. Penelitian ini bertujuan untuk memprediksi kinerja akademik siswa dengan mengintegrasikan metode Correlation-Based Feature Selection (CFS) dan Algoritma Naïve Nayes pada gabungan dataset pelajaran Matematika dan Bahasa Portugis dua sekolah menengah di Portugal. Proses preprocessing data melibatkan integrasi data, pelabelan data, transformasi data, dan pembersihan data diterapkan pada tahap awal penelitian. Hasil penelitian menunjukkan bahwa atribut signifikan yang mempengaruhi kinerja akademik siswa meliputi G2, G1, Higher, Medu, Studytime, goout, Absences, dan Failures. Melalui pemodelan algoritma Naïve Bayes, metode CFS terbukti meningkatkan nilai accuracy, recall, precision, dan f1-score dalam memprediksi kinerja akademik siswa. Sebelum CFS, model Naïve Bayes menunjukkan accuracy sebesar 89.27%, dengan recall, precision, danf1-score masing-masing sebesar 89.27%, 89.86%, dan 89.47%. Setelah implementasi CFS, evaluasi model prediksi mengalami peningkatan signifikan menjadi 91.22%, 91.22%, 92.24%, dan 91.48%.

Downloads

Download data is not yet available.

Referensi

ADANE, M. D., DEKU, J. K., & ASARE, E. K., 2023. Performance Analysis of Machine Learning Algorithms in Prediction of Student Academic Performance. Journal of Advances in Mathematics and Computer Science, 38(5), 74–86. doi:10.9734/jamcs/2023/v38i51762.

ADI, S., PRISTYANTO, Y., & SUNYOTO, A., 2019. The best features selection method and relevance variable for web phishing classification. 2019 International Conference on Information and Communications Technology, ICOIACT 2019. https://doi.org/10.1109/ICOIACT46704.2019.8938566.

AGUSRIANDI, ELIHAMI, SYARIF, I., & SAMAD, I. S., 2022. Model Analisis Aktivitas Tutor Dalam Learning Management System Berdasarkan Data Log Menggunakan K-Means dan Deteksi Outlier. Jurnal Teknologi Informasi dan Ilmu Komputer (JTIIK), 9(4), 709–716. doi: 10.25126/jtiik.202294764.

ALOMARI, E. S., NUIAA, R. R., ALYASSERI, Z. A., MOHAMMED, H. J., SANI, N. S., ESA, M. I., & MUSAWI, B. A., 2023. Malware detection using Deep Learning and correlation-based feature selection. Symmetry, 15(1), 123. doi:10.3390/sym15010123.

ANWAR, S., SEPTIAN, F., & SEPTIANA, R. D., 2019. Klasifikasi Anomali intrusion detection system (IDS) Menggunakan algoritma naïve Bayes classifier Dan Correlation-based feature selection. Jurnal Teknologi Sistem Informasi dan Aplikasi, 2(4), 135. doi:10.32493/jtsi.v2i4.3453.

AZIZAH, R. A., BACHTIAR, F. A., & ADINUGROHO, S., 2022. Klasifikasi Kinerja Akademik Siswa Menggunakan Neighbor Weighted K-Nearest Neighbor Dengan Seleksi Fitur Information Gain. Jurnal Teknologi Informasi dan Ilmu Komputer (JTIIK), 9, 605–614. doi:10.25126/jtiik.202295751.

AZMI, B. N., HERMAWAN, A., & AVIANTO, D., 2023. Analisis Pengaruh komposisi data training dan data testing Pada penggunaan PCA Dan Algoritma decision tree untuk KLASIFIKASI Penderita Penyakit liver. JTIM: Jurnal Teknologi Informasi dan Multimedia, 4(4), 281–290. doi:10.35746/jtim.v4i4.298.

FAHRUDY, D., & ‘UYUN, S., 2022. Classification of Student Graduation by Naïve Bayes Method by Comparing between Random Oversampling and Feature Selections of Information Gain and Forward Selection. International Journal on Informatics Visualization, 6(4). https://doi.org/10.30630/joiv.6.4.982.

FENG, G., FAN, M., & CHEN, Y., 2022. Analysis and Prediction of Students’ Academic Performance Based on Educational Data Mining. IEEE Access, 10. https://doi.org/10.1109/ACCESS.2022.3151652.

GUSNINA, M., WIHARTO, & SALAMAH, U., 2022. Student Performance Prediction in Sebelas Maret University Based on the Random Forest Algorithm. Ingenierie Des Systemes d’Information, 27(3). https://doi.org/10.18280/isi.270317

HALL, M.A., 1999. Correlation-Based Feature Selection for Machine Learning. PhD Thesis, University of Waikato, Hamilton.

ISMANTO, E., GHANI, H. A., SALEH, N. I. M., AL AMIEN, J., & GUNAWAN, R., 2022. Recent systematic review on student performance prediction using backpropagation algorithms. Telkomnika (Telecommunication Computing Electronics and Control), 20(3). https://doi.org/10.12928/TELKOMNIKA.v20i3.21963.

KHARIS, S.A. & ZILI, A.H., 2022. Learning Analytics Dan Educational Data Mining Pada Data Pendidikan. Jurnal Riset Pembelajaran Matematika Sekolah, 6(1), pp. 12–20. doi:10.21009/jrpms.061.02.

KUMAR, M., CHETAN, S., SHAMNEESH, S., NIDHI, & NAZRUL, I., 2022. Analysis of Feature Selection and Data Mining Techniques to Predict Student Academic Performance. International Conference on Decision Aid Sciences and Applications (DASA). doi:10.1109/dasa54658.2022.9765236.

KURNIAWAN, Y. I., CAHYONO, T., NOFIYATI, MARYANTO, E., FADLI, A., & INDRASWARI, N. R. (2020). Preprocessing Using Correlation Based Features Selection on Naive Bayes Classification. IOP Conference Series: Materials Science and Engineering, 982(1), doi:10.1088/1757-899x/982/1/012012.

KUSUMA, D. P., 2020, Machine Learning: Teori, Program, dan Studi Kasus, Deepublish, Yogyakarta.

MUSILIU, B., 2020. Comparison of Feature Selection Techniques for Predicting Student’s Academic Performance. In International Journal of Research and Scientific Innovation (IJRSI): Vol. VII.

MUSU W., IBRAHIM A., & HERIADI, 2021. Pengaruh Komposisi Data Training dan Testing terhadap Akurasi Algoritma C4.5. in Seminar Sistem Informasi dan Teknologi Informasi (SISITI), 2021, pp. 186–195.

PRASETYO, V. R., MERCIFIA, M., AVERINA, A., SUNYOTO, L., & BUDIARJO, 2022. Prediksi Rating Film Pada Website IMDB Menggunakan Metode Neural Network. NERO, 7. doi: http://dx.doi.org/10.21107/nero.v7i1.268.

PUTRA, M. Y., & PUTRI, D. I., 2022. Pemanfaatan Algoritma Naïve Bayes dan K-Nearest Neighbor Untuk Klasifikasi Jurusan Siswa Kelas XI. Tekno Kompak, 16(2), 176–187.

RISKA, A., PURNAWANSYAH, DARWIS, H., & ASTUTI, W., 2023. Studi Perbandingan Kombinasi GMI, HSV, KNN, dan CNN Pada Klasifikasi Daun Herbal. Indonesian Journal of Computer Science, 12(3). doi:10.33022/ijcs.v12i3.3210.

SAIFUDIN, A., EKAWATI, YULIANTI, & DESYANI, T., 2020. Forward Selection Technique to Choose the Best Features in Prediction of Student Academic Performance Based on Naïve Bayes. Journal of Physics: Conference Series, 1477(2). https://doi.org/10.1088/1742-6596/1477/3/032007.

SAPUTRA, H. D., ISMET, F., & ANDRIZAL, A., 2018. Pengaruh Motivasi Terhadap Hasil Belajar Siswa SMK. INVOTEK: Jurnal Inovasi Vokasional Dan Teknologi, 18(1). https://doi.org/10.24036/invotek.v18i1.168.

SUDAIS M., SAFWAN M., KHALID A. M., AHMED S., 2022, Students’ Academic Performance Prediction Model Using Machine Learning, PREPRINT (Version 1) available at Research Square, https://doi.org/10.21203/rs.3.rs-1296035/v1

TJANDRA, E., KUSUMAWARDANI, S. S., & FERDIANA, R., 2022. Student performance prediction in higher education: A comprehensive review. AIP Conference Proceedings, 2470. https://doi.org/10.1063/5.0080187.

ÜNAL, F., 2021. Data Mining for Student Performance Prediction in Education. In Data Mining - Methods, Applications and Systems. https://doi.org/10.5772/intechopen.91449.

YUDANA, F.R., SUYANTO, M. & NASIRI, A., 2023. Model Klasifikasi Untuk Menentukan Kesiapan Kerja Mahasiswa Dan Kelulusan Tepat Waktu Dengan Metode Machine Learning. IJITECH: Indonesian Journal of Information Technology, 1(1), pp. 1–22.

YULI MARDI., 2019. Data Mining : Klasifikasi Menggunakan Algoritma C4.5. Jurnal Edik Informatika, 2(2).

YUSOF, R., HASHIM, N., ABDUL RAHMAN, N., MOHD YUNUS, S. Y., & AZIZ FADZILLAH, N. A., 2022. Academic Performance Prediction Model Using Classification Algorithms: Exploring the Potential Factors. International Journal of Academic Research in Progressive Education and Development, 11(3). https://doi.org/10.6007/ijarped/v11-i3/14753.

ZHANG, Y., YUN, Y., AN, R., CUI, J., DAI, H., & SHANG, X., 2021. Educational Data Mining Techniques for Student Performance Prediction: Method Review and Comparison Analysis. Frontiers in Psychology, 12. doi:10.3389/fpsyg.2021.698490.

ZULFIQAR, H., HUANG, Q.-L., LV, H., SUN, Z.-J., DAO, F.-Y., & LIN, H., 2022. Deep-4mCGP: A Deep Learning Approach to Predict 4MC Sites in Geobacter Pickeringii by Using Correlation-Based Feature Selection Technique. International Journal of Molecular Sciences, 23(3), 1251. doi:10.3390/ijms23031251.

Unduhan

Diterbitkan

29-02-2024

Terbitan

Bagian

Ilmu Komputer

Cara Mengutip

Preprocessing Data dan Klasifikasi untuk Prediksi Kinerja Akademik Siswa. (2024). Jurnal Teknologi Informasi Dan Ilmu Komputer, 11(1), 215-224. https://doi.org/10.25126/jtiik.20241118074