Klasifikasi Kinerja Akademik Siswa Menggunakan Neighbor Weighted K-Nearest Neighbor dengan Seleksi Fitur Information Gain
DOI:
https://doi.org/10.25126/jtiik.2022935751Abstrak
Kinerja akademik siswa merupakan indikator kesuksesan dari pembelajaran di sekolah. Mengukur kinerja akademik siswa dapat membantu tenaga didik mengembangkan pembelajaran yang sesuai untuk siswa sehingga meningkatkan keberhasilan pembelajaran sekolah. Kinerja akademik siswa dapat diamati melalui suatu Learning Management System bernama Kalboard 360 yaitu sistem yang berhubungan dengan perilaku siswa menggunakan alat pelacak aktivitas siswa yang memantau aktivitas pembelajaran. Data sekunder dari aktivitas tersebut dapat digunakan untuk mengetahui kinerja siswa dengan salah satu caranya adalah klasifikasi. Klasifikasi menggunakan metode Neighbor Weighted K-Nearest Neighbor dengan seleksi fitur Information Gain diterapkan pada penelitian ini untuk membantu klasifikasi kinerja siswa karena metode NWKNN mempunyai kelebihan memperhitungkan metode pembobotan kelas dan mengatasi data tidak seimbang. Seleksi fitur dengan Information Gain digunakan agar dapat mengoptimalkan hasil kerja classifier. Berdasarkan pengujian dan analisis penelitian, didapatkan nilai akurasi terbaik sebesar 0,604, dengan nilai precision adalah 0,719, nilai recall sebesar 0,676, dan nilai f-measure diperoleh adalah 0,661. Nilai tersebut dihasilkan saat menggunakan 9 fitur yaitu VisitedResource, StudentAbsenceDay, RaisedHands, AnnouncementsView, Relation, ParentsAnsweringSurvey, Discussion, NationalITy, dan PlaceofBirth dimana fitur tersebut memperoleh nilai Gain tertinggi dari urutan Gain keseluruhan fitur, dengan nilai Gain ≥ 0,1182 dan menggunakan nilai parameter optimal yaitu nilai E = 6, dan nilai K = 45.
Abstract
The academic performance of students is an indicator of the success of learning in school. Measuring and understanding student performance can help for improving learning systems that are suitable for students so the success of school learning will increase. Student academic performance can be observed via Learning Management System (LMS) named Kalboard 360 dealing with student behavior through a student activity tracking device so it can monitor learning activities. In this research, the secondary data is used to determine student performance through a classification. Neighbor Weighted K-Nearest Neighbor algorithm with Information Gain method will be applied to this study to help predict student performance. NWKNN method has advantages in calculating the weight of classes and overcoming unbalanced data. Information Gain is used to optimize the classifier. Based on the research analysis, the accuracy value is 0,604, with precision value obtained is 0,719, recall value obtained is 0,676, and the f-measure value obtained is 0,661. That values is generated when using 9 features with the highest order value of all features namely VisitedResource, StudentAbsenceDay, RaisedHands, AnnouncementsView, Relation, ParentsAnsweringSurvey, Discussion, NationalITy, dan PlaceofBirth, which have Gain value≥0,1182 and using optimal parameters value, that is E = 6 and K = 45.
Downloads
Referensi
AMIROH, 2012. Kupas Tuntas Membangun E-Learning dengan Learning Management System Moodle Versi 2. 1st ed. Sidoarjo: Genta Group Production.
AMRAN, 2015. Faktor Penentu Keberhasilan Pengelolaan Satuan Pendidikan. Jurnal Manajer Pendidikan, 9(2), pp. 185-196.
AMRIEH, E. A., HAMTINI, T. & ALJARAH, I., 2015. Preprocessing and Analyzing Educational Data Set Using X-API for Improving Student’s Performance. Jordan, IEEE, pp. 1-5.
AMRIEH, E. A., HAMTINI, T. & ALJARAH, I., 2016. Mining Educational Data to Predict Student’s academic Performance using Ensemble Methods.
International Journal of Database Theory and Application, 9(8), pp. 119-136.
CHANDANI, V. & PURWANTO, R. S. W., 2015. Komparasi Algoritma Klasifikasi Machine Learning dan Feature Selection pada Analisis Sentimen Review Film. Journal of Intelligent System, 1(1), pp. 55-59.
DIMIC, G., RANCIC, D., MILENTIJEVIC, I. & SPAEVIC, P., 2018. Improvement of the Accuracy of Prediction Using Unsupervised Discretization Method: Educational Data Set Case Study. Tehnički vjesnik, 25(2), pp. 407-414.
FADILLA, P. N., INDRIATI & RATNAWATI, E. D., 2016. Idetifikasi Jenis Attetion Deficit Hyperactivity Disorder (ADHD) Pada Anak Usia Dini Menggunakan Metode Neighbor Weighted K-Nearest Neighbor (NWKNN). Jurnal Teknologi Informasi dan Ilmu Komputer (JTIIK), 3(3), pp. 194-200.
HAJIZADEH, Z., TAHERI, M. & JAHROMI, M. Z., 2014. Nearest Neighbor Classification with Localy Weighted Distance for Imbalanced Data. International Journal of Computer and Communication Engineering , 3(2), pp. 81-86.
HAN, J., KAMBER, M. & PEI, J., 2012. Data Mining: Concepts and Techniques. 3rd ed. Waltham: Elsevier Inc..
HURIAH, D. T., 2018. Metode Student Center Learning: Aplikasi pada Pendidikan Keperawatan. 1st ed. Jakarta: Prenamedia Group.
INDRIATI & RIDOK, A., 2016. Sentiment Analysis For Review Mobile Applications Using Neighbor Method Weighted K-Nearest Neighbor (Nwknn). Journal of Environmental Engineering & Sustainable Technology , 3(1), pp. 23-32.
JR RAGA, R. C. & RAGA, J. D., 2017. Monitoring Class Activity and Predicting Student Performance Using Moodle Action Log Data. International Journal of Computing Sciences Research, 1(3), pp. 1-16.
JUNG, Y., 2018. Multiple Predicting K-fold Cross-Validation for Model Selection. Journal of Nonparametriv Statistics, 30(1), pp. 197-215.
MAULANA, M. R. & AL KAROMI, M. A., 2015. Information Gain Untuk Mengetahui Pengaruh Atribut Terhadap Klasifikasi Persetujuan Kredit. Jurnal Litbang Kota Pekalongan, Volume 9, pp. 113-123.
OSANAIYE, O. et al., 2016. Ensemble-based multi-filter feature selection method for DDoS detection in cloud computing. EURASIP Journal on Wireless Communications and Networking, 2016(1), pp. 1-10.
RIDOK, A. & LATIFAH, R., 2015. Klasifikasi Teks Bahasa Indonesia Pada Corpus Tak Seimbang Menggunakan NWKNN. Proceedings Konferensi Nasional Sistem dan Informatika (KNS&I). Bali, STMIK STIKOM .
SA’ADAH, U. & ARIATI, J., 2018. Hubungan Antara Student Engagement(Keterlibatan Siswa) Dengan Prestasi Akademik Mata Pelajaran Matematika Pada Siswa Kelas XI SMA Negeri 9 Semarang. Jurnal Empati, 7(1), pp. 69-75.
SARI, B. N., 2016. Implementasi Teknik Seleksi Fitur Information Gain Pada Algoritma Klasifikasi Machine Learning Untuk Prediksi Performa Akademik Siswa. Yogyakarta, STMIK AMIKOM Yogyakarta.
WONG, T.-T. & YANG, N.-Y., 2017. Dependency Analysis of Accuracy Estimates in k-Fold Cross Validation. IEEE Transactions on Knowledge and Data Engineering , 29(11), pp. 2417 - 2427.
YUDHA, B. L., MUFLIKHAH, L. & WIHANDIKA, R. C., 2018. Klasifikasi Risiko Hipertensi Menggunakan Metode Neighbor Weighted K-Nearest Neighbor (NWKNN). Jurnal Pengembangan Teknologi Informasi dan Ilmu Komputer, 2(2), pp. 897-904.
Unduhan
Diterbitkan
Terbitan
Bagian
Lisensi
Artikel ini berlisensi Creative Common Attribution-ShareAlike 4.0 International (CC BY-SA 4.0)
Penulis yang menerbitkan di jurnal ini menyetujui ketentuan berikut:
- Penulis menyimpan hak cipta dan memberikan jurnal hak penerbitan pertama naskah secara simultan dengan lisensi di bawah Creative Common Attribution-ShareAlike 4.0 International (CC BY-SA 4.0) yang mengizinkan orang lain untuk berbagi pekerjaan dengan sebuah pernyataan kepenulisan pekerjaan dan penerbitan awal di jurnal ini.
- Penulis bisa memasukkan ke dalam penyusunan kontraktual tambahan terpisah untuk distribusi non ekslusif versi kaya terbitan jurnal (contoh: mempostingnya ke repositori institusional atau menerbitkannya dalam sebuah buku), dengan pengakuan penerbitan awalnya di jurnal ini.
- Penulis diizinkan dan didorong untuk mem-posting karya mereka online (contoh: di repositori institusional atau di website mereka) sebelum dan selama proses penyerahan, karena dapat mengarahkan ke pertukaran produktif, seperti halnya sitiran yang lebih awal dan lebih hebat dari karya yang diterbitkan. (Lihat Efek Akses Terbuka).