Studi Komparasi Naive Bayes, K-Nearest Neighbor, dan Random Forest untuk Prediksi Calon Mahasiswa yang Diterima atau Mundur

Penulis

  • Puteri Sejati Universitas Esa Unggul, Jakarta Barat
  • Munawar Munawar Universitas Esa Unggul, Jakarta Barat
  • Marzuki Pilliang Universitas Esa Unggul, Jakarta Barat
  • Habibullah Akbar Universitas Esa Unggul, Jakarta Barat

DOI:

https://doi.org/10.25126/jtiik.2022976737

Abstrak

Penelitian ini bertujuan untuk mendapatkan model prediksi terbaik dari data Penerimaan Mahasiswa Baru tahun 2014 hingga 2019 dengan membandingkan Naive Bayes, K-Nearest Neighbor, dan Random Forest. Penelitian ini menggunakan metode klasifikasi untuk memprediksi calon mahasiswa. Mereka diterima atau  mundur. Dalam penelitian ini digunakan 19.603 data latih dan 4.901 data uji. Hasil penelitian menunjukkan bahwa algoritma Random Forest adalah yang terbaik dengan akurasi 73,61%, dibandingkan dengan K-Nearest Neighbor dengan akurasi 72,08%, dan Naive Bayes dengan akurasi 70,47%. Disimpulkan juga bahwa optimasi model dengan teknik Hyperparameter menghasilkan nilai akurasi yang lebih baik. Hasil penelitian ini dapat digunakan untuk mendukung bagian pemasaran dalam meminimalisir jumlah calon mahasiswa yang mengundurkan diri.

 

Abstract


This study aimed to obtain the best predictive model from New Student Admissions data for 2014 to 2019 by comparing Naive Bayes, K-Nearest Neighbor, and Random Forest. This study used the classification method to predict prospective students. They are accepted or withdrawn. In this study, 19,603 training data and 4,901 test data were used. The results showed that the Random Forest algorithm was the best with an accuracy of 73.61%, compared to K-Nearest Neighbor with an accuracy of 72.08%, and Naive Bayes with an accuracy of 70.47%. It is also concluded that optimizing the model with the Hyperparameter technique produces better accuracy values. This study's results can be used to support the marketing department in minimizing the number of withdrawn prospective students.


Downloads

Download data is not yet available.

Referensi

ALVIANA, S. AND KURNIAWAN, B., 2019. Analisis Data Penerimaan Mahasiswa Baru Untuk Meningkatkan Potensi Pemasaran Universitas Menggunakan Business Intelligence (Studi Kasus Universitas XYZ). Infotronik : Jurnal Teknologi Informasi dan Elektronika, [online] 4(1), pp.10–15. https://doi.org/10.32897/infotronik.2019.4.1.2.

ANNISA, R., 2019. Analisis Komparasi Algoritma Klasifikasi Data Mining Untuk Prediksi Penderita Penyakit Jantung. Jurnal Teknik Informatika Kaputama (JTIK), [online] 3(1), pp.22–28. Available at: <https://jurnal.kaputama.ac.id/index.php/JTIK/article/view/141/156>.

ARIBOWO, D. AND SETIADI, A.E.H., 2018. Analisa Komparasi Algoritma Data Mining untuk Klasifikasi Heregistrasi Calon Mahasiswa STMIK Widya Pratama. IC-Tech, [online] 13(2), pp.1–6. https://doi.org/10.47775/ictech.v13i2.30.

DENISKO, D. AND HOFFMAN, M.M., 2018. Classification and interaction in random forests. Proceedings of the National Academy of Sciences of the United States of America, https://doi.org/10.1073/pnas.1800256115.

FERNANDEZ-GARCIA, A.J., RODRIGUEZ-ECHEVERRIA, R., PRECIADO, J.C., MANZANO, J.M.C. AND SANCHEZ-FIGUEROA, F., 2020. Creating a Recommender System to Support Higher Education Students in the Subject Enrollment Decision. IEEE Access, [online] 8, pp.189069–189088. https://doi.org/10.1109/ACCESS.2020.3031572.

FRASTIAN, N., HENDRIAN, S. AND VALENTINO, V.H., 2018. Komparasi Algoritma Klasifikasi Menentukan Kelulusan Mata Kuliah Pada Universitas. Faktor Exacta, [online] 11(1), p.66. https://doi.org/10.30998/faktorexacta.v11i1.1826.

GRESSLING, T., 2020. 84 Automated machine learning. In: Data Science in Chemistry. [online] De Gruyter. pp.409–411. https://doi.org/10.1515/9783110629453-084.

KADAFI, A.R., 2018. Perbandingan Algoritma Klasifikasi Untuk Penjurusan Siswa SMA. Jurnal ELTIKOM, [online] 2(2), pp.67–77. https://doi.org/10.31961/eltikom.v2i2.86.

MAULANA, M.S., SABARUDIN, R. AND NUGRAHA, W., 2019. Prediksi Ketepatan Kelulusan Mahasiswa Diploma dengan Komparasi Algoritma Klasifikasi. Jurnal Sistem dan Teknologi Informasi (JUSTIN), [online] 7(3), p.202. https://doi.org/10.26418/justin.v7i3.33316.

MUSTOFA, H. AND MAHFUDH, A.A., 2019. Klasifikasi Berita Hoax Dengan Menggunakan Metode Naive Bayes. Walisongo Journal of Information Technology, [online] 1(1), p.1. https://doi.org/10.21580/wjit.2019.1.1.3915.

QUARANTA, L., CALEFATO, F. AND LANUBILE, F., 2021. KGTorrent: A Dataset of Python Jupyter Notebooks from Kaggle. In: 2021 IEEE/ACM 18th International Conference on Mining Software Repositories (MSR). [online] IEEE. pp.550–554. https://doi.org/10.1109/MSR52588.2021.00072.

RAHAYUNINGSIH, P.A., 2019. Analisis Komparasi Algoritma Klasifikasi Data Mining. Jurnal Teknik Informatika Kaputama (JTIK), [online] 3(1). Available at: <http://jurnal.kaputama.ac.id/index.php/JTIK/article/view/169>.

TUMMERS, J., CATAL, C., TOBI, H., TEKINERDOGAN, B. AND LEUSINK, G., 2020. Coronaviruses and people with intellectual disability: an exploratory data analysis. Journal of Intellectual Disability Research, [online] 64(7), pp.475–481. https://doi.org/10.1111/jir.12730.

YAHYA, N. AND JANANTO, A., 2019. Komparasi Kinerja Algoritma C4.5 Dan Naive Bayes Untuk Prediksi Kegiatan Penerimaan Mahasiswa Baru (Studi Kasus : Universitas Stikubank Semarang). Prosiding SENDI, [online] (2014), pp.978–979. Available at: <https://www.unisbank.ac.id/ojs/index.php/sendi_u/article/view/7389>.

YANG, L. AND SHAMI, A., 2020. On hyperparameter optimization of machine learning algorithms: Theory and practice. Neurocomputing, [online] 415, pp.295–316. https://doi.org/10.1016/j.neucom.2020.07.061.

YULIANTI, H., 2020. Analisis Komparasi Algoritma Klasifikasi Data Mining untuk Prediksi Penjurusan Siswa Sekolah Menengah Atas (SMA) Pramitra Karawaci Tangerang. LENSA, [online] 2(48), pp.1–6. https://doi.org/10.33050/lns.v2i48.1277.

Diterbitkan

29-12-2022

Cara Mengutip

Studi Komparasi Naive Bayes, K-Nearest Neighbor, dan Random Forest untuk Prediksi Calon Mahasiswa yang Diterima atau Mundur. (2022). Jurnal Teknologi Informasi Dan Ilmu Komputer, 9(7), 1341-1348. https://doi.org/10.25126/jtiik.2022976737