Perbandingan Algoritma Naive Bayes dan C.45 dalam Klasifikasi Data Mining
DOI:
https://doi.org/10.25126/jtiik.201854803Kata Kunci:
Akurasi, C.45, Klasifikasi, Naive Bayes, Precision, RecallAbstrak
Pada paper ini, telah diterapkan metode Naive Bayes serta C.45 ke dalam 4 buah studi kasus, yaitu kasus penerimaan “Kartu Indonesia Sehat”, penentuan pengajuan kartu kredit di sebuah bank, penentuan usia kelahiran, serta penentuan kelayakan calon anggota kredit pada koperasi untuk mengetahui algoritma terbaik di setiap kasus. Setelah itu, dilakukan perbandingan dalam hal Precision, Recall serta Accuracy untuk setiap data training dan data testing yang telah diberikan. Dari hasil implementasi yang dilakukan, telah dibangun sebuah aplikasi yang dapat menerapkan algoritma Naive Bayes dan C.45 di 4 buah kasus tersebut. Aplikasi telah diuji dengan blackbox dan algoritma dengan hasil valid dan dapat mengimplementasikan kedua buah algoritma dengan benar. Berdasarkan hasil pengujian, semakin banyaknya data training yang digunakan, maka nilai precision, recall dan accuracy akan semakin meningkat. Selain itu, hasil klasifikasi pada algoritma Naive Bayes dan C.45 tidak dapat memberikan nilai yang absolut atau mutlak di setiap kasus. Pada kasus penentuan penerimaan Kartu Indonesia Sehat, kedua buah algoritma tersebut sama-sama efektif untuk digunakan. Untuk kasus pengajuan kartu kredit di sebuah bank, C.45 lebih baik daripada Naive Bayes. Pada kasus penentuan usia kelahiran, Naive Bayes lebih baik daripada C.45. Sedangkan pada kasus penentuan kelayakan calon anggota kredit di koperasi, Naive Bayes memberikan nilai yang lebih baik pada precision, tapi untuk recall dan accuracy, C.45 memberikan hasil yang lebih baik. Sehingga untuk menentukan algoritma terbaik yang akan dipakai di sebuah kasus, harus melihat kriteria, variable maupun jumlah data di kasus tersebut.
Abstract
In this paper, applied Naive Bayes and C.45 into 4 case studies, namely the case of acceptance of “Kartu Indonesia Sehat”, determination of credit card application in a bank, determination of birth age, and determination of eligibility of prospective members of credit to Koperasi to find out the best algorithm in each case. After that, the comparison in Precision, Recall and Accuracy for each training data and data testing has been given. From the results of the implementation, has built an application that can apply the Naive Bayes and C.45 algorithm in 4 cases. Applications have been tested in blackbox and algorithms with valid results and can implement both algorithms correctly. Based on the test results, the more training data used, the value of precision, recall and accuracy will increase. The classification results of Naive Bayes and C.45 algorithms can not provide absolute value in each case. In the case of determining the acceptance of the Kartu Indonesia Indonesia, the two algorithms are equally effective to use. For credit card submission cases at a bank, C.45 is better than Naive Bayes. In the case of determining the age of birth, Naive Bayes is better than C.45. Whereas in the case of determining the eligibility of prospective credit members in the cooperative, Naive Bayes provides better value in precision, but for recall and accuracy, C.45 gives better results. So, to determine the best algorithm to be used in a case, it must look at the criteria, variables and amount of data in the case
Unduhan
Referensi
AMIN, R. K., INDWIARTI, & SIBARONI, Y. (2015). Implementation of Decision Tree Using C4.5 Algorithm in Decision Making of Loan Application by Debtor (Case Study: Bank Pasar of Yogyakarta Special Region). Information and Communication Technology (ICoICT), Nusa Dua, Bali, 27-29 May. 75-80. DOI: 10.1109/ICoICT.2015.7231400
ANTARISTI, M., & KURNIAWAN, Y. I. (2017). Aplikasi Klasifikasi Penentuan Pengajuan Kartu Kredit Menggunakan Metode Naive Bayes di Bank BNI Syariah Surabaya. Jurnal Teknik Elektro, 9(2), 45-52.
ASIKIN, M.F., KURNIAWATY, D., SARI, S.K. AND CHOLISSODIN, I., 2016. Implementasi Metode Naïve Bayes Classifier Untuk Seleksi Asisten Praktikum Pada Simulasi Hadoop Multinode Cluster. Jurnal Teknologi Informasi dan Ilmu Komputer, 3(4), pp.273-278.
BANSAL, A., SHARMA, M., & GOEL, S. (2017). Improved k-mean clustering algorithm for prediction analysis using classification technique in data mining. International Journal of Computer Applications (0975–8887) Volume, 157, 33-40.
INDRASWARI, N. R., & KURNIAWAN, Y. I. (2018). Aplikasi Prediksi Usia Kelahiran dengan Metode Naive Bayes. Simetris: Jurnal Teknik Mesin, Elektro dan Ilmu Komputer, 9(1), 129-138.
JADHAV, A., PANDITA, A., PAWAR, A., & SINGH, V. (2016). Classification of Unstructured Data using Naïve Bayes Classifier and Predictive Analysis for RTI Application. ABHIYANTRIKI: An International Journal of Engineering & Technology, 3(6), 1–6.
KUMAR, P. S., & UMATEJASWI, V. (2017). Diagnosing Diabetes using Data Mining Techniques. International Journal of Scientific and Research Publications, 7(6), 705-709.
KURNIAWAN, D. A., & KURNIAWAN, Y. I. (2018). Aplikasi Prediksi Kelayakan Calon Anggota Kredit Menggunakan Algoritma Naïve Bayes. Jurnal Teknologi dan Manajemen Informatika, 4(1).
KURNIAWAN, Y. I., SOVIANA, E., & YULIANA, I. (2018, June). Merging Pearson Correlation and TAN-ELR algorithm in recommender system. In AIP Conference Proceedings (Vol. 1977, No. 1, p. 040028). AIP Publishing.
PURUSHOTTAM, SAXENA, K., & SHARMA, R. (2016). Efficient Heart Disease Prediction System using Decision Tree. International Conference on Computing, Communication and Automation (ICCCA), Noida, India, 15-16 May. 72-77. DOI: 10.1109/CCAA.2015.7148346
RAHMAN, A. A., & KURNIAWAN, Y. I. (2018). APLIKASI KLASIFIKASI PENERIMA KARTU INDONESIA SEHAT MENGGUNAKAN ALGORITMA NAÏVE BAYES CLASSIFIER. Jurnal Teknologi dan Manajemen Informatika, 4(1).
ROIGER, R. J. (2017). Data mining: a tutorial-based primer. CRC Press.
VAFEIADIS, T., DIAMANTARAS, K., SARIGIANNIDIS, G., & CHATZISAVVAS, K. (2015). A Compariosn Of Machine Learning Techniques For Customer Chrun Prediction. Simulation Modelling Practice and Theory, 55, 1-9.
Unduhan
Diterbitkan
Terbitan
Bagian
Lisensi

Artikel ini berlisensi Creative Common Attribution-ShareAlike 4.0 International (CC BY-SA 4.0)
Penulis yang menerbitkan di jurnal ini menyetujui ketentuan berikut:
- Penulis menyimpan hak cipta dan memberikan jurnal hak penerbitan pertama naskah secara simultan dengan lisensi di bawah Creative Common Attribution-ShareAlike 4.0 International (CC BY-SA 4.0) yang mengizinkan orang lain untuk berbagi pekerjaan dengan sebuah pernyataan kepenulisan pekerjaan dan penerbitan awal di jurnal ini.
- Penulis bisa memasukkan ke dalam penyusunan kontraktual tambahan terpisah untuk distribusi non ekslusif versi kaya terbitan jurnal (contoh: mempostingnya ke repositori institusional atau menerbitkannya dalam sebuah buku), dengan pengakuan penerbitan awalnya di jurnal ini.
- Penulis diizinkan dan didorong untuk mem-posting karya mereka online (contoh: di repositori institusional atau di website mereka) sebelum dan selama proses penyerahan, karena dapat mengarahkan ke pertukaran produktif, seperti halnya sitiran yang lebih awal dan lebih hebat dari karya yang diterbitkan. (Lihat Efek Akses Terbuka).