Peningkatan Akurasi Klasifikasi Algoritma C 4.5 Menggunakan Teknik Bagging pada Diagnosis Penyakit Jantung

Penulis

Erwin Prasetyo, Budi Prasetiyo

Abstrak

Perkembangan teknologi yang begitu pesat menjadikan kebutuhan akan suatu informasi semakin meningkat, sehingga keakuratan suatu informasi menjadi suatu hal yang sangat penting, Terutama keakuratan informasi yang dibutuhkan dalam memprediksi penyakit dalam bidang medis. Dalam proses pengumpulan suatu informasi dibutuhkan metode tertentu, sehingga informasi yang telah diproses menjadi sebuah pengetahuan menggunakan suatu metode tertentu disebut dengan penambangan data atau istilah lainnya adalah data mining. Umumnya data mining digunakan untuk memprediksi suatu penyakit yang bersumber dari data rekam medis pasien, khususnya penyakit jantung. Data penyakit jantung diambil dari dataset UCI Machine Learning Repository. Tujuan dari penulis melakukan penelitian ini yaitu untuk mengetahui penerapan teknik bagging pada algoritma C4.5, mengetahui hasil akurasi dalam algoritma C4.5, dan membandingkan tingkat akurasi dari penerapan teknik bagging pada algoritma C4.5. Dataset yang diklasifikasikan dengan algoritma C4.5 memperoleh akurasi sebesar 72,98%. Hasil akurasi ini dapat ditingkatkan dengan menerapkan teknik bagging menghasilkan akurasi sebesar 81,84%, sehingga terjadi peningkatan akurasi sebesar 8,86%  dari penerapan teknik bagging pada Algoritma C4.5.

 

Abstract

The quick development of technology makes the need for information increase, so that the accuracy of the information becomes a very important thing, especially the accuracy of the information needed in predicting diseases in the medical field. In the process of gathering information certain methods are needed, so information that has been processed into knowledge using a certain method is called data mining or other terms is data mining. Data mining is generally used to predict a disease originating from patient medical record data, especially heart disease. Heart disease data is taken from the UCI Machine Learning Repository dataset. The purpose of the authors conducting this research is to determine the application of bagging techniques on the C4.5 algorithm, determine the accuracy of the results in the C4.5 algorithm, and compare the level of accuracy of the application of bagging techniques on the C4.5 algorithm. The dataset classified by the C4.5 algorithm obtained an accuracy of 72.98%. The results of this accuracy can be improved by applying bagging techniques resulting in an accuracy of 81.84%, resulting in an increase in accuracy of 8.86% from the application of bagging techniques in the C4.5 Algorithm.


Teks Lengkap:

PDF

Referensi


ALPAYDIN, E., 2010. Introduction of Machine Learning Second Edition. 2 ed. Cambridge: The MIT Press.

DAS, R., 2010. A comparison of multiple classification methods for diagnosis of Parkinson disease. Expert System With Application, p. 1568–1572.

GORUNESCU, F., 2011. Data Mining: Concepts, Models and Techniques. Berlin: Springer US.

HAN, J., KAMBER, M. & JIAN, P., 2012. Data Mining Concepts and Techniques Third Edition. Third ed. Waltham: Morgan Kaufmann.

LIANG, G., ZHU, X. & ZHANG, C., 2011. An Empirical Study of Bagging Predictors for Imbalanced Data with Different Levels. AI: Advances in Artificial Intelligence, p. 213–222.

M. et al., 2017. Penerapan Dizcretization dan Teknik Bagging Untuk Meningkatkan Akurasi Klasifikasi Berbasis Ensemble pada Algoritma C4.5 dalam Mendiagnosa Diabetes. Jurnal Imiah Teknologi Informasi, 8(2), p. 132.

MUZAKIR, A. & WULANDARI, R. A., 2016. Model Data Mining sebagai Prediksi Penyakit Hipertensi. Scientific Journal of Informatics, 3(1), pp. 19-26.

PRASETYO, E., 2014. Data Mining: Mengolah Data Menjadi Informasi Menggunakan Matlab. Yogyakarta: CV. Andi Offset.

R, J. & RV, S. B., 2016. C4.5 classification algorithm with back-track pruning for accurate prediction of heart disease. Biomedical Research, 0(0), pp. 107-111.

ROHMAN, A., SUHARTONO, V. & SUPRIYANTO, C., 2017. Penerapan Algoritma C4.5 Berbasis Adaboost. Jurnal Teknologi Informasi, 13(1), Pp. 13-19.

SIRINGORINGO, R., 2018. Klasifikasi Data Tidak Seimbang Menggunakan Algoritma Smote Dan K-Nearest Neighbor. Jurnal ISD, 3(1), Pp. 44-49.

SUTTON, C., 2005. Classification and Regression Trees, Bagging, and Boosting. s.l.:Elsevier.

TSAI, C.-J., LEE, C.-I. & YANG, W.-P., 2008. A discretization algorithm based on. Information Sciences, 4(1), pp. 714-731.




DOI: http://dx.doi.org/10.25126/jtiik.2020752379