Kombinasi Seleksi Fitur Berbasis Filter dan Wrapper Menggunakan Naive Bayes pada Klasifikasi Penyakit Jantung

Penulis

  • Siti Roziana Azizah Universitas Lambung Mangkurat, Banjarmasin
  • Rudy Herteno Universitas Lambung Mangkurat, Banjarmasin
  • Andi Farmadi Universitas Lambung Mangkurat, Banjarmasin
  • Dwi Kartini Universitas Lambung Mangkurat, Banjarmasin
  • Irwan Budiman Universitas Lambung Mangkurat, Banjarmasin

DOI:

https://doi.org/10.25126/jtiik.1067467

Abstrak

Penyakit jantung menjadi salah satu penyebab utama kematian bersama dengan penyakit lainnya. Dalam bidang teknologi, data mining dapat digunakan untuk mendiagnosa suatu penyakit yang bersumber dari data rekam medis pasien. Pada klasifikasi dataset medis, Naive Bayes merupakan salah satu metode terbaik yang digunakan. Tujuan dari penelitian ini adalah untuk mengetahui perbandingan hasil akurasi dari Naive Bayes menggunakan beberapa seleksi fitur yaitu Forward Selection, Backward Elimination, kombinasi union hasil seleksi fitur Forwad Selection dan Backward Elimination, Information Gain, Gain Ratio, dan kombinasi union hasil seleksi fitur Information Gain dengan Gain Ratio. Data yang digunakan dalam penelitian ini adalah data penyakit jantung yang didapatkan dari UCI Machine Learning Repository. Dari implementasi pemodelan yang akan dilakukan menghasilkan nilai akurasi tertinggi sebesar 91.80% pada algoritma Naive Bayes dengan kombinasi union hasil seleksi fitur Information Gain dan Gain Ratio menggunakan perbandingan data latih dan data uji 80:20. Sedangkan akurasi Naive Bayes dengan kombinasi union hasil seleksi fitur Forward Selection dan Backward Elimination hanya memiliki nilai akurasi sebesar 83.61%

 

Abstract

Heart disease is one of the leading causes of death along with other diseases. In the field of technology, data mining can be used to diagnose a disease sourced from patient medical record data. In the classification of medical datasets, Naive Bayes is one of the best methods used. The purpose of this study is to determine the comparison of the accuracy results of Naive Bayes using several feature selections, namely Forward Selection, Backward Elimination, a combination of union of Forwad Selection and Backward Elimination feature selection results, Information Gain, Gain Ratio, and a combination of union of Information Gain feature selection results with Gain Ratio. The data used in this research is heart disease data obtained from the UCI Machine Learning Repository. From the implementation of modeling that will be carried out, the highest accuracy value is 91.80% in the Naive Bayes algorithm with a combination of union of Information Gain and Gain Ratio feature selection results using a ratio of training data and test data of 80:20. While the accuracy of Naive Bayes with a combination of union selection results of Forward Selection and Backward Elimination features only has an accuracy value of 83.61%.

 

Downloads

Download data is not yet available.

Referensi

ADNYANA, I.M.B., 2019. Penerapan Feature Selection untuk Prediksi Lama Studi Mahasiswa. Jurnal Sistem dan Informatika, 13(2), pp.72–76.

AINI, S.H.A., SARI, Y.A. AND ARWAN, A., 2018. Seleksi Fitur Information Gain untuk Klasifikasi Penyakit Jantung Menggunakan Kombinasi Metode K-Nearest Neighbor dan Naïve Bayes. Jurnal Pengembangan Teknologi Informasi dan Ilmu Komputer, [online] 2(9), pp.2546–2554. Available at: <http://j-ptiik.ub.ac.id>.

AMILIA, I.R., OKTAVIANTO, H. AND ABDURRAHMAN, G., 2021. Penerapan Backward Elimination Untuk Seleksi Fitur Pada Algoritma K-Nearest Neighbor Untuk Klasifikasi Penyakit Gagal Jantung. Jurnal Smart Teknologi, 1(1), pp.100–102.

ARIFIN, T. AND ARIESTA, D., 2019. Prediksi Penyakit Ginjal Kronis Menggunakan Algoritma Naive Bayes Classifier Berbasis Particle Swarm Optimization. Jurnal Tekno Insentif, 13(1), pp.26–30. https://doi.org/10.36787/jti.v13i1.97.

HAMEED, S.S., PETINRIN, O.O., HASHI, A.O. AND SAEED, F., 2018. Filter-wrapper combination and embedded feature selection for gene expression data. International Journal of Advances in Soft Computing and its Applications, 10(1), pp.90–105.

IRAWAN, E., WINDARTO, A.P., AND WANTO, A., 2019. Algoritma Naive Bayes Dalam Klasifikasi Lokasi Pembangunan Sumber Air. Prosiding Seminar Nasional Riset Information Science (SENARIS), (September), pp.750–761. https://doi.org/10.30645/senaris.v1i0.81.

MARTHA, S. AND SULISTIANINGSIH, E., 2018. K Nearest Neighbor Dalam Imputasi Missing Data. Buletin Ilmiah Math. Stat. dan Terapannya (Bimaster), [online] 07(1), pp.9–14. Available at: <http://archive.ics.uci.edu/ml/datas/Iris.>.

NUGROHO, F.A., 2018. Perancangan Sistem Pakar Diagnosa Penyakit Jantung dengan Metode Forward Chaining. Jurnal Informatika Universitas Pamulang, 3(2), pp.75–79. https://doi.org/10.32493/informatika.v3i2.1431.

NUR, F., AHSAN, M. AND HARIANTO, W., 2022. Komparasi Tingkat Akurasi Information Gain Dan Gain Ratio Pada Metode K-Nearest Neighbor. JATI (Jurnal Mahasiswa Teknik Informatika), 6(1), pp.386–391. https://doi.org/10.36040/jati.v6i1.4694.

NURLIA, E. AND ENRI, U., 2021. Penerapan Fitur Seleksi Forward Selection Untuk Menentukan Kematian Akibat Gagal Jantung Menggunakan Algoritma C4.5. Jurnal Teknik Informatika Musirawas), 6(1), pp.42–50.

OKTANISA, I. AND SUPIANTO, A.A., 2018. Perbandingan Teknik Klasifikasi Dalam Data Mining Untuk Bank Direct Marketing. Jurnal Teknologi Informasi dan Ilmu Komputer, 5(5), pp.567–576. https://doi.org/10.25126/jtiik.201855958.

PRASETYO, E., PRASETIYO, B., 2020. Increased Classification Accuracy C4.5 Algorithm Using Bagging Techniques in Diagnosing Heart Disease. 7(5), pp.1035–1040. https://doi.org/10.25126/jtiik.202072379.

PUTRI, N.L., NUGROHO, R.A. AND HERTENO, R., 2021. Intrusion Detection System Berbasis Seleksi Fitur Dengan Kombinasi Filter Information Gain Ratio Dan Correlation. Jurnal Teknologi Informasi dan Ilmu Komputer, 8(3), p.457. https://doi.org/10.25126/jtiik.0813154.

RAIHAN, M.A., HARYANDI, P., SUBAGJA, R.A., PURNAMINYAN, R. AND CHAMIDAH, N., 2021. Implementasi Seleksi Fitur dengan Backward Elimination untuk Klasifikasi Prediksi Perceraian. Seminar Nasional Mahasiswa Ilmu Komputer dan Aplikasinya (SENAMIKA), (April), pp.644–654.

RYFAI, D.A., HIDAYAT, N. AND SANTOSO, E., 2022. Klasifikasi Tingkat Resiko Serangan Penyakit Jantung menggunakan Metode K-Nearest Neighbor. 6(10).

SASONGKO, T.B. AND ARIFIN, O., 2019. Implementasi Metode Forward Selection pada Algoritma Support Vector Machine (SVM) dan Naive Bayes Classifier Kernel Density (Studi Kasus Klasifikasi Jalur Minat SMA). Jurnal Teknologi Informasi dan Ilmu Komputer, [online] 6(4), pp.383–388. https://doi.org/10.25126/jtiik.201961000.

SIDIK, Z., 2019. Klasifikasi Kelancaran Kredit Furniture Menggunakan Algoritma K-Nearest Neighbor Berbasis Forward Selection.

SIREGAR, N.C., SIREGAR, R.R.A. AND SUDIRMAN, M.Y.D., 2020. Jurnal Teknologia Implementasi Metode Naive Bayes Classifier ( NBC ) Pada Komentar Warga Sekolah Mengenai Pelaksanaan Pembelajaran Jarak Jauh ( PJJ ) Jurnal Teknologia. Jurnal Teknologia, 3(1), pp.102–110.

SUCHETHA, N.K., NIKHIL, A. AND HRUDYA, P., 2019. Comparing the wrapper feature selection evaluators on twitter sentiment classification. ICCIDS 2019 - 2nd International Conference on Computational Intelligence in Data Science, Proceedings, (October). https://doi.org/10.1109/ICCIDS.2019.8862033.

SUPRIANTO, S., 2020. Implementasi Algoritma Naive Bayes Untuk Menentukan Lokasi Strategis Dalam Membuka Usaha Menengah Ke Bawah di Kota Medan (Studi Kasus: Disperindag Kota Medan). Jurnal Sistem Komputer dan Informatika (JSON), 1(2), pp.125–130. https://doi.org/10.30865/json.v1i2.1939.

TARIGAN, P.M.S., HARDINATA, J.T., QURNIAWAN, H., M.SAFII AND WINANJAYA, R., 2022. Implementasi Data Mining Menggunakan Algoritma Apriori Dalam Menentukan Persediaan Barang (Studi Kasus: Toko Swapen Jaya Manokwari). Jurnal Sistem Informasi, Teknologi Informasi dan Komputer, 12(2), pp.51–61. https://doi.org/10.33379/gtech.v7i1.1938.

Diterbitkan

30-12-2023

Terbitan

Bagian

Ilmu Komputer

Cara Mengutip

Kombinasi Seleksi Fitur Berbasis Filter dan Wrapper Menggunakan Naive Bayes pada Klasifikasi Penyakit Jantung. (2023). Jurnal Teknologi Informasi Dan Ilmu Komputer, 10(6), 1361-1368. https://doi.org/10.25126/jtiik.1067467