Implementasi Metode Forward Selection pada Algoritma Support Vector Machine (SVM) dan Naive Bayes Classifier Kernel Density (Studi Kasus Klasifikasi Jalur Minat SMA)

Penulis

Theopilus Bayu Sasongko, Oki Arifin

Abstrak

Peminatan merupakan kegiatan yang disediakan oleh pihak sekolah yang berguna untuk mengakomodasi pilihan minat, bakat, atau kemampuan peserta didik dengan orientasi pemusatan. Penentuan jalur minat umumnya melibatkan banyak attribute. Klasifikasi maupun prediksi pada data mining menggunakan fitur seleksi sangat penting untuk pemilihan attribute yang tepat, karena berpengaruh pada performansi model, oleh sebab itu perlu metode untuk melakukan seleksi atribut. Penelitian ini membandingkan implementasi metode forward selection pada Algoritma SVM dan Naïve Bayes Kernel Density. Studi kasus yang digunakan adalah jalur minat pada siswa SMA pada dua sekolah yang berbeda. Proses pembentukan model klasifikasi dengan menganalisa perubahan kernel, faktor pinalti (C) SVM, number of kernel Naïve bayes kernel density, dan hasil feature subset forward selection. Digunakan lima buah eksperimen kernel SVM yaitu dot (linear), radial (RBF), polynomial, neural, dan anova. Proses uji coba perubahan parameter menggunakan rentang 0.0-100.0. Hasil dari penelitian ini diantaranya adalah feature subset dataset SMA ABC yang terpilih yaitu nilai IPA, tes akademik, abstrak konseptual, analisa sintesa, dan logika numerik, sedangkan feature subset SMA XYZ yaitu nilai IPA, logika numerik, dan analisa sintesa. Hasil pengujian dataset SMA ABC menggunakan algoritma FS-SVM berbasis kernel anova parameter C=10.0 sebesar 99.29%. Sedangkan hasil pengujian dataset SMA XYZ menggunakan algoritma FS-SVM berbasis kernel anova parameter C=10.0 sebesar 95.17%.

 

Abstract

Specialization is an activity provided by the school that is useful to accommodate the choice of interests, talents, or abilities of students with a concentration of orientation. The determination of interest generally involved many attributes. The classification and prediction on the data mining that use the selection feature is very important for the selection of the right attribute, because it affects the performance of the model, therefore a method is needed to select attributes. This study compares the implementation of the forward selection method in the SVM Algorithm and Naïve Bayes Kernel Density. The case study that is used is the interest of students in high school and compared with two different schools. The process of modelling by studying kernel changes, penalty factors (C) SVM, number of kernel Naïve bayes kernels, and the results of features from subset forward selection. Five SVM kernel experiments ared used, namely dot (linear), radial (RBF), polynomial, neural, and anova. The trial process of changes parameters uses the range 0.0-100.0. The results of this study include features of selected ABC SMA subset datas, which are IPA values, academic tests, conceptual abstracts, synthesis analysis, and numerical logic, while the XYZ SMA subset features are IPA values, numerical logic, and synthesis analysis. The test results of the ABC High School dataset that use the kernel-based FS-SVM algorithm parameter C = 10.0 is 99.29%. While the results of testing the XYZ SMA dataset that use the kernel-based FS-SVM algorithm parameter C = 10.0 for 95.17%.


Kata Kunci


Classification;SVM;Naive Bayes Kernel Density; Forward Selection

Teks Lengkap:

PDF

Referensi


BAYU, T., 2016. Komparasi dan Analisis Kinerja Model Algoritma SVM dan PSO-SVM (Studi Kasus Jalur Minat SMA), Vol 2 No 2. Jurnal Teknik Informatika dan Sistem Informasi, [online] Tersedia di: < http://journal.maranatha.edu/index.php/jutisi/article/view/627 > [Diakses 14 Agustus 2018].

ARYA, B., 2015. Penerapan Fitur Seleksi Forward Selection Menggunakan Algoritma Naïve Bayes Untuk Menentukan Atribut Yang Berpengaruh pada Klasifikasi Kelulusan Mahasiswa AKI Semarang. Universitas Dian Nuswantoro Semarang.

CHUNG, J.T., LI, Y.C., JUN, C.Y, AND CHENG, Y., 2007. Feature Selection using PSO-SVM, IAENG International Journal of Computer Science.

ARDJANI, F., SADOUNI, K., AND BENYETTOU, M., 2010. Optimization of SVM MultiClass by Particle Swarm (PSO-SVM).

NANJA, M., DAN PURWANTO, 2015. Metode K-Nearest Neighbor Berbasis Forward Selection Untuk Prediksi Harga Komoditi Lada, Jurnal Pseudocode, Vol.2, No.1

PRASETYO, A., 2017. Algoritma Naïve Bayes Berbasis Forward Selection Pada Prediksi Kelulusan Tepat Waktu, Tesis, Universitas Dian Nuswantoro.

AGUSTINUS, J., 2012. Sistem Deteksi Intrusi Jaringan dengan Metode Support Vector Machine, Thesis. Jurusan Ilmu Komputer FMIPA UGM.

HAN, J., KAMBER, M., 2013. Data Mining: Concepts and Techniques. Third Edition. Morgan Kaufmann Publishers, San Fransisco.

MUHAMAD, H., ADI PRASOJO, C., AFIFAH, N., SURTININGSIH, L., DAN CHOLISSODIN, I., 2017. Optimasi Naïve Bayes Classifier Dengan Menggunakan Particle Swarm Optimization Pada Data Iris. Jurnal Teknologi Informasi dan Ilmu Komputer, [online] Tersedia di: < http://jtiik.ub.ac.id/index.php/jtiik/article/download/251/pdf > [Diakses 14 Agustus 2018].

PEREZ, A., LARRANAGA, P., INZA, I., 2009. Bayesian Classifiers based on kernel density estimation Flexible classifiers. International Journal of Approximate Reasoning, [online] Tersedia di : < https://www.sciencedirect.com/science/article/pii/S0888613X08001400> [Diakses 10 Agustus 2018].

VINITA, C., Komparasi Algoritma Klasifikasi Machine Learning dan Feature Selection pada Analisis Sentimen Review Film, 2015. Journal of Intelligent Systems, Vol.1, No.1,