Perbandingan Klasifikasi Antara KNN dan Naive Bayes pada Penentuan Status Gunung Berapi dengan K-Fold Cross Validation

Penulis

Firman Tempola, Miftah Muhammad, Amal Khairan

Abstrak

Penelitian ini akan membandingkan dua algoritma klasifikasi yaitu K-Nearest Neighbour dan Naive Bayes Classifier pada data-data aktivitas status gunung berapi yang ada di Indonesia. Sedangkan untuk validasi data menggunakan k-fold cross validation. Dalam penentuan status gunung berapi pusat vulkanologi dan mitigasi bencana geologi melakukan dengan dua hal yaitu pengamatan visual dan faktor kegempaan. Pada penelitian ini dalam melakukan klasifikasi aktivitas gunung berapi menggunakan faktor kegempaan. Ada 5 kriteria yang digunakan dalam melakukan klasifikasi yaitu empat faktor kegempaan diantaranya gempa vulkanik dangkal, gempa tektonik jauh, gempa vulkanik dalam, gempa hembusan dan ditambah satu kriteria yaitu status sebelumnya. Ada 3 status yang di yang diklasifikasi yaitu normal, waspada dan siaga. Hasil penelitian yang dibagi kedalam 3 fold disetiap metode klasifikasi didapat perbandingan akurasi sistem rata-rata tertinggi pada k-nn 63,68 % dengan standar deviasi 7,47 %. Sedangkan dengan menggunakan naive bayes didapat rata-rata akurasi sebesar 79,71 % dengan standar deviasi 3,55 %. Selain itu, penggunaan naive bayes jaraknya akurasi lebih dekat dibandingan dengan k-nn.

 

Abstract

This research will compare two classification algorithms that are K-Nearest Neighbors and Naive Bayes Classifier on data of volcanic status activity in Indonesia. While for data validation use k-fold cross validation. In determining the status of volcanology center volcanology and geological disaster mitigation to do with two things: visual observation and seismic factors. In this research in doing the classification of volcanic activity using earthquake factor. There are 5 criteria used in the classification of four seismic factors such as shallow volcanic earthquakes, distant tectonic earthquakes, volcanic earthquakes in the earthquake, blast and plus one criterion that is the previous status. There are 3 statuses in which are classified ie normal, alert and alert. The results of the study are divided into 3 fold in each classification method obtained comparison of the highest average system accuracy at 63.68% k-nn with a standard deviation of 7.47%. While using naive bayes obtained an average accuracy of 79.71% with a standard deviation of 3.55%. In addition, the use of naive bayes is closer to the accuracy of k-nn.

Kata Kunci


Gunung berapi, knn, naive bayes,k-fold cross validation

Teks Lengkap:

PDF


DOI: http://dx.doi.org/10.25126/jtiik.201855983