Penerapan Algoritma Pillar Untuk Inisialisasi Titik Pusat K-Means Klaster Dinamis
DOI:
https://doi.org/10.25126/jtiik.2020762538Abstrak
K-Means merupakan algoritma yang digunakan untuk melakukan pengklasteran data. Namun, k-means memiliki
masalah dalam sensitivitas penentuan partisi awal jumlah klaster. Penelitian terkait menyatakan algoritma k-means tergantung pada penentuan titik pusat klaster awal. Pemilihan pusat klaster awal secara acak cenderung menghasilkan klaster yang berbeda. Sehingga untuk menentukan klaster terbaik harus dilakukan dengan memperhatikan nilai Sum Sequare Error yang terkecil. Untuk mengatasi permasalahan tersebut, penentuan klaster dilakukan dengan menggunakan algoritma pillar. Algoritma pillar menentukan titik pusat klaster dengan memilih data dengan nilai euclidean paling jauh dari titik pusat klaster. Namun pemilihan titik klaster tetap memperhatikan kemungkinan data outlier. Pengujian dilakukan dengan menetapkan satu buah klaster awal sebagai inisialisasi skaligus sebagai klaster pembanding untuk menentukan kualitas klaster berikutnya. Penelitian ini menggunakan data set ruspini dan iris. Untuk data ruspini terdiri dari 76 data set, sedangkan data iris terdiri dari 150 data set. Klaster Pillar memiliki nilai Sum Sequere Error, Variance Cluster, dan Davies yang lebih kecil dibandingkan klaster dinamis pada data set ruspini. Nilai tersebut secara berurutan untuk algoritma pillar adalah 0.28, 0.11, 7.30, 5.88. Untuk data set iris nilai Sum Square Error lebih tinggi dibandingkan dengan klaster dinamis yaitu 0.34. Sedangkan algoritma klaster dinamis memiliki nilai 0.32. Hal tersebut disebahkan penentuan data outlier pada iris data set yang tidak akurat. Ketidakakurantan tersebut berasal dari data yang bersifat multivariat, sehingga memungkinkan data outlier menjadi centroid awal klaster. Sehingga jika dilihat dari nilai validitas SSE, algoritma pillar k-means klaster dinamis masih kurang bekerja optimal dibandingkan dengan algoritma k-means klaster dinamis.
Downloads
Referensi
AGGARWAL, N., AGGARWAL, K., & GUPTA, K. (2012). Comparative Analysis of K-means and Enhanced K-means Clustering Algorithm for Data Mining. International Jouranl of Scientific & Engineering Research, 3(3).
BALA, C., BASU, T., & DASGUPTA, A. (2015). Automatic detection of k with suitable seed values for classic k-means algorithm using de. 2015 International Conference on Advances in Computing, Communications and Informatics, ICACCI 2015, 759–765. https://doi.org/10.1109/ICACCI.2015.7275702
BARAKBAH, A. R., & KIYOKI, Y. (2009). A pillar algorithm for k-means optimization by distance maximization for initial centroid designation. 2009 IEEE Symposium on Computational Intelligence and Data Mining, CIDM 2009 - Proceedings, 61–68. https://doi.org/10.1109/CIDM.2009.4938630
BHUSARE, B. B., & BANSODE, S. M. (2014). Centroids Initialization for K-Means Clustering using Improved Pillar Algorithm. 3(4), 1317–1322.
BUNKERS, M. J., MILLER, J. R., & DEGAETANO, A. T. (1996). Definition of climate regions in the northern plains using an objective cluster modification technique. Journal of Climate, Vol. 9, pp. 130–146. https://doi.org/10.1175/1520-0442(1996)009<0130:DOCRIT>2.0.CO;2
FISHER, R. . (1993). Iris Data Set. Tersedia
di:<https://archive.ics.uci.edu/ml/datasets/iris> [Diakses 22 November 2019]
MA, L., GU, L., LI, B., MA, Y., & WANG, J. (2015). An Improved K-means Algorithm based on Mapreduce and Grid. International Journal of Grid and Distributed Computing, 8(1), 189–200. https://doi.org/10.14257/ijgdc.2015.8.1.18
MAULIK, U., & BANDYOPADHYAY, S. (2002). Performance evaluation of some clustering algorithms and validity indices. IEEE Transactions on Pattern Analysis and Machine Intelligence, 24(12), 1650–1654. https://doi.org/10.1109/TPAMI.2002.1114856
PRATAMA, I. P. A., & HARJOKO, A. (2017). Penerapan Algoritma Invasive Weed Optimnization untuk Penentuan Titik Pusat Klaster pada K-Means. IJCCS (Indonesian Journal of Computing and Cybernetics Systems), 9(1), 65. https://doi.org/10.22146/ijccs.6641
SEGNERI, C. (2017). K-Means Clustering. Tersedia
di:<https://rpubs.com/cjsegneri/kmeansclustering> [Diakses 22 November 2019]
SEPUTRA, K. A., SUDARMA, I. M., & JASA, L. (2017). The Optimization of the Dynamic K-Means Clustering Algorithm with the Cluster Initialization in Grouping Travelers Perception to the Beach Tourist Destinations in Bali , Indonesia. International Journal of Research in IT, Management and Engineering, ISSN 2249-1619, 07(04), 1–7.
SHAFEEQ B M, A., & K S, H. (2012). Dynamic Clustering of Data with Modified K-Means Algorithm. International Conference on Information and Computer Networks (ICICN 2012), 27(Icicn), 221–225. https://doi.org/10.13140/2.1.4972.3840
SUNITHA, L., BALRAJU, M., SASIKIRAN, J., & RAMANA, E. V. (2014). Automatic Outlier Identification in Data Mining Using IQR in Real-Time Data. 3(6), 7255–7257.
WU, J. (2012). Advances in K-means Clustering. 1–16. https://doi.org/10.1007/978-3-642-29807-3
YADAV, R., & SHARMA, A. (2012). Advanced methods to improve performance of k-means algorithm: A review. Global Journal of Computer Science and Technology, 12(9), 47–51.
Unduhan
Diterbitkan
Terbitan
Bagian
Lisensi
Artikel ini berlisensi Creative Common Attribution-ShareAlike 4.0 International (CC BY-SA 4.0)
Penulis yang menerbitkan di jurnal ini menyetujui ketentuan berikut:
- Penulis menyimpan hak cipta dan memberikan jurnal hak penerbitan pertama naskah secara simultan dengan lisensi di bawah Creative Common Attribution-ShareAlike 4.0 International (CC BY-SA 4.0) yang mengizinkan orang lain untuk berbagi pekerjaan dengan sebuah pernyataan kepenulisan pekerjaan dan penerbitan awal di jurnal ini.
- Penulis bisa memasukkan ke dalam penyusunan kontraktual tambahan terpisah untuk distribusi non ekslusif versi kaya terbitan jurnal (contoh: mempostingnya ke repositori institusional atau menerbitkannya dalam sebuah buku), dengan pengakuan penerbitan awalnya di jurnal ini.
- Penulis diizinkan dan didorong untuk mem-posting karya mereka online (contoh: di repositori institusional atau di website mereka) sebelum dan selama proses penyerahan, karena dapat mengarahkan ke pertukaran produktif, seperti halnya sitiran yang lebih awal dan lebih hebat dari karya yang diterbitkan. (Lihat Efek Akses Terbuka).