Penerapan Algoritma Pillar Untuk Inisialisasi Titik Pusat K-Means Klaster Dinamis

Penulis

  • Ketut Agus Seputra Universitas Pendidikan Ganesha
  • I Nyoman Saputra Wahyu Wijaya Universitas Pendidikan Ganesha

DOI:

https://doi.org/10.25126/jtiik.2020762538

Abstrak

K-Means merupakan algoritma yang digunakan untuk melakukan pengklasteran data. Namun, k-means memiliki
masalah dalam sensitivitas penentuan partisi awal jumlah klaster. Penelitian terkait menyatakan algoritma k-means tergantung pada penentuan titik pusat klaster awal. Pemilihan pusat klaster awal secara acak cenderung menghasilkan klaster yang berbeda. Sehingga untuk menentukan klaster terbaik harus dilakukan dengan memperhatikan nilai Sum Sequare Error yang terkecil. Untuk mengatasi permasalahan tersebut, penentuan klaster dilakukan dengan menggunakan algoritma pillar. Algoritma pillar menentukan titik pusat klaster dengan memilih data dengan nilai euclidean paling jauh dari titik pusat klaster. Namun pemilihan titik klaster tetap memperhatikan kemungkinan data outlier. Pengujian dilakukan dengan menetapkan satu buah klaster awal sebagai inisialisasi skaligus sebagai klaster pembanding untuk menentukan kualitas klaster berikutnya. Penelitian ini menggunakan data set ruspini dan iris. Untuk data ruspini terdiri dari 76 data set, sedangkan data iris terdiri dari 150 data set. Klaster Pillar memiliki nilai Sum Sequere Error, Variance Cluster, dan Davies yang lebih kecil dibandingkan klaster dinamis pada data set ruspini. Nilai tersebut secara berurutan untuk algoritma pillar adalah 0.28, 0.11, 7.30, 5.88. Untuk data set iris nilai Sum Square Error lebih tinggi dibandingkan dengan klaster dinamis yaitu 0.34. Sedangkan algoritma klaster dinamis memiliki nilai 0.32. Hal tersebut disebahkan penentuan data outlier pada iris data set yang tidak akurat. Ketidakakurantan tersebut berasal dari data yang bersifat multivariat, sehingga memungkinkan data outlier menjadi centroid awal klaster. Sehingga jika dilihat dari nilai validitas SSE, algoritma pillar k-means klaster dinamis masih kurang bekerja optimal dibandingkan dengan algoritma k-means klaster dinamis.

Downloads

Download data is not yet available.

Referensi

AGGARWAL, N., AGGARWAL, K., & GUPTA, K. (2012). Comparative Analysis of K-means and Enhanced K-means Clustering Algorithm for Data Mining. International Jouranl of Scientific & Engineering Research, 3(3).

BALA, C., BASU, T., & DASGUPTA, A. (2015). Automatic detection of k with suitable seed values for classic k-means algorithm using de. 2015 International Conference on Advances in Computing, Communications and Informatics, ICACCI 2015, 759–765. https://doi.org/10.1109/ICACCI.2015.7275702

BARAKBAH, A. R., & KIYOKI, Y. (2009). A pillar algorithm for k-means optimization by distance maximization for initial centroid designation. 2009 IEEE Symposium on Computational Intelligence and Data Mining, CIDM 2009 - Proceedings, 61–68. https://doi.org/10.1109/CIDM.2009.4938630

BHUSARE, B. B., & BANSODE, S. M. (2014). Centroids Initialization for K-Means Clustering using Improved Pillar Algorithm. 3(4), 1317–1322.

BUNKERS, M. J., MILLER, J. R., & DEGAETANO, A. T. (1996). Definition of climate regions in the northern plains using an objective cluster modification technique. Journal of Climate, Vol. 9, pp. 130–146. https://doi.org/10.1175/1520-0442(1996)009<0130:DOCRIT>2.0.CO;2

FISHER, R. . (1993). Iris Data Set. Tersedia

di:<https://archive.ics.uci.edu/ml/datasets/iris> [Diakses 22 November 2019]

MA, L., GU, L., LI, B., MA, Y., & WANG, J. (2015). An Improved K-means Algorithm based on Mapreduce and Grid. International Journal of Grid and Distributed Computing, 8(1), 189–200. https://doi.org/10.14257/ijgdc.2015.8.1.18

MAULIK, U., & BANDYOPADHYAY, S. (2002). Performance evaluation of some clustering algorithms and validity indices. IEEE Transactions on Pattern Analysis and Machine Intelligence, 24(12), 1650–1654. https://doi.org/10.1109/TPAMI.2002.1114856

PRATAMA, I. P. A., & HARJOKO, A. (2017). Penerapan Algoritma Invasive Weed Optimnization untuk Penentuan Titik Pusat Klaster pada K-Means. IJCCS (Indonesian Journal of Computing and Cybernetics Systems), 9(1), 65. https://doi.org/10.22146/ijccs.6641

SEGNERI, C. (2017). K-Means Clustering. Tersedia

di:<https://rpubs.com/cjsegneri/kmeansclustering> [Diakses 22 November 2019]

SEPUTRA, K. A., SUDARMA, I. M., & JASA, L. (2017). The Optimization of the Dynamic K-Means Clustering Algorithm with the Cluster Initialization in Grouping Travelers Perception to the Beach Tourist Destinations in Bali , Indonesia. International Journal of Research in IT, Management and Engineering, ISSN 2249-1619, 07(04), 1–7.

SHAFEEQ B M, A., & K S, H. (2012). Dynamic Clustering of Data with Modified K-Means Algorithm. International Conference on Information and Computer Networks (ICICN 2012), 27(Icicn), 221–225. https://doi.org/10.13140/2.1.4972.3840

SUNITHA, L., BALRAJU, M., SASIKIRAN, J., & RAMANA, E. V. (2014). Automatic Outlier Identification in Data Mining Using IQR in Real-Time Data. 3(6), 7255–7257.

WU, J. (2012). Advances in K-means Clustering. 1–16. https://doi.org/10.1007/978-3-642-29807-3

YADAV, R., & SHARMA, A. (2012). Advanced methods to improve performance of k-means algorithm: A review. Global Journal of Computer Science and Technology, 12(9), 47–51.

Diterbitkan

02-12-2020

Terbitan

Bagian

Ilmu Komputer

Cara Mengutip

Penerapan Algoritma Pillar Untuk Inisialisasi Titik Pusat K-Means Klaster Dinamis. (2020). Jurnal Teknologi Informasi Dan Ilmu Komputer, 7(6), 1213-1220. https://doi.org/10.25126/jtiik.2020762538