Perbandingan Complexity Invariant Distance (CID) dan Dynamic Time Warping (DTW) dalam Analisis Klaster Deret Waktu pada Nilai Tukar Petani di Indonesia
DOI:
https://doi.org/10.25126/jtiik.124Kata Kunci:
Cluster time series, complexity invariant distance, dynamic time warping, farmer exchange rateAbstrak
Analisis klaster yang merupakan bagian dari data mining yang membagi data kedalam beberapa kelompok berdasarkan kedekatan karakteristik tertentu. Konsep utama dalam klaster adalah memaksimalkan kedekatan data di dalam klaster dan meminimalkan kesamaan data antar klaster. Analisis klaster juga bisa digunakan pada berbagai jenis data termasuk data deret waktu. Pengukuran kesamaan menjadi hal yang utama pada analisis klaster. Metode yang bisa digunakan dalam pengukuran jarak yaitu Complexity Invariant Distance (CID) dan Dynamic Time Warping (DTW). Analisis pengukuran jarak CID dan DTW dapat digunakan pada pengelompokkan data deret waktu salah satunya pada data Nilai Tukar Petani (NTP). NTP dapat menggambarkan daya beli petani karena diperoleh dari perbandingan indeks harga yang diterima petani dibandingkan dengan yang harus dibayarnya, atau dapat dinyatakan sebagai kemampuan petani dalam memnuhi kebutuhan sehari-hari dari hasil pertanian. Sehingga dilakukan analisis untuk membandingkan metode pengukuran jarak CID dan DTW pada klastering data deret waktu pada nilai tukar petani pada 34 Provinsi di Indonesia. Hasil analisis yang diakukan menunjukkan klaster terbaik adalah pengklasteran dengan banyak klaster dua (k=2) menggunakan ukuran jarak CID terlihat dari nilai silhouette 0.8776 yang lebih tinggi dibandingkan klaster lain. Dimana klaster satu terdiri dari 25 Provinsi dan klaster dua terdiri dari 9 Provinsi.
Abstract
Cluster analysis is a part of data mining which divides data into several groups based on the proximity of certain characteristics. The main concept in clusters is to maximize data similarity within clusters and minimize data similarity between clusters. Cluster analysis can also be used on various types of data, including time series data. Measuring similarity is the main thing in cluster analysis. The methods that can be used to measure distance are Complexity Invariant Distance (CID) and Dynamic Time Warping (DTW). CID and DTW distance measurement analysis can be used to group time series data, one of which is Farmer’s Terms of Trade (NTP) data. The farmer's terms of trade is a ratio between the price index received by farmers and the price index paid by farmers. In general, it can be interpreted as the farmer's ability to meet their daily needs through agricultural products. So an analysis was carried out to compare the CID and DTW distance measurement methods in clustering time series data on farmer’s terms of trade according to 34 provinces in Indonesia. The results of this analysis show that the best cluster is clustering with two clusters (k=2) using the CID distance measure because it has the highest silhouette coefficient value, namely 0.8776. Where cluster one consists of 25 provinces and cluster two consists of 9 provinces.
Downloads
Referensi
ABBASIMEHR, H., PAKI, R. AND BAHRINI, A., 2022. A novel approach based on combining deep learning models with statistical methods for COVID-19 time series forecasting. Neural Computing and Applications, 4, pp.3135–3149.
ADNYANI, P.W. AND SIHOMBING, L.R.P., 2021. Analisis Cluster Time Series Dalam Pengelompokan Provinsi Di Indonesia Berdasarkan Nilai PDRB. Lppm Bina Bangsa, [online] 1(1), pp.47–54.
AGHABOZORGI, S., SEYED SHIRKHORSHIDI, A. AND YING WAH, T., 2015. Time-series clustering - A decade review. Information Systems, [online] 53, pp.16–38. https://doi.org/10.1016/j.is.2015.04.007.
BATISTA, G.E.A.P.A., WANG, X. AND KEOGH, E.J., 2011. A complexity-invariant distance measure for time series. Proceedings of the 11th SIAM International Conference on Data Mining, SDM 2011, pp.699–710. https://doi.org/10.1137/1.9781611972818.60.
DING, H., TRAJCEVSKI, G., SCHEUERMANN, P., WANG, X. AND KEOGH, E., 2008. Querying and mining of time series data. Proceedings of the VLDB Endowment, 1(2), pp.1542–1552. https://doi.org/10.14778/1454159.1454226.
HAIR, J.F., BLACK, W.C. AND BABIN, B.J., 2010. Multivariate Data Analysis.
JOHNSON, R.A., and WICHERN, D.W., 2007. Applied Multivariate Statistical Analysis. US Patent 3,123,114.
KAUFMAN, L. AND ROUSSEEUW, P.J., 1990. Finding Groups in Data: An Introduction to Cluster Analysis. pp.1–67. https://doi.org/10.1002/9780470316801.ch1.
KAUFMAN, L. AND ROUSSEEUW, P.J., 2006. Finding Groups in Data: An introduction to Cluster ANalysis. Wiley-interscience. New Jersey: John Wiley & Sons.
MUNTHE, A.D., 2019. Penerapan clustering time series untuk menggerombolkan provinsi di Indonesia berdasarkan nilai produksi padi. urnal Litbang Sukowati: Media Penelitian dan Pengembangan, 2.
PAPARRIZOS, J. AND GRAVANO, L., 2017. Fast and accurate time-series clustering. ACM Transactions on Database Systems, 42(2). https://doi.org/10.1145/3044711.
RIYADI, M.A.A., PRATIWI, D.S., IRAWAN, A.R. AND FITHRIASARI, K., 2017. Clustering stationary and non-stationary time series based on autocorrelation distance of hierarchical and K-means algorithms. International Journal of Advances in Intelligent Informatics, 3(3), pp.154–160. https://doi.org/10.26555/ijain.v3i3.98.
SAKOE, H. AND CHIBA, S., 1978. Dynamic programming algorithm optimization for spoken word recognition. IEEE Transactions on Acoustics, Speech, and Signal Processing, 26(1), pp.43–49. https://doi.org/10.1109/TASSP.1978.1163055.
SHANG, D., SHANG, P. AND LIU, L., 2019. Multidimensional scaling method for complex time series feature classification based on generalized complexity-invariant distance. Nonlinear Dynamics, [online] 95(4), pp.2875–2892. https://doi.org/10.1007/s11071-018-4728-6.
WARREN LIAO, T., 2005a. Clustering of time series data - A survey. Pattern Recognition, 38(11), pp.1857–1874. https://doi.org/10.1016/j.patcog.2005.01.025.
Unduhan
Diterbitkan
Terbitan
Bagian
Lisensi
Hak Cipta (c) 2025 Jurnal Teknologi Informasi dan Ilmu Komputer

Artikel ini berlisensiCreative Commons Attribution-ShareAlike 4.0 International License.

Artikel ini berlisensi Creative Common Attribution-ShareAlike 4.0 International (CC BY-SA 4.0)
Penulis yang menerbitkan di jurnal ini menyetujui ketentuan berikut:
- Penulis menyimpan hak cipta dan memberikan jurnal hak penerbitan pertama naskah secara simultan dengan lisensi di bawah Creative Common Attribution-ShareAlike 4.0 International (CC BY-SA 4.0) yang mengizinkan orang lain untuk berbagi pekerjaan dengan sebuah pernyataan kepenulisan pekerjaan dan penerbitan awal di jurnal ini.
- Penulis bisa memasukkan ke dalam penyusunan kontraktual tambahan terpisah untuk distribusi non ekslusif versi kaya terbitan jurnal (contoh: mempostingnya ke repositori institusional atau menerbitkannya dalam sebuah buku), dengan pengakuan penerbitan awalnya di jurnal ini.
- Penulis diizinkan dan didorong untuk mem-posting karya mereka online (contoh: di repositori institusional atau di website mereka) sebelum dan selama proses penyerahan, karena dapat mengarahkan ke pertukaran produktif, seperti halnya sitiran yang lebih awal dan lebih hebat dari karya yang diterbitkan. (Lihat Efek Akses Terbuka).