K-Means Clustering untuk Data Kecelakaan Lalu Lintas Jalan Raya di Kecamatan Pelaihari

Penulis

Winda Aprianti, Jaka Permadi

Abstrak

Kecelakaan lalu lintas di jalan raya masih menjadi penyumbang tingginya angka kematian di Indonesia, sehingga menjadi perhatian khusus bagi kepolisian di negara ini. Termasuk Kepolisian Resor (Polres) Tanah Laut, yang telah membuktikan perhatian tersebut dengan membentuk komunitas korban kecelakaan lalu lintas dan Pelatihan Pertolongan Pertama Gawat Darurat (PPGD). Tahapan awal pencegahan kecelakaan lalu lintas adalah dengan mengetahui faktor-faktor penyebab kecelakaan lalu lintas yang diperoleh melalui analisa data kecelakaan. Analisa tersebut dapat dilakukan dengan data mining, yaitu K-Means Clustering. K-Means Clustering mengelompokkan data menjadi beberapa cluster sesuai karakteristik data tersebut. Data kecelakaan lalu lintas dibagi menjadi 2 dataset, yakni dataset 1 dan dataset 2. Hasil cluster penerapan K-means clustering terhadap dataset 1 dan dataset 2 kemudian dilakukan pengujian silhoutte coefficient untuk mencari hasil cluster dengan kualitas terbaik. Pengujian silhoutte coefficient secara berurutan menghasilkan distance measure paling optimal yakni clustering dengan 4 cluster untuk dataset 1 dan clustering dengan 2 cluster untuk dataset 2. Selain memperoleh cluster dengan kualitas terbaik, penganalisaan data juga menghasilkan beberapa informasi kecelakaan lalu lintas yang sering terjadi, yakni faktor penyebab dan korban kecelakaan adalah pengemudi, umur korban adalah 9 sampai 28 tahun, dan keadaan korban kecelakaan adalah luka ringan.

 

Abstract

Traffic accidents on the highway are still contribute to the high mortality rate in Indonesia, which are becoming a special concern for the police. Including the Police of Tanah Laut Resort where prove themselves by established The Community of Traffic Accident Victims and Emergency First Aid Training. The first prevention of traffic accidents is knowing the factors causing traffic accidents which is obtained through the analysis of traffic accident’s data. It can be done through data mining, i.e. K-Means Clustering, which is clustering data into clusters according to characteristics of the data. Traffic accident data is divided into two datasets, namely dataset 1 and dataset 2. After obtaining the cluster results, the next step is to calculate silhoutte coefficient which is used to find the best quality cluster result. The result of testing silhoutte coefficient are clustering with 4 clusters for dataset 1 and clustering with 2 clusters for dataset 2. Analyzing data in this research also produces some information on traffic accidents that often occur, namely the causes and victims of accidents are drivers, the age of the victims is between 9 and 28 years old, and the circumstance of the accidents victims are minor injuries.

Kata Kunci


k-means; clustering; kecelakaan; lalu lintas; silhoutte coefficient

Teks Lengkap:

PDF


DOI: http://dx.doi.org/10.25126/jtiik.2018551113