Klasifikasi Kebutuhan Jumlah Produk Makanan Customer Menggunakan K-Means Clustering dengan Optimasi Pusat Awal Cluster Algoritma Genetika

Penulis

Yudi Istianto, Shofwatul 'Uyun

Abstrak

PT. Harum Bakery adalah salah satu perusahaan di Yogyakarta yang bergerak pada bidang produksi dan distribusi produk makanan roti. Setiap konsumen memiliki jumlah kebutuhan roti yang tidak teratur, sedangkan roti hanya dapat bertahan dalam waktu dua hari. Roti yang sudah berusia lebih dari dua hari akan diganti dengan yang baru oleh distributor, sehingga dapat menimbulkan kerugian bagi perusahaan. Penelitian ini mencoba untuk melakukan data mining dengan tujuan mengklasifikasikan jumlah produk makanan kepada customer menggunakan k-means clustering dengan optimasi pusat awal cluster algoritma genetika. Pada penelitian ini digunakan 210 data dari penjualan produk selama tiga minggu. Data tersebut akan diproses dengan menerapkan metode data mining melalui tahap preprocessing kemudian tahap klasifikasi. Preprocessing yang dilakukan antara lain, data transformation dan k-means clustering. Hasil dari clustering yang membutuhkan aturan tertentu lebih efektif dengan optimasi karena dari 210 data terdapat 200 data yang layak masuk tahap klasifikasi. Hasil dari pengujian mendapatkan akurasi terbaik sebesar 58.50 % dan crossvalidation untuk lima fold berhasil mendapatkan rata-rata akurasi sebesar 50.58% lebih besar 2.51 % dari KNN tanpa preprocessing.

Abstract

PT. Harum Bakery is one of the companies in Yogyakarta engaged in the production and distribution of bakery food products. Every consumer has an irregular amount of bread needs while bread can only last for two days. Bread that is more than two days old will be replaced by a new one by the distributor which causes losses for the company. This study tries to apply data mining to classify the number of customer needs for food products using k-means clustering with optimization initial cluster center genetic algorithm. In this study used 210 data from product sales for three weeks. Data will be processed by applying data mining method with preprocessing before going through classification. Preprocessing includes data transformation and k-means clustering. The results of clustering that require certain rules are more effective with optimization because 210 data have 200 data that are worth entering the classification stage. The results of the test get the best accuracy of 58.50% and crossvalidation for five fold managed to get an average accuracy of 50.58% greater than 2.51% of KNN without preprocessing.

Teks Lengkap:

PDF

Referensi


UYUN, S., & HARTATI, S. 2011. Penentuan Komposisi Bahan Pangan Untuk Diet Penyakit Ginjal dan Saluran Kemih dengan Algoritma Genetika. Seminar Nasional. Retrieved from http://journal.uii.ac.id/index.php/Snati/article/view/2196

ARANDA, J., & NATASYA, W. A. G. 2016. Penerapan Metode K-Means Cluster Analysis Pada Sistem Pendukung Keputusan Pemilihan Konsentrasi Untuk Mahasiswa International Class Stmik Amikom Yogyakarta. Semnasteknomedia Online, 4(1), 4-2–1.

ASRONI, A., FITRI, H., & PRASETYO, E. 2018. Penerapan Metode Clustering dengan Algoritma K-Means pada Pengelompokkan Data Calon Mahasiswa Baru di Universitas Muhammadiyah Yogyakarta (Studi Kasus: Fakultas Kedokteran dan Ilmu Kesehatan, dan Fakultas Ilmu Sosial dan Ilmu Politik). Semesta Teknika, 21(1), 60–64. https://doi.org/10.18196/st.211211

BADRUL, M. 2016. Optimasi Neural Network Dengan Algoritma Genetika Untuk Prediksi Hasil Pemilukada. Bina Insani ICT Journal, 3421, 229–242.

CANTÚ-PAZ, E. 2003. Preface. Lecture Notes in Computer Science (Including Subseries Lecture Notes in Artificial Intelligence and Lecture Notes in Bioinformatics), 2724(May 2014), VII–IX. https://doi.org/10.1007/3-540-45110-2

GEN, M., & CHENG, R. 1999. Genetic Algorithms and Engineering Optimization. Genetic Algorithms and Engineering Optimization. https://doi.org/10.1002/9780470172261

JAVA, C., WISDAYANI, D. S., NUR, I. M., WASONO, R., & SEMARANG, U. M. (n.d.). Penerapan Algoritma K-Nearest Neighbor dalam Klasifikasi Tingkat Keparahan Korban Kecelakaan Lalu Lintas di Kabupaten Jawa Tengah. 373–380.

MU’ASYAROH, F. L., & MAHMUDY, W. F. 2016. Implementasi Algoritma Genetika Dalam Optimasi Model AHP dan Topsis Untuk Penentuan Kelayakan Pengisian Bibit Ayam Broiler di Kandang Peternak. Jurnal Teknologi Informasi Dan Ilmu Komputer, 3(4), 226. https://doi.org/10.25126/jtiik.201634206

PRATAMA, R. A., DJAMAL, E. C., & KOMARUDIN, A. 2017. Optimalisasi Pengantaran Barang dalam Perdagangan Online Menggunakan Algoritma Genetika. Seminar Nasional Aplikasi Teknologi Informasi (SNATi), pp. 11–15.

RANDY, L. H., & SUE, E. H. 2004. Practical Genetic Algorithms. New York: Wiley & Sons, Inc, 50, 62.

RUSTIYAN, R., & MUSTAKIM, M. 2018. Penerapan Algoritma Fuzzy C Means untuk Analisis Permasalahan Simpanan Wajib Anggota Koperasi. Jurnal Teknologi Informasi Dan Ilmu Komputer, 5(2), 171. https://doi.org/10.25126/jtiik.201852605

SOKOLOVA, M., JAPKOWICZ, N., & SZPAKOWICZ, S. 2006. Beyond accuracy, F-score and ROC: A family of discriminant measures for performance evaluation. Australasian Joint Conference on Artificial Intelligence, WS-06-06(c), 24–29.

WICAKSONO, S. A. 2019. Optimasi Sistem Penempatan Magang Menerapkan Algoritme Genetika. Jurnal Teknologi Informasi Dan Ilmu Komputer, 6(1), 17. https://doi.org/10.25126/jtiik.201961950

WIDIARINA. 2013. Algoritma Cluster Dinamik Untuk Optimasi Cluster Pada Algoritma K-Means Dalam Pemetaan Nasabah Potensial Algoritma Cluster Dinamik Untuk Optimasi Cluster Pada Algoritma K-Means Dalam. Tesis Magister Ilmu Komputer, Nusa Mandiri, 1(1), 33–36.

WON YOON, J., & FRIEL, N. 2015. Efficient model selection for probabilistic K nearest neighbour classification. Neurocomputing, 149(PB), 1098–1108. https://doi.org/10.1016/j.neucom.2014.07.023

XU, S. 2010. An expectation-maximization algorithm for the Lasso estimation of quantitative trait locus effects. Heredity, 105(5), 483–494. https://doi.org/10.1038/hdy.2009.180




DOI: http://dx.doi.org/10.25126/jtiik.2021842990