K-Modes Clustering untuk Mengetahui Jenis Masakan Daerah yang Populer pada Website Resep Online (Studi Kasus: Masakan Banjar di cookpad.com)
DOI:
https://doi.org/10.25126/jtiik.201744548Kata Kunci:
data mining, clustering, k-modes, resep masakan, bahanAbstrak
Abstrak
Pada makalah ini dipaparkan clustering pada data resep masakan daerah Banjar untuk mengetahui jenis makanan yang paling banyak di-post secara online oleh pengguna website recipe sharing. Pertama-tama data resep sebanyak 355 dikumpulkan dari suatu website resep, untuk selanjutnya dilakukan ekstraksi data bahan dan pembersihan. Metode clustering yang dipilih adalah k-modes karena cocok digunakan pada data kategorikal. Berdasar metode Elbow, jumlah cluster yang ideal adalah k=4 dan k=8. Jumlah cluster k=4 menghasilkan kelompok yang lebih umum, sedangkan k=8 menghasilkan kelompok yang lebih spesifik. Adapun kelompok yang berhasil diidentifikasi untuk k=4 adalah sayur asam, soto banjar, masakan gurih lain-lain, kue dan bubur manis. Sedangkan kelompok dengan jumlah cluster k=8 adalah sayur asam, soto banjar, kue basah, masakan gurih lain-lain, masak habang, bubur manis, kuah ketupat, dan masakan gurih asam. Evaluasi nilai purity menunjukkan nilai masing-masing 0,825 untuk k=4 dan 0,831 untuk k=8.
Kata kunci: data mining, clustering, k-modes, resep masakan, bahan
Abstract
In this paper, we cluster user-submitted recipes of Banjar regional cuisine to find out which type of cuisine are popular according to its ingredients. 355 recipes are collected from a recipe sharing website, then the ingredients extracted and cleaned. The clustering method chosen is k-modes because it is suitable for categorical data. Based on the Elbow method, the ideal number of clusters is k = 4 and k = 8. The number of clusters k = 4 produces more general cuisines group, whereas k = 8 produces more specific groups. The groups identified for k = 4 are (1) “sayur asam” (sour soup), (2)“soto banjar” (Banjar chicken soup), (3) savory dishes, and (4) sweet dishes. While the group with the number of clusters k = 8 consists of (1)“sayur asam” (sour soup) (2) “soto banjar”, (3) Banjar sweet puddings, (4) various savory dishes, (5) “masak habang” (Banjar sweet chili dishes), (6) sweet porridge, (7) “kuah ketupat” (spicy coconut soup) and (8) various savory sour dishes. The purity of clusters are shown to be 0.825 for k=4 and 0.831 for k=8.
Keywords: clustering, k-modes, data mining, recipe, ingredient
Downloads
Referensi
AHN, Y., AHNERT, S. E., BAGROW, J. P., & BARABÁSI, A. 2011. Flavor Network And The Principles Of Food Pairing. Sci. Rep. 1. doi:10.1038/srep00196.
GOUTTE, C., TOFT, P., ROSTRUP, E., NIELSEN, F. A., & HANSEN, L. K. 1999. On Clustering fMRI Time Series. NeuroImage. 9 (3): 298–310. doi:10.1006/nimg.1998.0391.
HUANG, Z. 1998. Extensions to the k-Means Algorithm for Clustering Large Data Sets with Categorical Values. Data Mining and Knowledge Discovery, 2(3), 283–304.
JAIN, ANUPAM, RAKHI N K, & BAGLER, G.. 2015. Spices Form The Basis Of Food Pairing In Indian Cuisine. Arxiv.Org.
RUFAIDA, S. 2016. Klasifikasi Resep Makanan Pendamping Air Susu Ibu (MPASI) Dengan Metode Decision Tree ID3 Berdasarkan Bahan Makanan. Skripsi, Universitas Sebelas Maret.
SBS FOOD,. 2014. About Indonesian Food. Food. Diakses 20/05/2016.
STEINBACH, M., KARYPIS, G. & KUMAR, V. 2000. A comparison of document clustering techniques. KDD workshop on text mining (Vol. 400, No. 1, pp. 525-526).
SU, HAN, SHAN, M. K., LIN, T. W., CHANG, J., & LI, C. T. 2014. Automatic Recipe Cuisine Classification By Ingredients. Proceedings Of The 2014 ACM International Joint Conference On Pervasive And Ubiquitous Computing Adjunct Publication - Ubicomp '14 Adjunct. doi:10.1145/2638728.2641335.
TAN, P.-N., STEINBACH, M., & KUMAR, V. 2005. Introduction to Data Mining. Addison-Wesley Longman Publishing Co., Inc., Boston, MA, USA.
ZHU, YU-XIAO, HUANG, J., ZHANG, Z.K., ZHANG, Q. M, ZHOU, T., & AHN, Y. Y. 2013. Geography And Similarity Of Regional Cuisines In China. Plos ONE 8 (11): e79161. doi:10.1371/journal.pone.0079161.
Unduhan
Diterbitkan
Terbitan
Bagian
Lisensi
Artikel ini berlisensi Creative Common Attribution-ShareAlike 4.0 International (CC BY-SA 4.0)
Penulis yang menerbitkan di jurnal ini menyetujui ketentuan berikut:
- Penulis menyimpan hak cipta dan memberikan jurnal hak penerbitan pertama naskah secara simultan dengan lisensi di bawah Creative Common Attribution-ShareAlike 4.0 International (CC BY-SA 4.0) yang mengizinkan orang lain untuk berbagi pekerjaan dengan sebuah pernyataan kepenulisan pekerjaan dan penerbitan awal di jurnal ini.
- Penulis bisa memasukkan ke dalam penyusunan kontraktual tambahan terpisah untuk distribusi non ekslusif versi kaya terbitan jurnal (contoh: mempostingnya ke repositori institusional atau menerbitkannya dalam sebuah buku), dengan pengakuan penerbitan awalnya di jurnal ini.
- Penulis diizinkan dan didorong untuk mem-posting karya mereka online (contoh: di repositori institusional atau di website mereka) sebelum dan selama proses penyerahan, karena dapat mengarahkan ke pertukaran produktif, seperti halnya sitiran yang lebih awal dan lebih hebat dari karya yang diterbitkan. (Lihat Efek Akses Terbuka).