K-Modes Clustering untuk Mengetahui Jenis Masakan Daerah yang Populer pada Website Resep Online (Studi Kasus: Masakan Banjar di cookpad.com)

Penulis

Fatma Indriani, Irwan Budiman

Abstrak

Abstrak

Pada makalah ini dipaparkan clustering pada data resep masakan daerah Banjar untuk mengetahui jenis makanan yang paling banyak di-post secara online oleh pengguna website recipe sharing. Pertama-tama data resep sebanyak 355 dikumpulkan dari suatu website resep, untuk selanjutnya dilakukan ekstraksi data bahan dan pembersihan. Metode clustering yang dipilih adalah k-modes karena cocok digunakan pada data kategorikal. Berdasar metode Elbow, jumlah cluster yang ideal adalah k=4 dan k=8. Jumlah cluster k=4 menghasilkan kelompok yang lebih umum, sedangkan k=8 menghasilkan kelompok yang lebih spesifik. Adapun kelompok yang berhasil diidentifikasi untuk k=4 adalah sayur asam, soto banjar, masakan gurih lain-lain, kue dan bubur manis. Sedangkan kelompok dengan jumlah cluster k=8 adalah sayur asam, soto banjar, kue basah, masakan gurih lain-lain, masak habang, bubur manis, kuah ketupat, dan masakan gurih asam. Evaluasi nilai purity menunjukkan nilai masing-masing 0,825 untuk k=4 dan 0,831 untuk k=8.

Kata kunci: data mining, clustering, k-modes, resep masakan, bahan


Abstract

In this paper, we cluster user-submitted recipes of Banjar regional cuisine to find out which type of cuisine are popular according to its ingredients. 355 recipes are collected from a recipe sharing website, then the ingredients extracted and cleaned. The clustering method chosen is k-modes because it is suitable for categorical data. Based on the Elbow method, the ideal number of clusters is k = 4 and k = 8. The number of clusters k = 4 produces more general cuisines group, whereas k = 8 produces more specific groups. The groups identified for k = 4 are (1) “sayur asam” (sour soup), (2)“soto banjar” (Banjar chicken soup), (3) savory dishes, and (4) sweet dishes. While the group with the number of clusters k = 8 consists of (1)“sayur asam” (sour soup)  (2) “soto banjar”, (3) Banjar sweet puddings, (4) various savory dishes, (5) “masak habang” (Banjar sweet chili dishes), (6) sweet porridge, (7) “kuah ketupat” (spicy coconut soup) and (8) various savory sour dishes. The purity of clusters are shown to be 0.825 for k=4 and 0.831 for k=8.

Keywords: clustering, k-modes, data mining, recipe, ingredient

Teks Lengkap:

PDF (English)

Referensi


AHN, Y., AHNERT, S. E., BAGROW, J. P., & BARABÁSI, A. 2011. Flavor Network And The Principles Of Food Pairing. Sci. Rep. 1. doi:10.1038/srep00196.

GOUTTE, C., TOFT, P., ROSTRUP, E., NIELSEN, F. A., & HANSEN, L. K. 1999. On Clustering fMRI Time Series. NeuroImage. 9 (3): 298–310. doi:10.1006/nimg.1998.0391.

HUANG, Z. 1998. Extensions to the k-Means Algorithm for Clustering Large Data Sets with Categorical Values. Data Mining and Knowledge Discovery, 2(3), 283–304.

JAIN, ANUPAM, RAKHI N K, & BAGLER, G.. 2015. Spices Form The Basis Of Food Pairing In Indian Cuisine. Arxiv.Org.

RUFAIDA, S. 2016. Klasifikasi Resep Makanan Pendamping Air Susu Ibu (MPASI) Dengan Metode Decision Tree ID3 Berdasarkan Bahan Makanan. Skripsi, Universitas Sebelas Maret.

SBS FOOD,. 2014. About Indonesian Food. Food. Diakses 20/05/2016.

STEINBACH, M., KARYPIS, G. & KUMAR, V. 2000. A comparison of document clustering techniques. KDD workshop on text mining (Vol. 400, No. 1, pp. 525-526).

SU, HAN, SHAN, M. K., LIN, T. W., CHANG, J., & LI, C. T. 2014. Automatic Recipe Cuisine Classification By Ingredients. Proceedings Of The 2014 ACM International Joint Conference On Pervasive And Ubiquitous Computing Adjunct Publication - Ubicomp '14 Adjunct. doi:10.1145/2638728.2641335.

TAN, P.-N., STEINBACH, M., & KUMAR, V. 2005. Introduction to Data Mining. Addison-Wesley Longman Publishing Co., Inc., Boston, MA, USA.

ZHU, YU-XIAO, HUANG, J., ZHANG, Z.K., ZHANG, Q. M, ZHOU, T., & AHN, Y. Y. 2013. Geography And Similarity Of Regional Cuisines In China. Plos ONE 8 (11): e79161. doi:10.1371/journal.pone.0079161.




DOI: http://dx.doi.org/10.25126/jtiik.201744548