K-Modes Clustering untuk Mengetahui Jenis Masakan Daerah yang Populer pada Website Resep Online (Studi Kasus: Masakan Banjar di cookpad.com)

Penulis

  • Fatma Indriani Program Studi Ilmu Komputer Universitas Lambung Mangkurat
  • Irwan Budiman Universitas Lambung Mangkurat

DOI:

https://doi.org/10.25126/jtiik.201744548

Kata Kunci:

data mining, clustering, k-modes, resep masakan, bahan

Abstrak

Abstrak

Pada makalah ini dipaparkan clustering pada data resep masakan daerah Banjar untuk mengetahui jenis makanan yang paling banyak di-post secara online oleh pengguna website recipe sharing. Pertama-tama data resep sebanyak 355 dikumpulkan dari suatu website resep, untuk selanjutnya dilakukan ekstraksi data bahan dan pembersihan. Metode clustering yang dipilih adalah k-modes karena cocok digunakan pada data kategorikal. Berdasar metode Elbow, jumlah cluster yang ideal adalah k=4 dan k=8. Jumlah cluster k=4 menghasilkan kelompok yang lebih umum, sedangkan k=8 menghasilkan kelompok yang lebih spesifik. Adapun kelompok yang berhasil diidentifikasi untuk k=4 adalah sayur asam, soto banjar, masakan gurih lain-lain, kue dan bubur manis. Sedangkan kelompok dengan jumlah cluster k=8 adalah sayur asam, soto banjar, kue basah, masakan gurih lain-lain, masak habang, bubur manis, kuah ketupat, dan masakan gurih asam. Evaluasi nilai purity menunjukkan nilai masing-masing 0,825 untuk k=4 dan 0,831 untuk k=8.

Kata kunci: data mining, clustering, k-modes, resep masakan, bahan


Abstract

In this paper, we cluster user-submitted recipes of Banjar regional cuisine to find out which type of cuisine are popular according to its ingredients. 355 recipes are collected from a recipe sharing website, then the ingredients extracted and cleaned. The clustering method chosen is k-modes because it is suitable for categorical data. Based on the Elbow method, the ideal number of clusters is k = 4 and k = 8. The number of clusters k = 4 produces more general cuisines group, whereas k = 8 produces more specific groups. The groups identified for k = 4 are (1) “sayur asam” (sour soup), (2)“soto banjar” (Banjar chicken soup), (3) savory dishes, and (4) sweet dishes. While the group with the number of clusters k = 8 consists of (1)“sayur asam” (sour soup)  (2) “soto banjar”, (3) Banjar sweet puddings, (4) various savory dishes, (5) “masak habang” (Banjar sweet chili dishes), (6) sweet porridge, (7) “kuah ketupat” (spicy coconut soup) and (8) various savory sour dishes. The purity of clusters are shown to be 0.825 for k=4 and 0.831 for k=8.

Keywords: clustering, k-modes, data mining, recipe, ingredient

Downloads

Download data is not yet available.

Referensi

AHN, Y., AHNERT, S. E., BAGROW, J. P., & BARABÁSI, A. 2011. Flavor Network And The Principles Of Food Pairing. Sci. Rep. 1. doi:10.1038/srep00196.

GOUTTE, C., TOFT, P., ROSTRUP, E., NIELSEN, F. A., & HANSEN, L. K. 1999. On Clustering fMRI Time Series. NeuroImage. 9 (3): 298–310. doi:10.1006/nimg.1998.0391.

HUANG, Z. 1998. Extensions to the k-Means Algorithm for Clustering Large Data Sets with Categorical Values. Data Mining and Knowledge Discovery, 2(3), 283–304.

JAIN, ANUPAM, RAKHI N K, & BAGLER, G.. 2015. Spices Form The Basis Of Food Pairing In Indian Cuisine. Arxiv.Org.

RUFAIDA, S. 2016. Klasifikasi Resep Makanan Pendamping Air Susu Ibu (MPASI) Dengan Metode Decision Tree ID3 Berdasarkan Bahan Makanan. Skripsi, Universitas Sebelas Maret.

SBS FOOD,. 2014. About Indonesian Food. Food. Diakses 20/05/2016.

STEINBACH, M., KARYPIS, G. & KUMAR, V. 2000. A comparison of document clustering techniques. KDD workshop on text mining (Vol. 400, No. 1, pp. 525-526).

SU, HAN, SHAN, M. K., LIN, T. W., CHANG, J., & LI, C. T. 2014. Automatic Recipe Cuisine Classification By Ingredients. Proceedings Of The 2014 ACM International Joint Conference On Pervasive And Ubiquitous Computing Adjunct Publication - Ubicomp '14 Adjunct. doi:10.1145/2638728.2641335.

TAN, P.-N., STEINBACH, M., & KUMAR, V. 2005. Introduction to Data Mining. Addison-Wesley Longman Publishing Co., Inc., Boston, MA, USA.

ZHU, YU-XIAO, HUANG, J., ZHANG, Z.K., ZHANG, Q. M, ZHOU, T., & AHN, Y. Y. 2013. Geography And Similarity Of Regional Cuisines In China. Plos ONE 8 (11): e79161. doi:10.1371/journal.pone.0079161.

Unduhan

Diterbitkan

31-12-2017

Terbitan

Bagian

Ilmu Komputer

Cara Mengutip

K-Modes Clustering untuk Mengetahui Jenis Masakan Daerah yang Populer pada Website Resep Online (Studi Kasus: Masakan Banjar di cookpad.com). (2017). Jurnal Teknologi Informasi Dan Ilmu Komputer, 4(4), 290-296. https://doi.org/10.25126/jtiik.201744548