Klasifikasi Sepeda Motor Berdasarkan Karakteristik Konsumen Dengan Metode K-Nearest Neighbour Pada Big Data Menggunakan Hadoop Single Node Cluster

Penulis

Nanda Agung Putra, Ardisa Tamara Putri, Dhimas Anjar Prabowo, Listiya Surtiningsih, Raissa Arniantya, Imam Cholissodin

Abstrak

Abstrak

Penelitian ini mengusulkan sebuah klasifikasi terhadap sepeda motor berdasarkan karakteristik konsumen. Sepeda motor memiliki beberapa jenis dan merk yang berbeda sehingga menyebabkan banyaknya pilihan yang dimiliki konsumen. Konsumen akan memilih sepeda motor yang diinginkannya berdasarkan latar belakang yang berbeda. Pada penelitian ini, Konsumen akan dikelompokkan berdasarkan sepeda motor yang dibeli sehingga penjual dapat mengetahui karakteristik konsumen yang membeli suatu jenis atau merk tertentu. Karakterisitik konsumen dapat ditentukan dengan usia, jenis kelamin, pendapatan, status pernikahan dan jumlah anak. Berdasarkan karakteristik tersebut perlu dilakukan pengelompokan untuk menentukan merk sepeda motor. Dalam penelitian ini metode yang digunakan yakni K-Nearest Neighbour (K-NN). K-NN merupakan algoritma yang umum digunakan untuk klasifikasi dan mencari kelas dari data uji dengan mayoritas kelompok yang memiliki jarak terdekat. Dataset yang digunakan dalam penelitian ini yaitu karakteristik konsumen. Uji coba dengan dataset tersebut menghasilkan merk sepeda motor dari data uji yang sudah ditentukan.

Kata kunci: k-nearest neighbor, klasifikasi, k-nearest neighbor classification, sepeda motor.


Abstract

This research proposed a classification of motorcycle based on customer’s characteristics. Motorcycles have different type and brand so that customers have many choices. Customer will choose motorcycle which they want to be based on different background. In this study, the customer will be grouped by motorcycle were purchased so that the seller can know characteristics of customers who buy certain type or brand. Characteristics of customers can be determined by age, gender, income, status and number of children. Based on these characteristic, we have to group for specifying motorcycle’s type. In this research, the method used K-Nearest Neighbor (K-NN). K-NN algorithm is commonly used for classifying and searching for a group of test data with the majority of the group that has the shortest distance. The dataset used in this project is the final consumer characteristics. Trials with the dataset produce motorcycle brand of test data that has been determined.

Keywords: k-nearest neighbor, classification, k-nearest neighbor classification, motorcycle.

Teks Lengkap:

PDF (English)

Referensi


BRAMMER., 2007. Principles of Data Mining. UK: University of Portsmouth.

COSSALTER, V., 2016. Motorcycle Dynamics.

DEAN, J., & GHEMAWAT, S., 2004. MapReduce: Simplified Data Processing on Large Clusters. Google Corp.

NOUVEL, AHMAD, 2015. Klasifikasi Kendaraan Roda Empat Berbasis KNN. Jurnal Bianglala Informatika Vol 3 No 2.

PAWITRA, P. M., 2016. Paper Basis Data. Surakarta.

S., RUSSEL, & P, NORVIG., 2010. Artificial Intelligence A Modern Approach. New Jersey: Pearson Education, Inc.

X., WU, & V., KUMAR., 2009. The Top Ten Algorithm in Data Mining. Chapman and Hall.




DOI: http://dx.doi.org/10.25126/jtiik.201742242