Algoritma Naive Bayes untuk Klasifikasi Sumber Belajar Berbasis Teks pada Mata Pelajaran Produktif di SMK Rumpun Teknologi Informasi dan Komunikasi

Penulis

  • Admaja Dwi Herlambang Fakultas Ilmu Komputer, Universitas Brawijaya
  • Satrio Hadi Wijoyo Pendidikan Teknologi Informasi, Fakultas Ilmu Komputer, Universitas Brawijaya

DOI:

https://doi.org/10.25126/jtiik.2019641323

Abstrak

Salah satu komponen esensial dalam kegiatan pembelajaran di Sekolah Menengah Kejuruan Rumpun Teknologi Informasi dan Komunikasi (SMK TIK) adalah ketersediaan sumber belajar mata pelajaran produktif. Media internet atau online adalah sumber belajar yang berbentuk media elektronik yang dapat dimanfaatkan oleh siswa dan guru melalui jaringan internet. Salah satu bentuk media online adalah halaman web berformat .html (Hypertext Markup Language) yang berupa dokumen teks sangatlah banyak. Sehingga sumber belajar tersebut perlu di kelompokkan berdasarkan kriteria atau ciri esensial setiap mata pelajaran produktif di SMK TIK. Proses pengelompokkan menggunakan algoritma Naive Bayes karena algoritma tersebut dapat digunakan untuk dokumen teks dan menggunakan teorema Bayes dengan menganggap semua atribut saling tidak berhubungan. Tujuan penelitian ini adalah untuk mendeskripsikan hasil klasifikasi dan evaluasi kualitas klasifikasi sumber belajar berbasis teks dengan menggunakan Algoritma Naïve Bayes. Tahapan penelitian yang dilakukan adalah pengoleksian data set, pemrosesan awal dengan text mining, pembobotan Tf-Idf, pengklasifikasian Naïve Bayes, dan evaluasi akurasi. Pengklasifikasian teks menghasilkan sembilan kelompok mata pelajaran produktif dan pengujian menghasilkan nilai akurasi tertinggi 81,48%, sedangkan nilai akurasi terendah sebesar 79,63%.

 

Abstract

The availability of learning resources for productive subjects is one of the essential components in learning activities for Vocational High Schools, especially for Information and Communication Technology competence field. Internet or online media is a learning resource in the form of electronic media that can be used by students and teachers through the internet. One form of online media is a web page formatted in .html (Hypertext Markup Language) in the form of very many text documents. So that learning resources need to be grouped based on the essential criteria or characteristics of each productive subject in Vocational High Schools. The grouping process uses the Naive Bayes algorithm because the algorithm can be used to text documents and use the Bayes theorem by assuming all attributes are mutually unrelated. The purpose of the study was to describe the results of the classification and classification quality evaluation of text-based learning sources using the Naïve Bayes Algorithm. The stages of the research carried out are collecting data sets, pre-processing with text mining, Tf-Idf weighting, Naïve Bayes classifying, and accuracy evaluation. Text classification results shows that there are nine productive subject groups and based on uji results shows that the highest accuracy value was 81,48%, while the lowest accuracy value was 79,63%.

Downloads

Download data is not yet available.

Referensi

AGUSTA, L., KRISTEN, U., & WACANA, S. 2009. Perbandingan Algoritma Stemming Porter Dengan Algoritma Nazief & Adriani Untuk Stemming Dokumen Teks Bahasa Indonesia. Konferensi Nasional Sistem dan

Informatika 2009, (KNS&I09-036), pp.196–201.

ALLAN, J., KUMARAN, G., & STORAGE, H.I. 2003. Stemming in the Language Modeling Framework. (June), pp.455–456.

CHANDRA, D. N., INDRAWAN, G., & SUKAJAYA, I.N. 2016. Klasifikasi Berita Lokal Radar Malang menggunakan Metode Naive Bayes dengan Atribut N-Gram. Jurnal Ilmiah Teknologi dan Informasi ASIA (JITIKA). 10(1): hlm. 11-19.

FELDMAN, R., & JAMES, S. 2006. The Text mining Handbook: Advanced Approaches in Analyzing Unstructured Data. Cambridge: Cambridge University Press.

HAMZAH, A. 2012. Klasifikasi Teks dengan Naive Bayes Classifier (NBC) untuk Pengelompokkan Teks Berita dan Abstract Akademis. Prosiding Seminar Nasional Aplikasi Sains & Teknologi (SNAST) Periode III. ISSN : 1979-9111, Vol. 3.

HILLIER, Y. 2005. Reflective Teaching in Further and Adult Education: Second Edition. London: Continuum. KURIKULUM. 2017. Kompetensi Inti dan Kompetensi Dasar (KI & KD) SMK/MAK, (Online), (http://psmk.kemdikbud.go.id/kikd2017), diakses 1 Februari 2017.

MALMI, L. & KORHONEN, A. 2008. Active Learning and Examination Methods in a Data Structures and Algorithms Course. Dalam Caspersen, E. M. & Kolling, M. (Eds.). Reflections on the Teaching of

Programming: Methods and Implementions (hlm. 210-227). Berlin: Springer.

NURJANAH, M., HAMDANI, & ASTUTI, I. F. 2013. Penerapan Algoritma Item

Frequency-Inverse Document Frequency (TF-IDF) untuk Text mining. Jurnal Informatika Mulawarman. 8 (3): hlm. 110-113.

TORUNOǦLU, D., ÇAKIRMAN, E., GANIZ, M.C., AKYOKUŞ, S., & GÜRBÜZ, M.Z. 2011. Analysis Of Preprocessing Methods On Classification of Turkish Texts. INISTA 2011 - 2011 International Symposium on

INnovations in Intelligent SysTems and Applications, pp.112–117.

YUAN, L. 2010. An Improved Naive Bayes Text Classification Algorithm In Chinese Information Processing. Proceedings of the Third International Symposium on Computer Science and Computational Technology (ISCSCT ’10), Jiaozuo, P. R. China, 14-15, August 2010, pp. 267-269.

Diterbitkan

15-07-2019

Terbitan

Bagian

Ilmu Komputer

Cara Mengutip

Algoritma Naive Bayes untuk Klasifikasi Sumber Belajar Berbasis Teks pada Mata Pelajaran Produktif di SMK Rumpun Teknologi Informasi dan Komunikasi. (2019). Jurnal Teknologi Informasi Dan Ilmu Komputer, 6(4), 430-435. https://doi.org/10.25126/jtiik.2019641323