Klasifikasi Berita Olahraga Menggunakan Metode Naïve Bayes dengan Enhanced Confix Stripping Stemmer

Penulis

  • Yoga Dwitya Pramudita Teknik Informatika Fakultas Teknik Universitas Trunojoyo
  • Sigit Susanto Putro Prodi Teknik Informatika Universitas trunojoyo
  • Nurul Makhmud

DOI:

https://doi.org/10.25126/jtiik.201853810

Kata Kunci:

Klasifikasi, Berita Olahraga, Naïve Bayes Classifier, Enhance Confix Stripping Stemmer

Abstrak

Dokumen berita olahraga dalam bentuk web kini memiliki jumlah yang besar dalam kurun waktu singkat. Untuk kemudahan akses dokumen perlu melakukan pengelompokan dokumen berita kedalam beberapa kategori. Hal tersebut bertujuan agar berita olahraga tersusun sesuai dengan kategori yang ditentukan. Berita dapat dikelompokkan secara manual oleh manusia, akan tetapi hal tersebut membutuhkan waktu yang lama untuk melakukan kategorisasi. Metode klasifikasi diusulkan dalam penelitian ini untuk melakukan pengkategorian secara otomatis dokumen berita. Tujuan dilakukannya klasifikasi adalah untuk mempercepat dan mempermudah dalam pemberian kategori, sehingga dapat meningkatkan efisiensi waktu. Pada penelitian ini menggunakan metode klasifikasi Naïve Bayes Classifier. Sebelum dilakukan klasifikasi ada proses preprocessing dengan menggunakan Enhanced Confix Striping Stemmer.  Hal ini bertujuan untuk mengembalikan ke bentuk kata dasar, sehingga data berkurang dan proses komputasi menjadi lebih efisien. Pengujian dilakukan menggunakan 18 berita olahraga yang dipilih secara acak oleh user atau tester, dari 18 berita yang diujikan terdapat 14 berita yang bernilai benar atau relevan dengan analisis yang dilakukan use atau tester pada berita uji. Dari penelitian ini dapat disimpulkan bahwa Aplikasi Klasifikasi Berita Olahraga menggunakan Metode Naïve Bayes dengan Enhanced Confix Striping Stemmer mampu mengklasifikasi berita olahraga sesuai dengan kategori masing-masing, seperti Sepak Bola, Basket, Raket, Formula 1, Moto GP dan olahraga lainnya dengan keakuratan sebesar 77%.

 

Abstract

 

Web-based sports news currently has a considerable amount of documents. News documents need to be grouped into multiple categories for easy access. The goal is that sports news is structured according to the specified category. News can be grouped manually by humans, but it takes a long time to categorize if it involves large documents. Classification method is proposed in this research to categorize automatically news document. The purpose of doing the classification is to accelerate and simplify the granting of categories, thereby increasing the efficiency of time. In this research using the Naïve Bayes Classifier classification method. Prior to classification there is a preprocessing process using Enhanced Confix Striping Stemmer. It aims to return to the basic word form, so the data is reduced and the computing process becomes more efficient. From the test using 18 sports news randomly selected by the user or tester, there are 14 news stories that are true or relevant to the analysis by the user or the tester on the test news. This study concludes that the Sports News Classification Application using the Naïve Bayes Method with Enhanced Confix Striping Stemmer is able to classify sports news according to their respective categories, such as Football, Basket, Racquet, Formula 1, Moto GP and other sports with accuracy of 77%.

Downloads

Download data is not yet available.

Referensi

THOMAS M. CONNOLY., CAROLYN E. BEGG. 2015. Database System : A Practical Approach to Design, Implementation, and Management.

JIAWEI HAN., MICHELINE KAMBER. 2000. Data Mining : Concepts and Techniques.

TRIAWATI., CHANDRA. 2009. Metode Pembobotan Statistical Concept Based untuk Klastering dan Kategorisasi Dokumen Berbahasa Indonesia. Institut Teknologi Telkom, Bandung.

I PUTU ADI DKK. 2008. Penggunaan Algoritma Semut Dan Confix Stripping Stemmer Untuk Klasifikasi Dokumen Berita Berbahasa Indonesia.

FRIEDMAN ET AL. 1997. Bayesian Network Classifiers., Volume 29, Issue 2–3, pp 131–163.

ABRAHAM, R.., SIMHA, J.B. & IYENGAR, S. 2009. Effective Discretization and Hybrid Feature Selection Using Naïve Bayesian Classifier For Medical Data Mining. International Journal of Computational Intelligence Research 4

ZGAN & GAO. 2011. An Improvement to Naive Bayes for Text Classification.

MUKHERJEE & SHARMAA. 2012. Intrusion Detection using Naive Bayes Classifier with Feature Reduction. A Department of Computer Science, Banasthali University, Jaipur, Rajasthan, 304022, India.

EAMONN KEOGH, Naïve Bayes Classifier.

BAGUS SETYA RINTYARNA. 2016. Pengaruh Seleksi Fitur Pada Skema Klasifikasi Naive Bayes Berbasis Gaussian dan Kernel Density. Volume 01, Nomor 01.

DWI WIDIASTUTI. 2012. Analisa Perbandingan Algoritma Svm, Naive Bayes, Dan Decision Tree Dalam Mengklasifikasikan Serangan (Attacks) Pada Sistem Pendeteksi Intrusi. Universitas Gunadarma.

DENNY NATHANIEL CHANDRA., GEDE INDRAWAN., I NYOMAN SUKAJAYA. 2016. Klasifikasi Berita Lokal Radar Malang Menggunakan Metode Naïve Bayes Dengan Fitur N-Gram. Vol. 10, No. 1.

NOVIA BUSIARLI., LIAN AGA ADITYA., ALBERTUS YOKI ANDIKA. 2016. Penerapan Algoritma Naïve Bayes & Natural Language Processing Untuk Mengklasifikasi Jenis Berita Pada Arsip Pemberitaan.

DIO ARIADI., KARTIKA FITHRIASARI. 2015. Klasifikasi Berita Indonesia Menggunakan Metode Naïve Bayesian Classification dan Support Vector Machine dengan Confix Stripping Stemmer. Vol. 4. No.2.

ACMAD NURHADI. 2016. Implementasi Algoritma Naïve Bayes Classifier Berbasis Particle Swarm Optimization (PSO) Untuk Klasifikasi Konten Berita Digital Bahasa Indonesia. Volume 8 No 3.

YOSEPH SAMUEL., ROSA DELIMA., ANTONIUS RACHMAT. 2015. Implementasi Metode K-Nearest Neighbor dengan Decision Rule untuk Klasifikasi Subtopik Berita.

RONEN FELDMAN., JAMES SANGER. 2007. The Text Mining Handbook : Advanced Approaches in Analyzing Unstructured Data.

ELLY MUNINGSIH. 2016. Klasifikasi Konten Berita Digital Bahasa Indonesia Menggunakan Support Vector Machines (SVM) Berbasis Particle Swarm Optimization (PSO). AMIK BSI Yogyakarta.

MUHAMAD RACHLI. 2007. Email Filtering Menggunakan Naïve Bayesian. Institut Teknologi Bandung.

AGUS SETIAWAN., INDAH FITRI ASTUTI., AWANG HARSA KRIDALAKSANA. 2015. Klasifikasi dan Pencarian Buku Referensi Akademik Menggunakan Metode Naïve Bayes Classifier (NBC). Vol. 10 No.

ANDITA DWIYOGA TAHITOE., DIANA PURWITASARI. 2010. Implementasi Modifikasi Enhanced Confix Stripping Stemmer Untuk Bahasa Indonesia Dengan Metode Corpus Based Stemming.

DIAH PUDI LANGGENI1., ZK. ABDURAHMAN BAIZAL., YANUAR FIRDAUS A.W. 2010. Clustering Artikel Berita Berbahasa Indonesia Menggunakan Unsupervised Feature Selection.

MCCALLUM., NIGAM. 1998. A Comparison of Event Models for Naive Bayes Text Classification.

MUHAMAD, HUSIN et al. Optimasi Naïve Bayes Classifier Dengan Menggunakan Particle Swarm Optimization Pada Data Iris. Jurnal Teknologi Informasi dan Ilmu Komputer, [S.l.], v. 4, n. 3, p. 180-184, sep. 2017. ISSN 2528-6579.

Diterbitkan

10-08-2018

Terbitan

Bagian

Ilmu Komputer

Cara Mengutip

Klasifikasi Berita Olahraga Menggunakan Metode Naïve Bayes dengan Enhanced Confix Stripping Stemmer. (2018). Jurnal Teknologi Informasi Dan Ilmu Komputer, 5(3), 269-276. https://doi.org/10.25126/jtiik.201853810