TF-IDF-Enhanced Genetic Algorithm Untuk Extractive Automatic Text Summarization

Penulis

Dhimas Anjar Prabowo, Muhammad Fhadli, Mochammad Ainun Najib, Handika Agus Fauzi, Imam Cholissodin

Abstrak

Abstrak

Penelitian ini mengusulkan sebuah implementasi terkait dengan automasi peringkasan teks bertipe ekstraktif dengan menggunakan metode TF-IDF-EGA. Dimana dalam permasalahan peringkasan teks dibutuhkan suatu solusi untuk meringkas teks dengan kalimat ringkasan yang dapat merepresentasikan keseluruhan teks yang ada. Algoritma TF-IDF dikenal mampu untuk menghasilkan ringkasan teks berdasarkan skor yang didapat pada setiap kalimat dalam teks. Namun hasil dari TF-IDF terkadang didapati hasil ringkasan yang terdiri dari kalimat yang tidak deskriptif, hal ini dikarenakan dalam peringkasannya TF-IDF hanya memilih beberapa kalimat yang memiliki skor tertinggi dan biasanya kalimat dengan skor tertinggi merupakan kalimat yang berisi kata-kata penting/kata-kata ilmiah tertentu sehingga kalimatnya tidak deskriptif. Algoritma EGA mampu untuk mengatasi permasalahan tersebut dengan cara memilih kalimat ringkasan yang memiliki nilai probabilitas tertentu sebagai hasil peringkasan teks.

Kata kunci: peringkasan teks, automasi ekstraktif, TF-IDF, EGA, algoritma evolusi, meta-heuristik.

Abstract

This research proposed an implementation related to extractive automatic text summarization using TF-IDF-EGA method. Which in summarization problem required a solution to summarize text with a sentence summary that could represent the whole data text. TF-IDF algorithm was usually known to be used for generating summary by its sentence scores. However the result from TF-IDF tends to generate a summary that consist of non descriptive sentences, this is due its summarize that only choose sentences with maximum score and usually sentences with maximum score is consist of significant words on a form of scientific word. EGA could solve this problem by choosing summary by its sentence probability values as a the whole text summary.

Keywords: text summarization, extractive automation, TF-IDF, EGA, evolutionary algorithm, meta-heuristic.

Teks Lengkap:

PDF (English)

Referensi


MEENA, K.Y. & GOPALANI, D., 2015. Evolutionary Algorithms for Extractive Automatic Text Summarization. Intelligent Computing, Communication & Convergence, (48), pp.244-49.

KIANI, A. & AKBARZADEH, M.R., 2006. Automatic Text Summarization Using: Hybrid Fuzzy GA-GP. Fuzzy Systems, pp.977-83.

GHAREB, A.S., BAKAR, A.A. & HAMDAN, R.A., 2015. Hybrid feature selection based on enhanced genetic algorithm for text categorization. Expert Systems With Applications, (49), pp.31-47.

FHADLI, M., PRABOWO, D.A. & PRASETYA, A., 2016. Pencarian Senyawa Dalam Tumbuhan Herbal dan Search Engine Senyawa Tumbuhan Dengan Summarization Menggunakan Metode TF-IDF. Laporan KKN. Malang: Universitas Brawijaya Program Studi Teknik Informatika.

ABUOBIEDA, A., SALIM, N., BINWAHLAN, M.S. & OSMAN, A.H., 2013. Differential Evolution Cluster-based Text Summarization Methods. International Conference On Computing, Electrical and Electronic Engineering (ICCEEE), pp.244-48.

BABAR, S.A. & PATIL, P.D., 2015. Improving Performance of Text Summarization. International Conference on Information and Communication Technologies (ICICT 2014), (46), pp.354–63.

SARANYAMOL, C.S. & SINDHU, L., 2014. A Survey on Automatic Text Summarization. International Journal of Computer Science and Information Technologies, 5(6), pp.7889-93.




DOI: http://dx.doi.org/10.25126/jtiik.201633217