TF-IDF-Enhanced Genetic Algorithm Untuk Extractive Automatic Text Summarization
DOI:
https://doi.org/10.25126/jtiik.201633217Abstrak
Abstrak
Penelitian ini mengusulkan sebuah implementasi terkait dengan automasi peringkasan teks bertipe ekstraktif dengan menggunakan metode TF-IDF-EGA. Dimana dalam permasalahan peringkasan teks dibutuhkan suatu solusi untuk meringkas teks dengan kalimat ringkasan yang dapat merepresentasikan keseluruhan teks yang ada. Algoritma TF-IDF dikenal mampu untuk menghasilkan ringkasan teks berdasarkan skor yang didapat pada setiap kalimat dalam teks. Namun hasil dari TF-IDF terkadang didapati hasil ringkasan yang terdiri dari kalimat yang tidak deskriptif, hal ini dikarenakan dalam peringkasannya TF-IDF hanya memilih beberapa kalimat yang memiliki skor tertinggi dan biasanya kalimat dengan skor tertinggi merupakan kalimat yang berisi kata-kata penting/kata-kata ilmiah tertentu sehingga kalimatnya tidak deskriptif. Algoritma EGA mampu untuk mengatasi permasalahan tersebut dengan cara memilih kalimat ringkasan yang memiliki nilai probabilitas tertentu sebagai hasil peringkasan teks.
Kata kunci: peringkasan teks, automasi ekstraktif, TF-IDF, EGA, algoritma evolusi, meta-heuristik.
Abstract
This research proposed an implementation related to extractive automatic text summarization using TF-IDF-EGA method. Which in summarization problem required a solution to summarize text with a sentence summary that could represent the whole data text. TF-IDF algorithm was usually known to be used for generating summary by its sentence scores. However the result from TF-IDF tends to generate a summary that consist of non descriptive sentences, this is due its summarize that only choose sentences with maximum score and usually sentences with maximum score is consist of significant words on a form of scientific word. EGA could solve this problem by choosing summary by its sentence probability values as a the whole text summary.
Keywords: text summarization, extractive automation, TF-IDF, EGA, evolutionary algorithm, meta-heuristic.Downloads
Referensi
MEENA, K.Y. & GOPALANI, D., 2015. Evolutionary Algorithms for Extractive Automatic Text Summarization. Intelligent Computing, Communication & Convergence, (48), pp.244-49.
KIANI, A. & AKBARZADEH, M.R., 2006. Automatic Text Summarization Using: Hybrid Fuzzy GA-GP. Fuzzy Systems, pp.977-83.
GHAREB, A.S., BAKAR, A.A. & HAMDAN, R.A., 2015. Hybrid feature selection based on enhanced genetic algorithm for text categorization. Expert Systems With Applications, (49), pp.31-47.
FHADLI, M., PRABOWO, D.A. & PRASETYA, A., 2016. Pencarian Senyawa Dalam Tumbuhan Herbal dan Search Engine Senyawa Tumbuhan Dengan Summarization Menggunakan Metode TF-IDF. Laporan KKN. Malang: Universitas Brawijaya Program Studi Teknik Informatika.
ABUOBIEDA, A., SALIM, N., BINWAHLAN, M.S. & OSMAN, A.H., 2013. Differential Evolution Cluster-based Text Summarization Methods. International Conference On Computing, Electrical and Electronic Engineering (ICCEEE), pp.244-48.
BABAR, S.A. & PATIL, P.D., 2015. Improving Performance of Text Summarization. International Conference on Information and Communication Technologies (ICICT 2014), (46), pp.354–63.
SARANYAMOL, C.S. & SINDHU, L., 2014. A Survey on Automatic Text Summarization. International Journal of Computer Science and Information Technologies, 5(6), pp.7889-93.
Unduhan
Diterbitkan
Terbitan
Bagian
Lisensi
Artikel ini berlisensi Creative Common Attribution-ShareAlike 4.0 International (CC BY-SA 4.0)
Penulis yang menerbitkan di jurnal ini menyetujui ketentuan berikut:
- Penulis menyimpan hak cipta dan memberikan jurnal hak penerbitan pertama naskah secara simultan dengan lisensi di bawah Creative Common Attribution-ShareAlike 4.0 International (CC BY-SA 4.0) yang mengizinkan orang lain untuk berbagi pekerjaan dengan sebuah pernyataan kepenulisan pekerjaan dan penerbitan awal di jurnal ini.
- Penulis bisa memasukkan ke dalam penyusunan kontraktual tambahan terpisah untuk distribusi non ekslusif versi kaya terbitan jurnal (contoh: mempostingnya ke repositori institusional atau menerbitkannya dalam sebuah buku), dengan pengakuan penerbitan awalnya di jurnal ini.
- Penulis diizinkan dan didorong untuk mem-posting karya mereka online (contoh: di repositori institusional atau di website mereka) sebelum dan selama proses penyerahan, karena dapat mengarahkan ke pertukaran produktif, seperti halnya sitiran yang lebih awal dan lebih hebat dari karya yang diterbitkan. (Lihat Efek Akses Terbuka).