Peringkasan Multi-dokumen menggunakan Metode Pengelompokkan berbasis Hirarki dengan Multi-level Divisive Coefficient
DOI:
https://doi.org/10.25126/jtiik.2018561149Kata Kunci:
Perolehan Informasi, Pengelompokkan, Peringkasan, Multi-dokumenAbstrak
Peringkasan merupakan salah satu bagian dari perolehan informasi yang bertujuan untuk mendapatkan informasi secara cepat dan efisien dengan membuat intisari dari suatu dokumen. Dokumen-dokumen khususnya dokumen laporan setiap hari semakin bertambah seiring dengan bertambahnya pelaksanaan suatu kegiatan atau acara. Kebutuhan informasi yang semakin cepat, jumlah dokumen yang semakin bertambah banyak membuat kebutuhan akan adanya peringkasan dokumen semakin tinggi. Peringkasan yang digunakan untuk meringkas lebih dari satu dokumen disebut peringkasan multi-dokumen. Untuk mencegah adanya penyampaian informasi yang berulang pada peringkasan multi-dokumen, maka proses pengelompokkan diperlukan untuk menjamin bahwa informasi yang disampaikan bervariasi dan mencakup semua bagian dari dokumen-dokumen tersebut. Pengelompokkan hirarki dengan multi-level divisive coefficient dapat digunakan untuk mengelompokkan suatu bagian/kalimat dalam dokumen-dokumen dengan bervariasi dan mendalam yang disesuaikan dengan tingkat kebutuhan informasi dari pengguna. Bedasarkan dari tingkat kompresi peringkasan yang berbeda-beda, peringkasan menggunakan pengelompokkan hirarki dengan multi-level divisive coefficient dapat menghasilkan hasil peringkasan yang cukup baik dengan nilai f-measure sebesar 0,398 sementara nilai f-measure peringkasan dengan satu level divisive coefficient hanya mencapai 0,335.
Abstract
Summarization is one part of the information retrieval that aims to obtain information quickly and efficiently by making the essence of a document. Documents, especially document reports every day increasing as the implementation of an event. The need for information is getting faster, the increasing number of documents makes the need for document summaries is getting higher. Summarization used to summarize more than one document is called multi-document summarization. To prevent repetitive information from being submitted to multi-document summarization, the grouping process is necessary to ensure that the information submitted varies and covers all parts of the documents. Hierarchical clustering with multi-level divisive coefficient can be used to group a part / sentence in documents with varying and depth adjusted to the level of information needs of the user. Based on different compression levels of summarization, summarization using hierarchical clustering with multi-level divisive coefficient can produce a fairly good summary result with f-measure value of 0.398 while the f-measure summarization value with one level of divisive coefficient only reaches 0.335.
Downloads
Referensi
Dendograms. 2012. Dendograms. Tersedia di: <http://www.statistics4u.com/fundstat_eng/cc_dendrograms.html> [Diakses 20 Juli 2018]
GUPTA, V. K. AND SIDDIQUI, T. J. 2012. Multi-document Summarization using sentence clustering. Kharagpur: Intelligent Human Computer Interaction (IHCI), pp. 1-5.
KISHIDA, KAZUAKI. 2017. "An Experiment on Simple and Practical Methods of Cluster Labeling for Hierarchically Organized Document Subsets”.
MANNING, C. D., RAGHAVAN, P. AND SCHÜTZE, H. 2002. An Introduction To Information Retrieval [online]. Tersedia di: <http://nlp.stanford.edu/IR-book/pdf/irbookonlinereading.pdf> [Diakses 1 Juni 2018]
MEENA, Y. K., JAIN, A. AND GOPALANI, D. 2014. Survey on Graph and Cluster Based approaches in Multi-document Text Summarization. Jaipur: International Conference Recent Advances and Innovations in Engineering (ICRAIE), pp. 1-5.
MUSTAMIIN, M., BUDI, I., SANTOSO, H. B. (2018). Multi-documents summarization based on clustering of learning object using hierarchical clustering. Journal of Physics: Conference Series 978 (1), 012053.
PANDIT, S. R. AND POTEY, M. A. 2013. A Query Specific Graph Based Approach to Multi-document Text Summarization: Simultaneous Cluster and Sentence Ranking. Katra: Machine Intelligence and Research Advancement (ICMIRA), pp. 213-217.
PADMALAHARI, E., KUMAR, D. V. AND PRASAD, S. 2014. Automatic text Summarization with statistical and linguistic features using successive thresholds. Ramanathapuram: IEEE, pp. 1519-1524.
Politeknik Negeri Indramayu. 2013. Panduan PPI Polindra. [online]. Tersedia di: <http://polindra.ac.id/~download/dokumen/panduan%20PPI%20polindra%20fix.pdf> [Diakses 1 Juli 2018]
SHEPITSEN, A., GEMMELL, J., MOBASHER, B. AND BURKE, R. 2008. Personalized recommendation in social tagging systems using hierarchical clustering. New York: ACM, pp. 259-266.
WANG, S., LI, W., WANG, F. AND DENG, H. 2010. A Survey on Automatic Summarization. Kunming: IEEE, pp. 193-196.
Unduhan
Diterbitkan
Terbitan
Bagian
Lisensi
Artikel ini berlisensi Creative Common Attribution-ShareAlike 4.0 International (CC BY-SA 4.0)
Penulis yang menerbitkan di jurnal ini menyetujui ketentuan berikut:
- Penulis menyimpan hak cipta dan memberikan jurnal hak penerbitan pertama naskah secara simultan dengan lisensi di bawah Creative Common Attribution-ShareAlike 4.0 International (CC BY-SA 4.0) yang mengizinkan orang lain untuk berbagi pekerjaan dengan sebuah pernyataan kepenulisan pekerjaan dan penerbitan awal di jurnal ini.
- Penulis bisa memasukkan ke dalam penyusunan kontraktual tambahan terpisah untuk distribusi non ekslusif versi kaya terbitan jurnal (contoh: mempostingnya ke repositori institusional atau menerbitkannya dalam sebuah buku), dengan pengakuan penerbitan awalnya di jurnal ini.
- Penulis diizinkan dan didorong untuk mem-posting karya mereka online (contoh: di repositori institusional atau di website mereka) sebelum dan selama proses penyerahan, karena dapat mengarahkan ke pertukaran produktif, seperti halnya sitiran yang lebih awal dan lebih hebat dari karya yang diterbitkan. (Lihat Efek Akses Terbuka).