Pembobotan Kata Berbasis Preferensi Dan Hubungan Semantik Pada Dokumen Fiqih Berbahasa Arab
DOI:
https://doi.org/10.25126/jtiik.201522146Abstrak
Abstrak
Dalam proses pencarian dokumen, pengguna sering menginginkan hasil pencarian yang sesuai dengan preferensi yang diinginkannya. Maka, untuk memperoleh hasil pencarian yang sesuai dengan preferensi tersebut dibutuhkan suatu metode pembobotan kata yang didasarkan pada preferensi tersebut. Metode pembobotan tersebut perlu mempertimbangkan hubungan semantik antar kata untuk meningkatkan relevansi hasil pencarian. Dalam penelitian ini diusulkan metode pembobotan kata berbasis preferensi berdasarkan hubungan semantik antar kata pada dokumen fiqih berbahasa Arab. Latent Semantic Indexing merupakan salah satu metode indexing dalam sistem temu kembali informasi yang mempertimbangkan hubungan semantik antar kata. Hasil pembobotan kata berdasarkan preferensi dijadikan sebuah matriks untuk perhitungan Latent Semantic Indexing yang menghasilkan sebuah vektor. Vektor tersebut dihitung similaritasnya antara vektor query dengan vektor-vektor dokumen yang ada. Metode pembobotan kata berbasis preferensi yang mempertimbangkan hubungan semantik antar kata dapat digunakan dalam perankingan dokumen fiqih bahasa Arab berbasis preferensi. Hal tersebut dapat dilihat dari nilai maksimal precision, recall dan f-measure yang meningkat menjadi 88.75 %, 89.72% dan 87.91%.
Kata kunci: Bahasa Arab, Latent Semantic Indexing, Pembobotan Kata, Preferensi
Abstract
In the document search process is not uncommon users want search results that correspond to the desired preferences. Thus, to obtain the search results according to user preferences needed a word weighting method based on user preference. The term weighting method needs to consider the semantic relationships between words to improve the relevance of search results. This paper propose a new method of term weighting based preference by considering the semantic relationships between term in documents fiqh Arabic. Latent Semantic Indexing is a method of indexing in information retrieval system that takes the semantic relationships between words. Term weighting results based on preferences made a matrix for calculation of Latent Semantic Indexing which generate a vector for the calculated similarity between the query vector of vectors documents. Term weighting based preference by considering the semantic relationships between term method can be used on the rank documents fiqh Arabic. It can be seen from the value of the precision, recall, and F-measure which increase to 88.75 %, 89.72 % and 87.91 %.
Keywords: : Arabic, Latent Semantic Indexing, Term Weighting, Preference
Downloads
Referensi
ELRAOUF, A., ESRAA, BADR, L., NAGWA, TOLBA, FAHMY, M. 2010. An Efficient Ranking Module for an Arabic Search Engine. International Journal of Computer Science and Network Security, 10(2), 218-225.
HERBRICH, R., GRAPAEL, T., BOLLMAN-SDORRA, P., OBERMAYER, K.1998. Learning preference relations for information retrieval. ICML-98 Workshop: text categorization and machine learning, July, Berlin. 80-84.
FAUZI, M. A., ARIFIN, A. Z., YUNIARTI, A. 2013. Term Weighting Berbasis Indeks Buku dan Kelas untuk Perankingan Dokumen Berbahasa Arab. Jurnal Lontar Komputer,5(2).
WAHIB, A., PASNUR, SANTIKA P.P., ARIFIN, A. Z. 2015. Perankingan Dokumen Berbahasa Arab Menggunakan Latent Semantic Indexing. Jurnal Buana Informatika, 6(2), 83-92.
HOLLE, K. F. H., ARIFIN, A. Z., PURWITASARI, D. 2015. Preference Based Term Weighting for Arabic Fiqh Document Ranking. Jurnal Ilmu Komputer dan Informasi, 8(1).
LARKEY, L. S., CONNELL, M. E. 2006. Arabic Information Retrieval at UMass in TREC-10. Massachusetts Univ Amherst Center for Intelligent Information Retrieval.
KHOJA, S., GARSIDE, R. 1999. Stemming Arabic Text. Computing Department, Lancaster University, Lancaster.
PAPADIMITRIOU, C. H., TAMAKI, H., RAGHAVAN, P., VEMPALA, S. 1998. Latent semantic indexing: A probabilistic analysis. Proceedings of the seventeenth ACM SIGACT-SIGMOD-SIGART symposium on Principles of database systems, May. 159-168.
Unduhan
Diterbitkan
Terbitan
Bagian
Lisensi
Artikel ini berlisensi Creative Common Attribution-ShareAlike 4.0 International (CC BY-SA 4.0)
Penulis yang menerbitkan di jurnal ini menyetujui ketentuan berikut:
- Penulis menyimpan hak cipta dan memberikan jurnal hak penerbitan pertama naskah secara simultan dengan lisensi di bawah Creative Common Attribution-ShareAlike 4.0 International (CC BY-SA 4.0) yang mengizinkan orang lain untuk berbagi pekerjaan dengan sebuah pernyataan kepenulisan pekerjaan dan penerbitan awal di jurnal ini.
- Penulis bisa memasukkan ke dalam penyusunan kontraktual tambahan terpisah untuk distribusi non ekslusif versi kaya terbitan jurnal (contoh: mempostingnya ke repositori institusional atau menerbitkannya dalam sebuah buku), dengan pengakuan penerbitan awalnya di jurnal ini.
- Penulis diizinkan dan didorong untuk mem-posting karya mereka online (contoh: di repositori institusional atau di website mereka) sebelum dan selama proses penyerahan, karena dapat mengarahkan ke pertukaran produktif, seperti halnya sitiran yang lebih awal dan lebih hebat dari karya yang diterbitkan. (Lihat Efek Akses Terbuka).