Pembobotan Kata Berbasis Preferensi Dan Hubungan Semantik Pada Dokumen Fiqih Berbahasa Arab

Penulis

  • Septiyawan R. Wardhana
  • Dika R. Yunianto
  • Agus Zainal Arifin
  • Diana Purwitasari

DOI:

https://doi.org/10.25126/jtiik.201522146

Abstrak

Abstrak

Dalam proses pencarian dokumen, pengguna sering menginginkan hasil pencarian yang sesuai dengan preferensi yang diinginkannya. Maka, untuk memperoleh hasil pencarian yang sesuai dengan preferensi tersebut dibutuhkan suatu metode pembobotan kata yang didasarkan pada preferensi tersebut. Metode pembobotan tersebut perlu mempertimbangkan hubungan semantik antar kata untuk meningkatkan relevansi hasil pencarian. Dalam penelitian ini diusulkan metode pembobotan kata berbasis preferensi berdasarkan hubungan semantik antar kata pada dokumen fiqih berbahasa Arab. Latent Semantic Indexing merupakan salah satu metode indexing dalam sistem temu kembali informasi yang mempertimbangkan hubungan semantik antar kata. Hasil pembobotan kata berdasarkan preferensi dijadikan sebuah matriks untuk perhitungan Latent Semantic Indexing yang menghasilkan sebuah vektor. Vektor tersebut dihitung similaritasnya antara vektor query dengan vektor-vektor dokumen yang ada. Metode pembobotan kata berbasis preferensi yang mempertimbangkan hubungan semantik antar kata dapat digunakan dalam perankingan dokumen fiqih bahasa Arab berbasis preferensi. Hal tersebut dapat dilihat dari nilai maksimal precision, recall dan f-measure yang meningkat menjadi 88.75 %, 89.72% dan  87.91%.

Kata kunci: Bahasa Arab, Latent Semantic Indexing, Pembobotan Kata, Preferensi


Abstract

In the document search process is not uncommon users want search results that correspond to the desired preferences. Thus, to obtain the search results according to user preferences needed a word weighting method based on user preference. The term weighting method needs to consider the semantic relationships between words to improve the relevance of search results. This paper propose a new method of term weighting based preference by considering the semantic relationships between term in documents fiqh Arabic. Latent Semantic Indexing is a method of indexing in information retrieval system that takes the semantic relationships between words. Term weighting results based on preferences made a matrix for calculation of Latent Semantic Indexing which generate a vector for the calculated similarity between the query vector of vectors documents. Term weighting based preference by considering the semantic relationships between term method can be used on the rank documents fiqh Arabic. It can be seen from the value of the precision, recall, and F-measure which increase to 88.75 %, 89.72 % and 87.91 %.

Keywords: : Arabic, Latent Semantic Indexing, Term Weighting, Preference

Downloads

Download data is not yet available.

Referensi

ELRAOUF, A., ESRAA, BADR, L., NAGWA, TOLBA, FAHMY, M. 2010. An Efficient Ranking Module for an Arabic Search Engine. International Journal of Computer Science and Network Security, 10(2), 218-225.

HERBRICH, R., GRAPAEL, T., BOLLMAN-SDORRA, P., OBERMAYER, K.1998. Learning preference relations for information retrieval. ICML-98 Workshop: text categorization and machine learning, July, Berlin. 80-84.

FAUZI, M. A., ARIFIN, A. Z., YUNIARTI, A. 2013. Term Weighting Berbasis Indeks Buku dan Kelas untuk Perankingan Dokumen Berbahasa Arab. Jurnal Lontar Komputer,5(2).

WAHIB, A., PASNUR, SANTIKA P.P., ARIFIN, A. Z. 2015. Perankingan Dokumen Berbahasa Arab Menggunakan Latent Semantic Indexing. Jurnal Buana Informatika, 6(2), 83-92.

HOLLE, K. F. H., ARIFIN, A. Z., PURWITASARI, D. 2015. Preference Based Term Weighting for Arabic Fiqh Document Ranking. Jurnal Ilmu Komputer dan Informasi, 8(1).

LARKEY, L. S., CONNELL, M. E. 2006. Arabic Information Retrieval at UMass in TREC-10. Massachusetts Univ Amherst Center for Intelligent Information Retrieval.

KHOJA, S., GARSIDE, R. 1999. Stemming Arabic Text. Computing Department, Lancaster University, Lancaster.

PAPADIMITRIOU, C. H., TAMAKI, H., RAGHAVAN, P., VEMPALA, S. 1998. Latent semantic indexing: A probabilistic analysis. Proceedings of the seventeenth ACM SIGACT-SIGMOD-SIGART symposium on Principles of database systems, May. 159-168.

Unduhan

Diterbitkan

22-07-2015

Terbitan

Bagian

Teknologi Informasi

Cara Mengutip

Pembobotan Kata Berbasis Preferensi Dan Hubungan Semantik Pada Dokumen Fiqih Berbahasa Arab. (2015). Jurnal Teknologi Informasi Dan Ilmu Komputer, 2(2), 132-137. https://doi.org/10.25126/jtiik.201522146