Pembentukan Daftar Stopword Goffman Transition Point dengan Pembobotan Emoji pada Analisis Sentimen di Twitter

Penulis

  • Rizky Maulana Iqbal Universitas Brawijaya, Malang
  • Yuita Arum Sari Universitas Brawijaya, Malang
  • Edy Santoso Universitas Brawijaya, Malang

DOI:

https://doi.org/10.25126/jtiik.2022954706

Abstrak

Analisis sentimen atau opinion mining merupakan proses mengekstrak data teks sehingga didapatkan informasi yang terkandung dalam suatu data. Dalam proses ekstraknya, terdapat tahapan stopword removal untuk menghapus kata-kata tidak penting dengan menggunakan stopword. Stopword telah banyak disediakan dalam digital library dengan berisikan kata-kata tidak penting, tetapi tidak semua kata-kata tersebut tidak penting dalam suatu data atau kasus tertentu. Penelitian ini berfokus pada perbandingan terhadap stopword Tala dengan pembentukan stopword dari data latih menggunakan metode Goffman Transition Point yang merupakan pengembangan dari metode Zipf Law dengan menggunakan metode klasifikasi K-Nearest Neighbour (KNN) serta menambahkan pembobotan emoji dalam proses pembobotannya. Hasil penelitian ini menunjukkan dengan pembentukan stopword menggunakan metode Zipf Law menunjukkan nilai akurasi sebesar 73,6% dan menggunakan pembobotan emoji dengan nilai K yang dipakai metode KNN K = 17 tetapi jika tidak menggunakan pembobotan emoji akurasinya menjadi 72.9%. Formula jarak yang digunakan adalah Cosine distance. Jika dengan menggunakan stopword Tala dengan parameter yang sama menghasilkan akurasi sebesar 73% dengan pembobotan emoji dan 71,9% tanpa pembobotan emoji. Berdasarkan hasil tersebut dapat disimpulkan bahwa pembentukan stopword dan pembobotan emoji dapat meningkatkan akurasi.

 

Abtract

Sentiment analysis or opinion mining is the process of extracting text data, so that the information contained in the data is obtained. In the extracting process, there are stopword removal steps to remove unnecessary words by using a stopword. Many stopwords have been provided in digital libraries containing unimportant words, but not all of these words are not important in a particular data or case. This study focuses on the comparison of the stopword tala with the formation of a stopword from training data using the Goffman Transition Point which is a development of the Zipf Law method using the K-Nearest Neighbor (KNN) classification method and adding emoji weighting in the weighting process. The results of this study indicate that the formation of a stopword using the zipf law method shows an accuracy value of 73.6% and using emoji weighting with the K value used by the KNN method with K = 17 but if you don’t use emoji weighting the accuracy will be 72.9%. The distance formula used is the cosine distance. Using a stopword Tala with the same parameters produces an accuracy of 73% with emoji-weighted and 71.9% without emoji-weighted. Based on these results it can be concluded that the formation of stopwords and weighting of emojis can improve accuracy.


Downloads

Download data is not yet available.

Referensi

ARI KURNIA RAKHMAN. 2020. Emoji Pada Media Sosial Sebagai Komunikasi Antarbudaya. Mozaik Komunikasi, 2, 1–11. http://jom.untidar.ac.id/index.php/mozaik/article/view/1194

BUDIMAN, A. E., & WIDJAJA, A. 2020. Analisis Pengaruh Teks Preprocessing Terhadap Deteksi Plagiarisme Pada Dokumen Tugas Akhir. Jurnal Teknik Informatika Dan Sistem Informasi, 6(3), 475–488. https://doi.org/10.28932/jutisi.v6i3.2892

CHANDRA, D. N., INDRAWAN, G., & SUKAJAYA, I. N. 2019. Klasifikasi Berita Lokal Radar Malang Menggunakan Metode Naive Bayes Dengan Fitur N-Gram. 10(2), 11–19.

FATHAN, A. H. 2016. Pengaruh Stopword Terhadap Performa Klasifikasi Tweet Berbahasa Indonesia (pp. 1–4). JISKA.

HERWIJAYANTI, B., RATNAWATI, D. E., & MUFLIKHAH, L. 2018. Klasifikasi Berita Online dengan menggunakan Pembobotan TF-IDF dan Cosine Similarity. Pengembangan Teknologi Informasi Dan Ilmu Komputer, 2(1), 306–312.

JUANG, D. 2016. Analisis Spam dengan Menggunakan Naïve Bayes. Jurnal Teknovasi, 3(2), 51–57.

LESTARI, A. R. T., PERDANA, R. S., & FAUZI, M. A. 2017. Analisis Sentimen Tentang Opini Pilkada DKI 2017 Pada Dokumen Twitter Berbahasa Indonesia Menggunakan Näive Bayes dan Pembobotan Emoji. In Jurnal Pengembangan Teknologi Informasi dan Ilmu Komputer (Vol. 1, Issue 12, pp. 1718–1724). http://j-ptiik.ub.ac.id

MUJILAHWATI, S. 2016. Pre-Processing Text Mining Pada Data Twitter. Seminar Nasional Teknologi Informasi Dan Komunikasi, 2016(Sentika), 2089–9815.

RAHUTOMO, F., & RIRID, A. R. T. H. 2019. Evaluasi Daftar Stopword Bahasa Indonesia. Jurnal Teknologi Informasi Dan Ilmu Komputer, 6(1), 41. https://doi.org/10.25126/jtiik.2019611226

RANI, R., & LOBIYAL, D. K. 2018. Automatic Construction of Generic Stop Words List for Hindi Text. Procedia Computer Science, 132(Iccids), 362–370. https://doi.org/10.1016/j.procs.2018.05.196

ROFIQOH, U., PERDANA, R. S., & FAUZI, M. A. 2017. Analisis Sentimen Tingkat Kepuasan Pengguna Penyedia Layanan Telekomunikasi Seluler Indonesia Pada Twitter Dengan Metode Support Vector Machine dan Lexion Based Feature. In Jurnal Pengembangan Teknologi Informasi dan Ilmu Komputer (J-PTIIK) Universitas Brawijaya (Vol. 1, Issue 12, pp. 1725–1732). http://j-ptiik.ub.ac.id/index.php/j-ptiik/article/view/628

SARI, D. E. D., SARI, Y. A., & FURQON, M. T. 2020. Pembentukan Daftar Stopword menggunakan Zipf Law dan Pembobotan Augmented TF - Probability IDF pada Klasifikasi Dokumen Ulasan Produk (Vol. 4, Issue 1, pp. 406–412).

SHAIMAH, L., & SETYADI, A. 2019. Relevansi Kata Kunci Hasil Pemeringkatan Zipf Pada Artikel Jurnal Berkala Ilmu Perpustakaan Dan Informasi Volume 13, No. 2, Tahun 2017. Jurnal Ilmu Perpustakaan, 8.

WAHYONO, W., TRISNA, I. N. P., SARIWENING, S. L., FAJAR, M., & WIJAYANTO, D. 2020. Comparison of distance measurement on k-nearest neighbour in textual data classification. Jurnal Teknologi Dan Sistem Komputer, 8(1), 54–58. https://doi.org/10.14710/jtsiskom.8.1.2020.54-58

Diterbitkan

31-10-2022

Terbitan

Bagian

Ilmu Komputer

Cara Mengutip

Pembentukan Daftar Stopword Goffman Transition Point dengan Pembobotan Emoji pada Analisis Sentimen di Twitter. (2022). Jurnal Teknologi Informasi Dan Ilmu Komputer, 9(5), 1101-1108. https://doi.org/10.25126/jtiik.2022954706