Analisis Sentimen Berbahasa Inggris Dengan Metode Lstm Studi Kasus Berita Online Pariwisata Bali
DOI:
https://doi.org/10.25126/jtiik.1168792Abstrak
Semaikin berkembangnya pariwisata di Bali, persepsi terhadap berita yang beredar tentang pariwisata menjadi faktor penting yang memengaruhi citra destinasi wisata tersebut. Namun, analisis sentimen terhadap berita pariwisata berbahasa Inggris seringkali menghadapi tantangan, terutama karena kompleksitas bahasa dan ketidakseimbangan data sentimen. Penelitian ini bertujuan untuk memperdalam pemahaman mengenai tren dan isu terkini yang berhubungan tentang industri pariwisata Bali melalui analisis sentimen berdasarkan konten berita. Fokus utama penelitian adalah pada berita pariwisata Bali yang diunggah dalam portal media online internasional, khususnya dari Australia dan Inggris. Analisis sentimen dilakukan menggunakan model machine learning LSTM (Long-Term Memory), dengan data berita yang telah diberi label sentimen oleh pakar sesuai dengan isi berita. Pembagian dataset optimal adalah 90% untuk data pelatihan dan 10% untuk data pengujian. Hasil penelitian menunjukkan bahwa model LSTM berhasil mencapai tingkat akurasi sebesar 81,36%. Selanjutnya, untuk mengidentifikasi pola topik yang tersembunyi dan mengelompokkan berita dengan topik atau isu serupa, digunakan metode LDA (Latent Dirichlet Allocation). Penelitian ini mengungkap bahwa jumlah topik yang ideal bervariasi tergantung pada nilai kohesi yang diperoleh dari sentimen data yang digunakan. Implikasi temuan ini dapat memberikan wawasan lebih dalam tentang persepsi dan respon terhadap berita pariwisata Bali, sekaligus menunjukkan potensi aplikasi model machine learning dan metode LDA dalam analisis tren industri pariwisata.
Abstract
As tourism in Bali continues to grow, perceptions of news circulating about tourism have become an important factor influencing the image of the tourist destination. However, sentiment analysis of English-language tourism news often faces challenges, especially due to the complexity of the language and the imbalance of sentiment data. This research aims to deepen understanding of the latest trends and issues related to the Bali tourism industry through sentiment analysis based on news content. The main focus of the research is on Bali tourism news uploaded on international online media portals, especially from Australia and England. Sentiment analysis is carried out using the LSTM (Long-Term Memory) machine learning model, with news data that has been labeled with sentiment by experts according to the content of the news. The optimal dataset division is 90% for training data and 10% for testing data. The research results show that the LSTM model succeeded in achieving an accuracy level of 81.36%. Furthermore, to identify hidden topic patterns and group news with similar topics or issues, the LDA (Latent Dirichlet Allocation) method is used. This research reveals that the ideal number of topics varies depending on the cohesion value obtained from the sentiment data used. The implications of these findings can provide deeper insight into perceptions and responses to Bali tourism news, as well as showing the potential application of machine learning models and LDA methods in analyzing tourism industry trends.
Downloads
Referensi
EFRIZONI, LUSIANA, SARJON DEFIT, MUHAMMAD TAJUDDIN, AND ANTHONY ANGGRAWAN. 2022. “Komparasi Ekstraksi Fitur Dalam Klasifikasi Teks Multilabel Menggunakan Algoritma Machine Learning.” MATRIK : Jurnal Manajemen, Teknik Informatika Dan Rekayasa Komputer 21(3):653–66. doi: 10.30812/matrik.v21i3.1851.
ER, NGURAH AGUS SANJAYA. 2021. “Lmplementasi Latent Dirichlet Allocation (LDA) Untuk Klasterisasi Cerita Berbahasa Bali.” Jurnal Teknologi Informasi Dan Ilmu Komputer 8(1):127–34. doi: 10.25126/jtiik.202183556.
FARSIAH, LAINA, ALIM MISBULLAH, AND HUSAINI HUSAINI. 2022. “Analisis Sentimen Menggunakan Arsitektur Long Short-Term Memory (Lstm) Terhadap Fenomena Citayam Fashion Week.” Cyberspace: Jurnal Pendidikan Teknologi Informasi 6(2):86. doi: 10.22373/cj.v6i2.14687.
J., SANGEETHA, AND DR. KUMARAN U. 2022. “Comparison of Sentiment Analysis on Online Product Reviews Using Optimised RNN-LSTM with Support Vector Machine.” Webology 19(1):3883–98. doi: 10.14704/web/v19i1/web19256.
KHAIRUNNISA, SYIFA, ADIWIJAYA ADIWIJAYA, AND SAID AL FARABY. 2021. “Pengaruh Text Preprocessing Terhadap Analisis Sentimen Komentar Masyarakat Pada Media Sosial Twitter (Studi Kasus Pandemi COVID-19).” Jurnal Media Informatika Budidarma 5(2):406. doi: 10.30865/mib.v5i2.2835.
KHASANAH, SITI ROHMATUL, KETUT GEDE, DARMA PUTRA, I. PUTU, AND ARYA DHARMADI. 2022. “Analisis Sentimen Berita Universitas Udayana Menggunakan Metode Full Text Search (Natural Language) Dan Rule Based Method.” JITTER-Jurnal Ilmiah Teknologi Dan Komputer 3(1).
KHOLIFATULLAH, BAGUS ARIEF HAMDI, AND AGUS PRIHANTO. 2023. “Penerapan Metode Long Short Term Memory Untuk Klasifikasi Pada Hate Speech.” Journal of Informatics and Computer Science (JINACS) 04:292–97. doi: 10.26740/jinacs.v4n03.p292-297.
MATIRA, YAYANG, JUNAIDI, AND IMAN SETIAWAN. 2023. “Pemodelan Topik Pada Judul Berita Online Detikcom Menggunakan Latent Dirichlet Allocation.” Estimasi: Journal of Statistics and Its Application 4(1):2721–379. doi: 10.20956/ejsa.vi.24843.
MUHAMMAD, PUTRA FISSABIL, RETNO KUSUMANINGRUM, AND ADI WIBOWO. 2021. “Sentiment Analysis Using Word2vec and Long Short-Term Memory (LSTM) for Indonesian Hotel Reviews.” Procedia Computer Science 179(2020):728–35. doi: 10.1016/j.procs.2021.01.061.
NILSEN, ANDREW. 2022. “Perbandingan Model RNN, Model LSTM, Dan Model GRU Dalam Memprediksi Harga Saham-Saham LQ45.” Jurnal Statistika Dan Aplikasinya 6(1):137–47. doi: 10.21009/jsa.06113.
PARDEDE, D. L. CRISPINA, AND MUHAMMAD ANDRIAS INDRA WASKITA. 2023. “Analisis Pemodelan Topik Untuk Ulasan Tentang Peduli Lindungi.” Jurnal Ilmiah Informatika Komputer 28(1):17–26. doi: 10.35760/ik.2023.v28i1.7925.
PUTERI, DIAN ISLAMIATY. 2023. “Implementasi Long Short Term Memory (LSTM) Dan Bidirectional Long Short Term Memory (BiLSTM) Dalam Prediksi Harga Saham Syariah.” Euler : Jurnal Ilmiah Matematika, Sains Dan Teknologi 11(1):35–43. doi: 10.34312/euler.v11i1.19791.
SELY KARMILA, VISDA INTAN ARDIANTI. 2022. “Metode Latent Dirichlet Allocation Untuk Menentukan Topik Teks Suatu Berita.” 16(April):36–44.
TIJARE, POONAM, AND P. JHANSI RANI. 2020. “Exploring Popular Topic Models.” Journal of Physics: Conference Series 1706(1). doi: 10.1088/1742-6596/1706/1/012171.
TRIPATHI, MILAN. 2021. “Sentiment Analysis of Nepali COVID19 Tweets Using NB, SVM AND LSTM.” Journal of Artificial Intelligence and Capsule Networks 3(3):151–68. doi: 10.36548/jaicn.2021.3.001.
TRIYADI, INDRA, BUDI PRASETIYO, AND TIARA LAILATUL NIKMAH. 2023. “News Text Classification Using Long-Term Short Memory (LSTM) Algorithm.” Journal of Soft Computing Exploration 4(2):79–86. doi: 10.52465/joscex.v4i2.136.
WAHYUDIN. 2020. “Aplikasi Topic Modeling Pada Pemberitaan.” Seminar Nasional Official Statistic: Pengembangan Official Statistics Dalam Mendukung Implementasi SDG’s 309–18.
Unduhan
Diterbitkan
Terbitan
Bagian
Lisensi
Hak Cipta (c) 2024 Jurnal Teknologi Informasi dan Ilmu Komputer

Artikel ini berlisensiCreative Commons Attribution-ShareAlike 4.0 International License.

Artikel ini berlisensi Creative Common Attribution-ShareAlike 4.0 International (CC BY-SA 4.0)
Penulis yang menerbitkan di jurnal ini menyetujui ketentuan berikut:
- Penulis menyimpan hak cipta dan memberikan jurnal hak penerbitan pertama naskah secara simultan dengan lisensi di bawah Creative Common Attribution-ShareAlike 4.0 International (CC BY-SA 4.0) yang mengizinkan orang lain untuk berbagi pekerjaan dengan sebuah pernyataan kepenulisan pekerjaan dan penerbitan awal di jurnal ini.
- Penulis bisa memasukkan ke dalam penyusunan kontraktual tambahan terpisah untuk distribusi non ekslusif versi kaya terbitan jurnal (contoh: mempostingnya ke repositori institusional atau menerbitkannya dalam sebuah buku), dengan pengakuan penerbitan awalnya di jurnal ini.
- Penulis diizinkan dan didorong untuk mem-posting karya mereka online (contoh: di repositori institusional atau di website mereka) sebelum dan selama proses penyerahan, karena dapat mengarahkan ke pertukaran produktif, seperti halnya sitiran yang lebih awal dan lebih hebat dari karya yang diterbitkan. (Lihat Efek Akses Terbuka).