Deteksi Kejadian Lalu Lintas Pada Teks Twitter Dengan Pendekatan Klasifikasi Multi-Label Berbasis Deep Learning
Penulis
Luthfi Atikah, Diana Purwitasari, Nanik Suciati Download PDFAbstrak
Kemacetan merupakan salah satu kejadian yang sering terjadi di kota-kota besar. Hal ini dapat merugikan pengguna jalan, oleh karena itu perlu dilakukan pendeteksian kejadian lalu lintas. Saat ini, twitter digunakan sebagai sumber informasi untuk mendeteksi suatu kejadian. Namun, pengguna twitter cenderung membagikan beberapa informasi sekaligus, sehingga dalam satu tweet bisa memiliki lebih dari satu label. Pada penelitian ini dilakukan klasifikasi multi-label menggunakan 18.000 data dari akun twitter terverifikasi di Surabaya. Klasifikasi multi-label pada penelitian ini dilakukan untuk mengidentifikasi banyak situasi lalu lintas seperti kondisi cuaca, kecelakaan lalu lintas, kemacetan lalu lintas, lalu lintas padat, dan lalu lintas lancar. Klasifikasi dilakukan dengan menggunakan pendekatan deep learning (CNN dan LSTM) dan word embedding (word2vec dan fastText) dengan augmentasi dan non-augmentasi data. Eksperimen dilakukan dengan 3 skenario berbeda untuk melihat pengaruh data uji yang berbeda pada data latih yang sama. Selanjutnya dilakukan eksperimen untuk menguji pengaruh jumlah label terhadap klasifikasi multi-label pada data uji yang sama. Akurasi tertinggi pada non-augmentasi data adalah 0,75 dan pada augmentasi data adalah 0,95. Dari keseluruhan ujicoba akurasi tertinggi diperoleh dari kombinasi LSTM dan fastText.Teks Lengkap:
PDF (English)Referensi
AIPE, A., MUKUNTHA, N. S., EKBAL, A., & KUROSHASI, S. 2018. Deep learning approach towards multi-label classification of crisis related tweets. Proceedings of the International ISCRAM Conference, 2018-May(May), 705–717.
ALOMARI, E., MEHMOOD, R., & KATIB, I. 2019. Road Traffic Event Detection Using Twitter Data , Machine Learning , and Apache Spark. https://doi.org/10.1109/SmartWorld-UIC-ATC-SCALCOM-IOP-SCI.2019.00332
ATEFAH, F., & KHREICH, W. 2015. A survey of techniques for event detection in Twitter. Computational Intelligence, 31(1), 133–164. https://doi.org/10.1111/coin.12017
BDEIR, A. M., & IBRAHIM, F. 2020. A framework for arabic tweets multi-label classification using word embedding and neural networks algorithms. ACM International Conference Proceeding Series, 105–112. https://doi.org/10.1145/3404512.3404526
BOUTELL, M. R., LOU, J., SHEN, X., & BROWN, C. M. 2004. Learning multi-label scene classiÿcation. 37, 1757–1771. https://doi.org/10.1016/j.patcog.2004.03.009
BRANNON, R. M., LIENGME, B. V, KRITHIKA, L. B., ROY, P., & JERLIN, M. A. 2017. Topic Identification and Categorization of Public Information in Community-Based Social Media Topic Identification and Categorization of Public Information in Community-Based Social Media. https://doi.org/10.1088/1742-6596/755/1/011001
CHAMBY-DIAZ, J. C., & BAZZAN, A. L. C. 2019. Identifying traffic event types from twitter by multi-label classification. Proceedings - 2019 Brazilian Conference on Intelligent Systems, BRACIS 2019, 806–811. https://doi.org/10.1109/BRACIS.2019.00144
DABIRI, S., & HAESLIP, K. 2019. Developing a Twitter-based traffic event detection model using deep learning architectures. Expert Systems with Applications, 118, 425–439. https://doi.org/10.1016/j.eswa.2018.10.017
GU, Y., QIAN, Z., & CHEN, F. 2016. From Twitter to detector: Real-time traffic incident detection using social media data. Transportation Research Part C: Emerging Technologies, 67, 321–342. https://doi.org/10.1016/j.trc.2016.02.011
JANG, B., KIM, I., & KIM, J. W. 2019. Word2vec convolutional neural networks for classification of news articles and tweets. PLoS ONE, 14(8), 1–20. https://doi.org/10.1371/journal.pone.0220976
JUANLIN, HU, XIN KANG, SHUN NISHIDE, F. R. 2019. Text multi-label sentiment analysis based on Bi-LSTM. Proc. of CCIS, 16–20.
KHATTAK, F. K., JEBLEE, S., POU-PROM, C., ABDALLA, M., MEANEY, C., & RUDZICZ, F. 2019. A survey of word embeddings for clinical text. Journal of Biomedical Informatics: X, 4(October), 100057. https://doi.org/10.1016/j.yjbinx.2019.100057
KUYUMCU, B., AKSAKALLIL, C., & DELIL, S. 2019. An automated new approach in fast text classification (fastText): A case study for Turkish text classification without pre-processing. ACM International Conference Proceeding Series, 1–4. https://doi.org/10.1145/3342827.3342828
LIM, E., ISTTS, T. I., SETIAWAN, E. I., & ISTTS, T. I. 2020. Stance Classification Post Kesehatan di Media Sosial Dengan FastText Embedding dan Deep learning. 65–73.
MAZOYER, B., CAGE, J., HERVE, N., & HUDELOT, C. 2020. A french corpus for event detection on twitter. LREC 2020 - 12th International Conference on Language Resources and Evaluation, Conference Proceedings, (May), 6220–6227.
MOHAMMAD, F. 2018. Is preprocessing of text really worth your time for toxic comment classification? 2018 World Congress in Computer Science, Computer Engineering and Applied Computing, CSCE 2018 - Proceedings of the 2018 International Conference on Artificial Intelligence, ICAI 2018, 447–453.
PARWEZ, M. A., ABDULISH, M., & JAHIRUDDIN. 2019. Multi-Label Classification of Microblogging Texts Using Convolution Neural Network. IEEE Access, 7, 68678–68691.
https://doi.org/10.1109/ACCESS.2019.2919494
RAHMAWATI D., & KHODRA, M. L. 2016. Word2vec semantic repesentation in multi-label classification for Indonesian news article. 4th IGNITE Conference and 2016 International Conference on Advanced Informatics: Concepts, Theory and Application, ICAICTA 2016, 0–5. https://doi.org/10.1109/ICAICTA.2016.7803115
RAO, A., & SPASOJEVIC, N. 2016. Actionable and Political Text Classification using Word embeddings and LSTM. Research Gate, (July), 2–10.
DOI: http://dx.doi.org/10.25126/jtiik.2022915206