Pengujian Rule-Based pada Dataset Log Server Menggunakan Support Vector Machine Berbasis Linear Discriminat Analysis untuk Deteksi Malicious Activity

Penulis

  • Kurnia Adi Cahyanto Politeknik Negeri Indramayu, Kabupaten Indramayu
  • Muhammad Anis Al Hilmi Politeknik Negeri Indramayu, Kabupaten Indramayu
  • Muhamad Mustamiin Politeknik Negeri Indramayu, Kabupaten Indramayu

DOI:

https://doi.org/10.25126/jtiik.2022924107

Abstrak

Web server bertugas menjalankan aplikasi web untuk melayani request dari klien. Setiap interaksi yang dilakukan klien terhadap aplikasi web, tercatat pada catatan log server. Dari log tersebut, terdapat data detail tentang alamat IP, perangkat dan sumber klien, request pengguna, respon server, dan keterangan lainnya. Dari informasi pada log, dapat dipakai untuk keperluan pengamanan sistem, salah satunya dengan cara melakukan analisis menggunakan data mining terhadap aktifitas klien yang tercatat pada log server. Selain itu, jika terdapat file yang diunggah pengguna, dapat juga dikaitkan dalam analisis log server dalam mengenali pola aktifitas dan malicious file. Dataset log yang telah didapat, diolah dengan menggunakan pelabelan rule-based yang nantinya diuji dengan pemodelan Support Vector Machine berbasis Linear Discriminant Analysis. Proses mengklasifikasikan data log server dapat dilakukan untuk mengenali aktifitas yang termasuk serangan, usaha paksa untuk masuk sistem terhadap server atau bukan. Dari pemodelan yang dilakukan, didapat hasil bahwa algoritma SVM berbasis LDA memiliki tingkat akurasi training 90,2% dan testing 89,9% dalam melakukan pengujian rule-based untuk pelabelan aktifitas pada web server.

 

Abstract

The web server is in charge of running web applications to serve requests from clients. Every interaction the client makes to the web application is logged in server logs. From these logs, there are detailed data about IP addresses, client devices and sources, user requests, server responses, and other information. From the information in the logs, it can be used for system security purposes, one of which is by performing analysis using data mining of client activities recorded on the server log. In addition, if there is a file uploaded by a user, it can also be linked in server log analysis in recognizing activity patterns and malicious files. The log dataset that has been obtained is processed using rule-based labeling which will later be tested with a Linear Discriminant Analysis-based Support Vector Machine modeling. The process of classifying server log data can be done to identify activities that include attacks, forced attempts to enter the system against the server or not. From the modeling, the results show that the LDA-based SVM algorithm has a training accuracy rate of 90,2% and testing 89,9% in performing rule-based testing for activity labeling on the web server.

 


Downloads

Download data is not yet available.

Referensi

A.MUIS, I., & AFFANDES, M. 2015. Penerapan Metode Support Vector Machine (SVM) Menggunakan Kernel Radial Basis Function (RBF) Pada Klasifikasi Tweet. Jurnal Sains, Teknologi dan Industri, 189-197.

ALPAYDIN, E. 2010. Introduction to Machine Learning Second Edition. London: The MIT Press.

APOSTOLIDIS-AFENTOULIS, V., & LIOUFI, K.-I. 2015. Svm Classification With Linear & Rbf Kernels. Thessaloniki: University of Macedonia.

CAHYANTO, K. A., MULYANI, E., & MUHAMAD, F. P. 2019. Penerapan Dizcretize By Frequency Dalam Meningkatkan Akurasi Algoritma C4.5 Dalam Memprediksi Cuaca Pada Jalur Pantura Tegal-Pekalongan-Semarang. Jurnal Tenologi Terapan (JTT), 5, 78-85.

HAN, J. 2011. Data Mining Concepts and Techniques. Massachusetts: Morgan Kaufmann Publishers.

HILMI, M. A. 2019. Uji Performa dan Website Responsiveness Institusi dan Smart City se-Jawa Barat. Sentrinov. arXiv preprint arXiv:1912.13346.

LIU, H., & GEGOV, A. 2016. Rule Based Systems and Networks: Deterministic and Fuzzy Approaches. International Conference on Intelligent Systems, (hal. 316-321).

MAIMON, O. 2010. Data Mining and Knowledge Discovery Handbook Second Edition. London: Springer.

MBUGUA, J. G. 2016. Automated Log Analysis Using Ai: Intelligent Intrusion Detection System. Bondo: Jaramogi Oginga Odinga University Of Science And Technology.

SALAMA, S. E. 2011. Web Server Logs Preprocessing for Web Intrusion Detection. Computer and Information Science, 4, 123-133.

SIHOMBING, P. R., & HENDARSIN, O. P. 2020. Perbandingan Metode Artificial Neural Network (ANN) dan Support Vector Machine (SVM) untuk Klasifikasi Kinerja Perusahaan Daerah Air Minum (PDAM) di Indonesia. Jurnal Ilmu Komputer VOL. XIII No. 1, 9-20.

SOMANTRI, O., & APRILIANI, D. 2018. Support Vector Machineberbasis Feature Selection Untuksentiment Analysiskepuasan Pelanggan Terhadap Pelayanan Warung Dan Restoran Kuliner Kota Tegal. Jurnal Teknologi Informasi dan Ilmu Komputer (JTIIK), 537-547.

V.VIDAPRIYA. 2016. Identifying Web Users from Weblogs Using Classification Algorithms. International Journal of Innovative Research in Computer and Communication Engineering, 4(7), 13722-13728.

WITTEN, I. H. 2017. Data Mining Practical Machine Learning Tools and Techniques. Cambridge: Elsevier.

Diterbitkan

24-02-2022

Terbitan

Bagian

Ilmu Komputer

Cara Mengutip

Pengujian Rule-Based pada Dataset Log Server Menggunakan Support Vector Machine Berbasis Linear Discriminat Analysis untuk Deteksi Malicious Activity. (2022). Jurnal Teknologi Informasi Dan Ilmu Komputer, 9(2), 245-254. https://doi.org/10.25126/jtiik.2022924107