Peningkatan Akurasi Prediksi Harga Barang Impor Menggunakan XGBoost dan Particle Swarm Optimization
DOI:
https://doi.org/10.25126/jtiik.2025129419Kata Kunci:
Import, Machine Learning, Particle Swarm Optimization, Prediction, XGBoostAbstrak
Impor di Indonesia dilakukan untuk memenuhi kebutuhan dalam negeri dan memastikan kelancaran produksi serta distribusi. Namun sering terjadi under invoicing, yaitu harga barang yang diimpor dilaporkan lebih rendah dari nilai sebenarnya, yang mengakibatkan kerugian penerimaan negara. Penelitian ini bertujuan untuk memprediksi harga barang impor yang sebenarnya guna mengurangi kerugian tersebut. Data yang digunakan diperoleh dari dataset barang impor yang tersedia di platform Kaggle, yang disediakan oleh Data Analytics Community (Mof-DAC) dari Kementerian Keuangan Indonesia. Metode yang diusulkan meliputi beberapa langkah, dimulai dengan ekstraksi fitur menggunakan Large Language Model (LLM) dan Regular Expression (Regex), diikuti oleh optimasi hyperparameter XGBoost menggunakan Particle Swarm Optimization (PSO). Hasil penelitian menunjukkan bahwa model dengan ekstraksi fitur menggunakan metode Regex mengungguli LLM berdasarkan nilai Mean Squared Error (MSE), Root Mean Squared Error (RMSE), dan Mean Absolute Percentage Error (MAPE). Kombinasi ekstraksi fitur menggunakan Regex dan TFIDF memberikan hasil yang optimal dalam hal waktu pemrosesan dan akurasi prediksi. Hyperparameter terbaik untuk XGBoost ditemukan dengan max-depth 51,49, subsample 0,89, dan min_child_weight 0,65, yang meningkatkan akurasi MAPE menjadi 14,6%. Meskipun model Random Forest memiliki akurasi prediksi sedikit lebih baik dengan MAPE sebesar 12,8%, namun waktu pemrosesannya sangat lama sekitar 3 jam membuatnya kurang efisien. Sebaliknya, XGBoost dengan waktu pemrosesan hanya 51,49 detik dan MAPE 14,6% dipilih sebagai model terbaik karena akurasi yang cukup baik dengan waktu komputasi yang cepat.
Abstact
Imports in Indonesia fulfill domestic needs and sustain manufacturing and distribution. Under invoicing, where imported products are purposely underpriced, reduces state revenue. This study predicts imported goods prices to reduce financial losses. The Data Analytics Community (Mof-DAC) of the Indonesian Ministry of Finance provided the Kaggle imported products dataset. The Large Language Model (LLM) and Regular Expression are used to extract features in the suggested method. XGBoost hyperparameters are then optimized using Particle Swarm Optimization. Research shows that the Regex-extracted feature model outperforms the LLM model in MSE, RMSE, and MAPE. Regex feature extraction and TFIDF produce the best processing time and prediction accuracy. The ideal XGBoost hyperparameters were a maximum depth of 51.49, a subsample value of 0.89, and a minimum child weight of 0.65. These hyperparameters increased MAPE accuracy to 14.6%. The Random Forest model has a Better Prediction Accuracy (MAPE) of 12.8%, but its processing time is 3 hours, lowering its efficiency. XGBoost was chosen as the best model due to its 51.49-second processing time and 14.6% MAPE. High accuracy and efficient computing make this model effective.
Downloads
Referensi
ASMAH, E.E., ANDOH, F.K. AND TITRIKU, E., 2020. Trade Misinvoicing Effects on Tax Revenue in Sub‐Saharan Africa: The Role of Tax Holidays and Regulatory Quality. Annals of Public and Cooperative Economics, 91(4), pp.649–672.
ASMAH, E.E., ANDOH, F.K. AND TITRIKU, E., 2020. Trade Misinvoicing Effects on Tax Revenue in Sub‐Saharan Africa: The Role of Tax Holidays and Regulatory Quality. Annals of Public and Cooperative Economics, 91(4), pp.649–672.
FANG, J., WANG, H., YANG, F., YIN, K., LIN, X. AND ZHANG, M., 2022. A failure prediction method of power distribution network based on PSO and XGBoost. Australian Journal of Electrical and Electronics Engineering, [online] 19(4), pp.371–378.
GU, Y., ZHANG, D. AND BAO, Z., 2021. A New Data-Driven Predictor, PSO-XGBoost, Used for Permeability of Tight Sandstone Reservoirs: A Case Study of Member of Chang 4+5, Western Jiyuan Oilfield, Ordos Basin. Journal of Petroleum Science and Engineering, 199, p.108350.
HANIFAH, U., 2022. Pengaruh Ekspor Dan Impor Terhadap Pertumbuhan Ekonomi Di Indonesia. Transekonomika: Akuntansi, Bisnis Dan Keuangan, 2(6), pp.107–126.
HEYDT, M., 2019. GFI: Indonesia lost estimated US$6.5 billion to trade misinvoicing in 2016. [online] Washington DC. Available at: <https://gfintegrity.org/press-release/gfi-indonesia-lost-estimated-us6-5-billion-to-trade-misinvoicing-in-2016/>.
LAI, M. AND HOU, J., 2023. Let Us Misinvoice More? The Effect Of e Jure capital Controls on Trade Misinvoicing. World Economy, 46(7), pp.2157–2186.
LI, J., ZHANG, Z. AND WANG, X., 2023. Performance-Oriented Road Structure and Material Design Method Based on Enhanced XGBoost Algorithm. International Journal of Pavement Engineering, 25(1).
MAI, Y., SHENG, Z., SHI, H. AND LIAO, Q., 2021. Using Improved XGBoost Algorithm to Obtain Modified Atmospheric Refractive Index. International Journal of Antennas and Propagation, 2021, pp.1–11.
NAN, L., 2023. A Model for Analyzing Employee Turnover in Enterprises Based on Improved XGBoost Algorithm. International Journal of Advanced Computer Science and Applications, 14(11).
QIN, C., ZHANG, Y., BAO, F., ZHANG, C., LIU, P. AND LIU, P., 2021. XGBoost optimized by adaptive particle swarm optimization for credit scoring. Mathematical Problems in Engineering, 2021.
SHI, Y., 2024. Short-Term Wind Speed Forecasting Based on a Hybrid Model That Integrates PSO-LSSVM and XGBoost. International Journal of Low-Carbon Technologies, 19, pp.1138–1143.
SU, M., SU, Z., CAO, S., PARK, K. AND BAE, SI-HWA, 2023. Fuel Consumption Prediction and Optimization Model for Pure Car/Truck Transport Ships. Journal of Marine Science and Engineering, 11(6), p.1231.
THIAO, A., 2021. The Effect of Illicit Financial Flows on Government Revenues in the West African Economic and Monetary Union Countries. Cogent Social Sciences, 7(1).
Peraturan Menteri Keuangan Republik Indonesia (PMK) Nomor: 112/PMK.04/2018 Tentang Perubahan Atas PMK No. 182/PMK.04/2016 mengenai Ketentuan Impor Barang Kiriman. Jakarta: Kementerian Keuangan.
Unduhan
Diterbitkan
Terbitan
Bagian
Lisensi
Hak Cipta (c) 2025 Jurnal Teknologi Informasi dan Ilmu Komputer

Artikel ini berlisensiCreative Commons Attribution-ShareAlike 4.0 International License.

Artikel ini berlisensi Creative Common Attribution-ShareAlike 4.0 International (CC BY-SA 4.0)
Penulis yang menerbitkan di jurnal ini menyetujui ketentuan berikut:
- Penulis menyimpan hak cipta dan memberikan jurnal hak penerbitan pertama naskah secara simultan dengan lisensi di bawah Creative Common Attribution-ShareAlike 4.0 International (CC BY-SA 4.0) yang mengizinkan orang lain untuk berbagi pekerjaan dengan sebuah pernyataan kepenulisan pekerjaan dan penerbitan awal di jurnal ini.
- Penulis bisa memasukkan ke dalam penyusunan kontraktual tambahan terpisah untuk distribusi non ekslusif versi kaya terbitan jurnal (contoh: mempostingnya ke repositori institusional atau menerbitkannya dalam sebuah buku), dengan pengakuan penerbitan awalnya di jurnal ini.
- Penulis diizinkan dan didorong untuk mem-posting karya mereka online (contoh: di repositori institusional atau di website mereka) sebelum dan selama proses penyerahan, karena dapat mengarahkan ke pertukaran produktif, seperti halnya sitiran yang lebih awal dan lebih hebat dari karya yang diterbitkan. (Lihat Efek Akses Terbuka).