Prediksi Harga Perumahan Menggunakan Metode Principal Component Analysis dan Random Forest Regresi
DOI:
https://doi.org/10.25126/jtiik.2025126Kata Kunci:
Prediksi, Harga Perumahan, PCA, Random ForestAbstrak
Penentuan harga merupakan salah satu aspek krusial dalam kegiatan pengembangan properti mengingat hal tersebut akan mempengaruhi margin keuntungan yang diperoleh pengembang dan pilihan pembelian properti. Selama bertahun-tahun, prediksi harga rumah telah menjadi topik penelitian utama, karena permintaan rumah terus meroket. Sangat penting untuk mengembangkan kerangka kerja yang sesuai yang memungkinkan pembeli dan penjual untuk membuat keputusan cepat dalam hal membeli atau menjual properti. Dalam penelitian ini menggunakan metode Principal Component Analysis (PCA) dan Random Forest (RF), dengan tujuan untuk melakukan analisis akurasi penggunaan kedua metode dalam prediksi harga rumah dan untuk mengetahui pengaruh penggunaan PCA dalam mengoptimalkan metode random forest. Data yang digunakan adalah harga rumah di kota Surakarta berdasarkan hasil scraping data di situs propertygurugroup.com. Hasil analisis menunjukkan bahwa jumlah penjualan rumah tertinggi adalah daerah Plesungan, dan penjualan rumah yang memiliki sertifikat hak milik juga paling tinggi. Dari sepuluh variabel yang ada, luas tanah dan bangunan paling berpengaruh terhadap harga jual. Hasil pelatihan model menunjukkan bahwa peggabungan metode RF dan PCA memiliki nilai yang lebih optimal dibanding hanya menggunakan metode RF saja. Tingkat kesalahan dalam metode PCA lebih kecil, dengan rerata 0,0257 maka nilainya lebih konsisten dibanding hanya menggunakan metode RF yang nilai kesalahannya lebih besar dengan rerata 0,0332. Waktu pelatihan model menggunakan PCA lebih cepat (5005,75) dibanding hanya menggunakan metode RF (6099,25).
Abstract
Determining prices is one of the crucial aspects in property development activities considering that this will affect the profit margin obtained by developers and property purchase choices. Over the years, home price prediction has been a major research topic, as demand for homes continues to increase. It is important to develop a suitable framework that allows buyers and sellers to make quick decisions when it comes to buying or selling a property. This research uses the Principal Component Analysis (PCA) and Random Forest (RF) methods, with the aim of accuracy analyzing using both methods in predicting housing prices and to determine the effect of using PCA in optimizing the random forest method. The data used is house prices in Surakarta city based on data scraping results on propertygurugroup.com site. The analysis results show that the highest house sales is in Plesungan area, and houses sale with ownership certificates is also the highest. Of the ten variables, land area and building have the most influence on selling price. Model training results show that combination of RF and PCA methods has a more optimal value than using only RF method. Error rate in the PCA method is smaller, with an average of 0.0257, so the value is more consistent than just using the RF method, which has a larger error value with an average of 0.0332. The model training time using PCA is faster (5005.75) than just using the RF method (6099.25).
Downloads
Referensi
ANALISA, F.C.K. and OKADA, S., 2023. Tiny house characteristics in Indonesia based on millennial’s user preference, Urban, Planning and Transport Research, 11(1). Available at: https://doi.org/10.1080/21650020.2023.2166095.
CAHYANI PUTRI, N.A. and ARIANTO, D.B., 2024. Komparasi Penggunaan Information Gain Pada Machine Learning untuk Memprediksi Harga Rumah di Jabodetabek, Jurnal Sains dan Teknologi, 5(3), pp. 756–762. Available at: https://doi.org/10.55338/saintek.v5i3.2052.
DHAKA, N. et al., 2024. Prediction of House Pricing Using Machine Learning. Tuijin Jishu/Journal of Propulsion Technology, 45(2), pp. 1026–1034. Available at: https://doi.org/10.1109/ICAC3N60023.2023.10541549.
IGAMO, A.M. et al. 2023. Monetary Policy and Demographics: Empirical Evidence for Housing Prices in Indonesia. Sriwijaya International Journal of Dynamic Economics and Business, 6(4), pp. 371–384. Available at: https://doi.org/10.29259/sijdeb.v6i4.371-384.
JÁUREGUI-VELARDE, R. et al. 2023. Web Application with Machine Learning for House Price Prediction. International Journal of Interactive Mobile Technologies, 17(23), pp. 85–104. Available at: https://doi.org/10.3991/IJIM.V17I23.38073.
LU, Y., SHI, V. and PETTIT, C.J., 2023. The Impacts of Public Schools on Housing Prices of Residential Properties: A Case Study of Greater Sydney, Australia. ISPRS International Journal of Geo-Information, 12(7). Available at: https://doi.org/10.3390/ijgi12070298.
PARHUSIP, H.A. et al. 2022. Data Exploration Using Tableau and Principal Component Analysis. International Journal on Informatics Visualization, 6(4), pp. 911–920. Available at: https://doi.org/10.30630/joiv.6.4.952.
PERDAMAIAN, L.G. and ZHAI, Z. (John). 2024. Status of Livability in Indonesian Affordable Housing. Architecture, 4(2), pp. 281–302. Available at: https://doi.org/10.3390/architecture4020017.
PITALOKA, E., HARTANTO, T.B.A. and SANDIWARNO, S. 2024. Penerapan Machine Learning Untuk Prediksi Bencana Banjir. Jurnal Sistem Informasi Bisnis, 14(1), pp. 62–76. Available at: https://doi.org/10.21456/vol14iss1pp62-76.
PRAMUKANTORO, E. SAKTI et al. 2024. Implementasi Sensor Polar H10 dan Raspberry Pi dalam Pemantauan dan Klasifikasi Detak Jantung Beberapa Individu Secara Simultan dengan Pendekatan Machine Learning. Jurnal Teknologi Informasi dan Ilmu Komputer, 11(1), pp. 175–182. Available at: https://doi.org/10.25126/jtiik.20241117716.
PRASETYO, T. et al. 2024. Perbandingan Kinerja Metode Arima, Multi-Layer Perceptron, Dan Random Forest Dalam Peramalan Harga Logam Mulia Berjangka Yang Mengandung Pencilan. Jurnal Teknologi Informasi dan Ilmu Komputer (JTIIK), 11(2), pp. 265–274. Available at: https://doi.org/10.25126/jtiik.20241127392.
RAHADI, R.A. et al. 2020. Determining the factors influencing residential property price: A comparative study between Indonesia and Malaysia. Desision science letters, 9, pp. 421–438. Available at: https://doi.org/10.5267/dsl.2022.6.002.
RAHMAN, M.K.A. et al. 2022. Hand Gesture Recognition Based on Continuous Wave (CW) Radar Using Principal Component Analysis (PCA) and K-Nearest Neighbor (KNN) Methods. International Journal on Informatics Visualization, 6(1–2), pp. 188–194. Available at: https://doi.org/10.30630/joiv.6.1-2.926.
SAPUTRA, E.P. et al. 2023. Komparasi Machine Learning Berbasis Pso Untuk Prediksi Tingkat Keberhasilan Belajar Berbasis E-Learning. Jurnal Teknologi Informasi dan Ilmu Komputer, 10(2), pp. 321–328. Available at: https://doi.org/10.25126/jtiik.20231026469.
SAPUTRA, I.N.Y., SAADAH, S. and YUNANTO, P.E. 2021. Analysis of Random Forest, Multiple Regression, and Backpropagation Methods in Predicting Apartment Price Index in Indonesia. Jurnal Ilmiah Teknik Elektro Komputer dan Informatika, 7(2), p. 238. Available at: https://doi.org/10.26555/jiteki.v7i2.20997.
SRIVASTAVA, K. et al. 2021. House Price Prediction Using Machine Learning. in Proceedings - 2021 3rd International Conference on Advances in Computing, Communication Control and Networking, ICAC3N 2021, pp. 203–206. Available at: https://doi.org/10.1109/ICAC3N53548.2021.9725552.
TANAMAL, R. et al. 2023. House Price Prediction Model Using Random Forest in Surabaya City. TEM Journal, 12(1), pp. 126–132. Available at: https://doi.org/10.18421/TEM121-17.
UTAMA, A.A.G.S. 2022. The Best Model And Variables Affecting Housing Values Of Big Cities In Indonesia. Galaxy International Interdisciplinary Research Journal (GIIRJ), 10(6), pp. 782–793. Available at: https://internationaljournals.co.in/index.php/giirj/article/view/2238.
WINANTO, E.A. et al. 2024. Peningkatan Performa Deteksi Serangan Menggunakan Metode Pca Dan Random Forest, 11(2), pp. 285–290. Available at: https://doi.org/10.25126/jtiik.20241127678.
WIRATMAN, A.B. and WELLA. 2024. Personalized Learning Models Using Decision Tree and Random Forest Algorithms in Telecommunication Company. International Journal on Informatics Visualization, 8(1), pp. 318–325. Available at: https://doi.org/10.62527/joiv.8.1.1905.
Unduhan
Diterbitkan
Terbitan
Bagian
Lisensi
Hak Cipta (c) 2025 Jurnal Teknologi Informasi dan Ilmu Komputer

Artikel ini berlisensiCreative Commons Attribution-ShareAlike 4.0 International License.

Artikel ini berlisensi Creative Common Attribution-ShareAlike 4.0 International (CC BY-SA 4.0)
Penulis yang menerbitkan di jurnal ini menyetujui ketentuan berikut:
- Penulis menyimpan hak cipta dan memberikan jurnal hak penerbitan pertama naskah secara simultan dengan lisensi di bawah Creative Common Attribution-ShareAlike 4.0 International (CC BY-SA 4.0) yang mengizinkan orang lain untuk berbagi pekerjaan dengan sebuah pernyataan kepenulisan pekerjaan dan penerbitan awal di jurnal ini.
- Penulis bisa memasukkan ke dalam penyusunan kontraktual tambahan terpisah untuk distribusi non ekslusif versi kaya terbitan jurnal (contoh: mempostingnya ke repositori institusional atau menerbitkannya dalam sebuah buku), dengan pengakuan penerbitan awalnya di jurnal ini.
- Penulis diizinkan dan didorong untuk mem-posting karya mereka online (contoh: di repositori institusional atau di website mereka) sebelum dan selama proses penyerahan, karena dapat mengarahkan ke pertukaran produktif, seperti halnya sitiran yang lebih awal dan lebih hebat dari karya yang diterbitkan. (Lihat Efek Akses Terbuka).












