Prediksi Harga Rumah Menggunakan Algoritma Regresi Linier

Authors

  • Muwasatil Muhtajin Universitas Ibrahimy
  • Zaehol fatah Universitas Ibrahimy

DOI:

https://doi.org/10.35473/jamastika.v5i1.4703

Abstract

The property market, particularly the housing sector, frequently experiences price fluctuations influenced by various complex factors such as location, building size, number of rooms, and economic and demographic conditions. This price uncertainty often makes it difficult for sellers to set competitive selling prices and makes it difficult for buyers to estimate the fair value of a residence. This study aims to develop a house price prediction model using a Machine Learning algorithm, namely Multiple Linear Regression. The research data was obtained from the Kaggle public repository (USA Housing Dataset), which contains 5,000 transaction data with independent variables being the average regional income, building age, number of rooms, number of bedrooms, and regional population. The research methodology follows the stages of Knowledge Discovery in Database (KDD), starting from data collection, cleaning, transformation, modeling, and evaluation. The model was built using the Python programming language with the help of the Scikit-Learn library. The test results show that linear regression is able to provide house price predictions with very good performance, indicated by an R-Squared (R²) value of 0.91, a Mean Absolute Error (MAE) of 81,250, and a Root Mean Squared Error (RMSE) of 100,500. These findings indicate that demographic characteristics and physical attributes of buildings have a strong linear relationship to house selling prices.

 Keywords: Data Mining, Machine Learning, House Price Prediction, Python, Linear Regression.

 

Pasar properti, khususnya sektor perumahan, sering mengalami perubahan harga yang dipengaruhi oleh berbagai faktor kompleks seperti letak wilayah, luas bangunan, jumlah ruangan, serta kondisi ekonomi dan demografi. Ketidakpastian harga tersebut kerap menyulitkan penjual dalam menetapkan harga jual yang kompetitif dan membuat pembeli kesulitan memperkirakan nilai wajar suatu hunian. Penelitian ini bertujuan mengembangkan model prediksi harga rumah dengan memanfaatkan algoritma Machine Learning, yaitu Multiple Linear Regression. Data penelitian diperoleh dari repositori publik Kaggle (USA Housing Dataset) yang berisi 5.000 data transaksi dengan variabel bebas berupa rata-rata pendapatan kawasan, usia bangunan, jumlah ruangan, jumlah kamar tidur, dan populasi wilayah. Metodologi penelitian mengikuti tahapan Knowledge Discovery in Database (KDD), mulai dari pengumpulan data, pembersihan, transformasi, pemodelan, hingga evaluasi. Model dibangun menggunakan bahasa pemrograman Python dengan bantuan pustaka Scikit-Learn. Hasil pengujian menunjukkan bahwa regresi linear mampu memberikan prediksi harga rumah dengan performa yang sangat baik, ditunjukkan oleh nilai R-Squared (R²) sebesar 0.91, Mean Absolute Error (MAE) sebesar 81.250, dan Root Mean Squared Error (RMSE) sebesar 100.500. Temuan ini mengindikasikan bahwa karakteristik demografi dan atribut fisik bangunan memiliki hubungan linear yang kuat terhadap harga jual rumah.

Kata Kunci: Data Mining, Machine Learning, Prediksi Harga Rumah, Python, Regresi Linier.

References

A. S. Bachti, A. T. (2024). Prediksi Harga Mobil Toyota Bekas Menggunakan Algoritma Regresi Linear Berganda. Prosiding SEMNAS INOTEK, 8, 173-183.

Ahmad Su’aydi, Z. F. (2024). Prediksi Penjualan Sepeda Motor Second Menggunakan Algoritma Regresi Linier. Jurnal Sistem Informasi, J-SIKA, 80-88.

ARSYAF, Y. H. (2022). PREDIKSI HARGA MOBIL BEKAS MENGGUNAKAN METODE MULTIVARIATE LINEAR REGRESSION. pp. 1-5.

I. Amansyah, J. I. (2023). Prediksi Penjualan Kendaraan Menggunakan Regresi Linear: Studi Kasus pada Industri Otomotif di Indonesia. Innovative: Journal Of Social Science Research, 4(4), 1199–1216.

Ilham Amansyah, J. I. (2024). Prediksi Penjualan Kendaraan Menggunakan Regresi Linear: Studi Kasus pada Industri Otomotif di Indonesia. INNOVATIVE: Journal Of Social Science Research, 1199-1216.

M. A. A. Syukur, M. F. (2023). Penerapan Model Regresi Linear Untuk Estimasi Mobil Bekas Menggunakan Bahasa Python. EULER: Jurnal Ilmiah Matematika, Sains dan Teknologi, 11(2), 182–191.

Muhammad Iqbal, D. A. (2025). Prediksi Harga Mobil Bekas Berdasarkan Tipe Penjual dan Jenis Kendaraan Menggunakan Regresi Linier. ELKOM (Jurnal Elektronika dan Komputer), 25-37.

P. A. Azhar, M. A. (2024). Prediksi Harga Mobil Audi Bekas Menggunakan Model Regresi Linear dengan Framework Streamlit. Journal of Technology and Informatics (JoTI), 6(1), 22–28.

Putri Aulia Azhar, M. A. (2024). Prediksi Harga Mobil Audi Bekas Menggunakan Model Regresi Linear dengan Framework Streamlit. Journal of Technology and Informatics (JoTI), 22-28.

R. Dahal, R. T. (2023). Used car price prediction using Linear regression. Thesis, Advanced College of Eng.

Yohanes, R. (2024). Aplikasi Prediksi Harga Mobil Bekas Berbasis Web Dengan Metode Regresi Linear. Skripsi, Univ. Buddhi Dharma.

Downloads

Published

2026-04-16