Penerapan Metode K-Nearest Neighbor (KNN) Untuk Klasifikasi Cuaca Hujan Berbasis Data Mining
DOI:
https://doi.org/10.35473/jamastika.v5i1.4642Abstract
Perubahan iklim telah menyebabkan pola cuaca global menjadi semakin tidak teratur, sehingga mengharuskan adanya sistem peramalan yang mampu bekerja dengan cepat dan tepat. Riset ini bertujuan untuk mengklasifikasikan kondisi cuaca harian menggunakan algoritma K-Nearest Neighbor (KNN) berbasis business intelligence. Data yang dimanfaatkan dalam penelitian ini mencakup 13.201 sampel data cuaca dengan 11 atribut utama, yaitu suhu udara, kelembapan, kecepatan angin, curah hujan, tutupan awan, tekanan atmosfer, indeks ultraviolet, musim, jarak pandang, lokasi geografis, dan tipe cuaca sebagai label klasifikasi. Proses pengujian diterapkan dengan metode 10-Fold Cross Validation memanfaatkan perangkat lunak Altair AI Studio 2024.1.0. Hasil penelitian menunjukkan bahwa nilai parameter k berpengaruh signifikan terhadap performa model. Nilai k=7 menghasilkan akurasi tertinggi sebesar 89,28%, sedangkan nilai k=9 menunjukkan sedikit penurunan akurasi akibat efek over-smoothing. Analisis confusion matrix menunjukkan bahwa kelas Rainy dan Sunny memiliki tingkat klasifikasi tertinggi, sementara kesalahan terbesar terjadi antara Cloudy dan Sunny. Analisis bobot atribut menggunakan metode Weight by Information Gain menunjukkan bahwa temperature dan humidity memiliki pengaruh paling dominan terhadap hasil klasifikasi. Riset ini menegaskan bahwa algoritma KNN digunakan sebagai metode efektif dalam sistem prediksi cuaca berbasis data mining dengan hasil yang akurat dan stabil
Kata Kunci: Klasifikasi, K-Nearest Neighbor, Cuaca, Model Akurasi, Data Mining
Climate change has caused global weather patterns to become increasingly irregular, necessitating a forecasting system that can work quickly and accurately. This research aims to classify daily weather conditions using the K-Nearest Neighbor (KNN) algorithm based on business intelligence. The data utilized in this study includes 13,201 weather data samples with 11 main attributes, namely air temperature, humidity, wind speed, rainfall, cloud cover, atmospheric pressure, ultraviolet index, season, visibility, geographic location, and weather type as classification labels. The testing process was implemented using the 10-Fold Cross Validation method using Altair AI Studio 2024.1.0 software. The results showed that the value of the k parameter significantly influenced model performance. A value of k = 7 produced the highest accuracy of 89.28%, while a value of k = 9 showed a slight decrease in accuracy due to the over-smoothing effect. Confusion matrix analysis showed that the Rainy and Sunny classes had the highest classification rates, while the largest error occurred between Cloudy and Sunny. Attribute weight analysis using the Weight by Information Gain method showed that temperature and humidity had the most dominant influence on the classification results. This research confirms that the KNN algorithm is an effective method for data mining-based weather prediction systems, yielding accurate and consistent results.
Keywords: Classification, K-Nearest Neighbor, Weather, Accuracy Model, Data Mining
References
N. I., & Ismanto, E. (2025). Analisis kinerja algoritma K-Nearest Neighbor (KNN) dan Random Forest untuk klasifikasi kondisi cuaca. Jurnal Computer Science and Information Technology (CoSciTech), 6(2), 337–343.
Aldy, M. F. S., Angreni, D. S., Pusadan, M. Y., & Wirdayanti, W. (2024). Klasifikasi curah hujan menggunakan algoritma K-Nearest Neighbor (KNN) di Sulawesi Tengah. JIPI (Jurnal Ilmiah Penelitian dan Pembelajaran Informatika), 9(4), 2316–2324.
Andi, S. A., Fauzi, A. A., Nur Risal, A. A., & Adiba, F. (2023). Implementasi teknik data mining terhadap klasifikasi data prediksi curah hujan BMKG di Sulawesi Selatan. Jurnal Tekno Insentif, 17(1), 22–32.
Azzahra, C. N., Chrisnanto, Y. H., & Abdillah, G. (2025). Klasifikasi cuaca Jawa Barat menggunakan ensemble learning pada data meteorologi. Sistemasi: Jurnal Sistem Informasi, 14(5), 2028–2044.
Brawijaya, F., & Suryaningrum, K. M. (2020). Aplikasi pendeteksi dan analisa cuaca menggunakan metode K-Nearest Neighbor berbasis Android. Jurnal Sarjana Teknik Informatika, 1–10.
Dandy, D. U., & Yohannes, Y. (2023). Implementasi algoritma K-Nearest Neighbor untuk klasifikasi cuaca. Jurnal Algoritme, 4(1), 1–12.
Darmawan, Z. M. E., Dianta, A. F., Fathoni, K., Resmi Rachmawati, O. C., & Apriandy, K. I. (2025). Comparison of machine learning classification methods for weather prediction: A performance analysis. G-Tech: Jurnal Teknologi Terapan, 9(2), 715–727.
Mubarok, M. I., Purwantoro, P., & Carudin, C. (2023). Penerapan algoritma K-Nearest Neighbor (KNN) dalam klasifikasi penilaian jawaban ujian esai. JATI (Jurnal Mahasiswa Teknik Informatika), 7(5), 1–10.
Muhandhis, I., Ritonga, A. S., & Murdani, D. M. H. (2021). Implementasi metode inferensi Fuzzy Tsukamoto untuk memprediksi curah hujan dasarian di Sumenep. Jurnal Ilmiah Edutic, 8(1), 1–10.
Noviansyah, M. R., Rismawan, T., & Midyanti, D. M. (2018). Penerapan data mining menggunakan metode K-Nearest Neighbor untuk klasifikasi indeks cuaca kebakaran berdasarkan data AWS (Automatic Weather Station). Jurnal Coding: Sistem Komputer Untan, 6(2), 48–56.
Nuraeni, S., Syam, S. P. A., Wajdi, M. F., Firmansyah, B., & Malkan, M. (2023). Implementasi metode K-NN untuk menentukan jurusan siswa di SMAN 02 Manokwari. G-Tech: Jurnal Teknologi Terapan, 7(1), 89–95.
Putra, I. G. S. E., Widyatmoko, A. C., Darma Putra, I. K. G., Sudarma, M., & Sudana, O. (2025). Determining tuna grade quality based on color using Convolutional Neural Network and K-Nearest Neighbor. Lontar Komputer: Jurnal Ilmiah Teknologi Informasi, 16(2), 15–23.
Rangkuti, M. Y. R., Alfansyuri, M. V., & Gunawan, W. (2021). Penerapan algoritma K-Nearest Neighbor (KNN) dalam memprediksi dan menghitung tingkat akurasi data cuaca di Indonesia. Hexagon: Jurnal Teknik dan Sains, 2(2), 11–16.
Suryaman, S. A., Magdalena, R., & Sa’idah, S. (2021). Klasifikasi cuaca menggunakan metode VGG-16, Principal Component Analysis, dan K-Nearest Neighbor. Jurnal Ilmu Komputer dan Informatika (JIKI), 1(1), 1–8.
Yuda, A. S. A., Arif Rosady, M. D., Faisal, N. I., & Ismanto, E. (2025). Analisis kinerja algoritma K-Nearest Neighbor dan Random Forest untuk klasifikasi kondisi cuaca. Jurnal CoSciTech, 6(2), 337–343.






