Klasifikasi Prestasi Akademik Siswa Menggunakan Algoritma Decision Tree dengan RapidMiner

Authors

  • Alifan Ibrohim Universitas Ibrahimy
  • Zaehol Fatah Universitas Ibrahimy

DOI:

https://doi.org/10.35473/jamastika.v5i1.4587

Abstract

Penelitian ini bertujuan untuk mengklasifikasikan prestasi akademik siswa dengan mempertimbangkan berbagai faktor yang memengaruhi hasil belajar. Algoritma Decision Tree diimplementasikan menggunakan perangkat lunak RapidMiner dengan data bersumber dari dataset Student Performance Factors. Dataset tersebut memuat atribut seperti Hours_Studied, Attendance, Parental_Involvement, Access_to_Resources, Previous_Scores, Motivation_Level, Sleep_Hours, Internet_Access, dan Tutoring_Sessions, dengan Exam_Score sebagai label target. Proses penelitian meliputi tahapan pengumpulan, pembersihan, dan transformasi data, kemudian pembagian data menjadi 80% data latih dan 20% data uji. Hasil analisis menunjukkan bahwa atribut Hours_Studied dan Attendance merupakan faktor dominan dalam menentukan prestasi siswa. Model pohon keputusan berhasil mengelompokkan siswa ke dalam tiga kategori, yaitu Low (100 data), Medium (4.498 data), dan High (27 data) dari total 4.625 data. Temuan ini membuktikan bahwa metode Decision Tree efektif untuk mengenali pola hubungan faktor belajar terhadap prestasi akademik dan dapat menjadi dasar evaluasi bagi pihak sekolah dalam meningkatkan kualitas pembelajaran.

Kata Kunci: Decision Tree, RapidMiner, Data Mining, Klasifikasi Prestasi Akademik, Student Performance Factors

 

This study aims to classify students' academic achievement by considering various factors that influence learning outcomes. The Decision Tree algorithm was implemented using RapidMiner software with data sourced from the Student Performance Factors dataset. The dataset contains attributes such as Hours_Studied, Attendance, Parental_Involvement, Access_to_Resources, Previous_Scores, Motivation_Level, Sleep_Hours, Internet_Access, and Tutoring_Sessions, with Exam_Score as the target label. The research process included data collection, cleaning, and transformation, followed by dividing the data into 80% training data and 20% test data. The analysis results showed that the attributes Hours_Studied and Attendance were dominant factors in determining student achievement. The decision tree model successfully grouped students into three categories, namely Low (100 data), Medium (4,498 data), and High (27 data) from a total of 4,625 data. These findings prove that the Decision Tree method is effective in recognizing patterns of the relationship between learning factors and academic achievement and can be used as a basis for evaluation by schools in improving the quality of learning.

 Keyword :Decision Tree, RapidMiner, Data Mining, Academic Achievement Classification, Student Performance Factors

References

Arifianto, A. S., Dewi Safitri, K., Agustianto, K., & Wiryawan, I. G. (2022). Pengaruh Prediksi Missing Value pada Klasifikasi Decision Tree C4.5. Jurnal Teknologi Informasi Dan Ilmu Komputer, 9(4), 779–786. https://doi.org/10.25126/jtiik.2022944778

Deigo Anugrah Pratama, Ibnu Rizal Mutaqin, & Kevin Rafael Manuela. (2023). Analisis Terjadinya Kanker Paru-Paru Pada Pasien Menggunakan Decision Tree: Penerapan Algoritma C4.5 Dan RapidMiner Untuk Menentukan Risiko Kanker Pada Gejala Pasien. Jurnal Teknik Mesin, Industri, Elektro Dan Informatika, 2(4), 156–170. https://doi.org/10.55606/jtmei.v2i4.3004

Gunawan, M. T., Tine, J. Y., & Murwaningtyas, C. E. (2024). Model decision tree untuk prediksi prestasi akademik matematika siswa kelas VIII SMP Frater Don Bosco Manado. Jurnal Pendidikan Informatika Dan Sains, 13(2), 141–153. https://doi.org/10.31571/saintek.v13i2.7696

Husein, A. M., & Hutauruk, R. E. H. (2022). Penerapan Algoritma C4.5 Dalam Pemilihan Siswa Berprestasi di SMPN 10 Medan. Digital Transformation Technology, 2(1), 8–11. https://doi.org/10.47709/digitech.v2i1.1768

Maqfiroh, F., & Mujiyono, S. (2022). Penerapan Klasifikasi Algoritma Data Mining C4.5 Untuk Memprediksi Tingkat Kelulusan Siswa Di Lembaga Pelatihan Kerja Shinju Semarang. Jurnal Mahasiswa Teknik Informatika, 1(2), 35–49. https://doi.org/10.35473/.v1i2.1874

Nailil Amani, N., Martanto, M., & Hayati, U. (2024). Penggunaan Algoritma Decision Tree Untuk Prediksi Prestasi Siswa Di Sekolah Dasar Negeri 3 Bayalangu Kidul. JATI (Jurnal Mahasiswa Teknik Informatika), 8(1), 473–479. https://doi.org/10.36040/jati.v8i1.8355

Nazifah, N. (2023). Analisis Perbandingan Decision Tree Algoritma C4.5 dengan algoritma lainnya: Sistematic Literature Review. Jurnal Informatika Dan Teknologi Komputer ( J-ICOM), 4(2), 57–64. https://doi.org/10.55377/j-icom.v4i2.7719

Rahman, A. (2023). Klasifikasi Performa Akademik Siswa Menggunakan Metode Decision Tree dan Naive Bayes. Jurnal SAINTEKOM, 13(1), 22–31. https://doi.org/10.33020/saintekom.v13i1.349

Rajagukguk, S. A. (2021). Tinjauan Pustaka Sistematis: Prediksi Prestasi Belajar Peserta Didik Dengan Algoritma Pembelajaran Mesin. Jurnal Sains, Nalar, Dan Aplikasi Teknologi Informasi, 1(1). https://doi.org/10.20885/snati.v1i1.4

Ramadhan, P., Yuhandri, & Veri, J. (2025). Eksplorasi Algoritma Decision Tree untuk Penentuan Siswa Berprestasi. Bit-Tech, 7(3), 826–833. https://doi.org/10.32877/bt.v7i3.2210

Solehuddin, M., Syafei, W. A., & Gernowo, R. (2022). Metode Decision Tree untuk Meningkatkan Kualitas Rencana Pelaksanaan Pembelajaran dengan Algoritma C4.5. Jurnal Penelitian Dan Pengembangan Pendidikan, 6(3), 510–519. https://doi.org/10.23887/jppp.v6i3.52840

Srirahayu, A., & Pribadie, L. S. (2023). Review Paper Data Mining Klasifikasi Data Mining. 14(April).

Triayudi, A., & Fitri, I. (2021). Comparison Of The Feature Selection Algorithm In Educational Data Mining. Telkomnika (Telecommunication Computing Electronics and Control), 19(6), 1865–1871. https://doi.org/10.12928/TELKOMNIKA.v19i6.21594

Widaningsih, S. (2022). Penerapan Data Mining untuk Memprediksi Siswa Berprestasi dengan Menggunakan Algoritma K Nearest Neighbor. JATISI (Jurnal Teknik Informatika Dan Sistem Informasi), 9(3), 2598–2611. https://doi.org/10.35957/jatisi.v9i3.859

Yulianto, A., & Firmansyah, F. (2022). Prediksi Hasil Belajar Peserta Didik Menggunakan Model Multiple Linier Regression. Remik, 6(4), 654–663. https://doi.org/10.33395/remik.v6i4.11763

Downloads

Published

2026-04-16