Algoritma Keputusan C4.5 Untuk Klasifikasi Data Medis Pasien
DOI:
https://doi.org/10.35473/jamastika.v5i1.4649Abstract
Penelitian ini bertujuan untuk mengklasifikasikan status kesehatan pasien berdasarkan data rekam medis menggunakan algoritma pohon keputusan C4.5. Dataset yang digunakan terdiri dari 1000 entri pasien dengan atribut seperti usia, kadar gula, tekanan darah, gejala, dan riwayat keluarga. Studi ini dilakukan menggunakan metode kuantitatif dengan karakter deskriptif eksploratif. Pemodelan dilakukan menggunakan perangkat lunak RapidMiner dengan tahapan: praproses data, penentuan atribut target, pembangunan model klasifikasi, dan evaluasi hasil. Hasil pemodelan menunjukkan bahwa atribut Kadar_Gula memiliki bobot tertinggi dan menjadi akar dari pohon keputusan, disusul oleh Usia dan Riwayat_Keluarga. Model yang dihasilkan bersifat logis dan sistematis, serta menunjukkan jalur klasifikasi yang mudah ditelusuri. Proses pruning otomatis yang dilakukan oleh algoritma mencegah overfitting, sehingga model memiliki performa generalisasi yang baik. Model dievaluasi memakai teknik 10-fold cross-validation, kemudian hasilnya dipresentasikan dalam bentuk visualisasi melalui struktur pohon serta grafik bobot atribut. Analisis data mengindikasikan bahwa implementasi algoritma C4.5 memberikan performa yang efisien dalam pengolahan data rekam medis untuk mendukung sistem pengambilan keputusan medis yang berbasis data.
Kata Kunci: Medical Data, Algoritma C4.5, Decision Tree, RapidMine, Klasifikasi.
The study is conducted to determine patient health categories through the utilization of the C4.5 decision tree model on medical data. The dataset used consists of 1000 patient entries with attributes such as age, blood sugar level, blood pressure, symptoms, and family history. This work is conducted using a quantitative method that emphasizes descriptive and exploratory analysis. Modeling is carried out using RapidMiner software with the following stages: data preprocessing, determining target attributes, building a classification model, and evaluating results. The modeling results show that the Blood Sugar Level attribute has the highest weight and is the root of the decision tree, followed by Age and Family History. The resulting model is logical and systematic, and shows an easy-to-track classification path. The automatic pruning process carried out by the algorithm prevents overfitting, so that the model has good generalization performance. Employing the 10-fold cross-validation procedure, the model evaluation results were depicted via a decision tree layout and an attribute importance graph. These results indicate that the C4.5 algorithm is effective in processing medical record data to support a data-based medical decision-making system.
Keywords: Medical Data, C4.5 Algorithm, Decision Tree, RapidMiner, Classification.
References
Budiarti, L. (2025). Sistem Pendukung Keputusan untuk Klasifikasi Penyakit Kuning dengan Algoritma Decision Tree. 2, 43–48.
Elektro, J. T. (2013). Klasifikasi Data Rekam Medis Berdasarkan Kode Penyakit Internasional Menggunakan Algoritma C4.5 Wenefrida Tulit Ina. Jurnal Media Elektro, 1(3), 105–110.
Fiandra, Y. A., Defit, S., & Yuhandri, Y. (2017). Penerapan Algoritma C4.5 untuk Klasifikasi Data Rekam Medis berdasarkan International Classification Diseases (ICD-10). Jurnal RESTI (Rekayasa Sistem Dan Teknologi Informasi), 1(2), 82–89. https://doi.org/10.29207/resti.v1i2.48
Mansiz, M. I., Homaidi, A., Prasetyo, J. D., Informasi, T., Sains, F., & Ibrahimy, U. (2025). Implementasi Algoritma Klasifikasi C4 . 5 Untuk Memprediksi Resiko Terkena Penyakit Paru-Paru. 4(4), 1164–1171.
Pamungkas, W. A., Statistika, P. S., Terbuka, U., & Selatan, T. (2025). Penerapan klasifikasi data mining untuk prediksi dengan metode algoritma decission tree. 2(2), 655–678.
Treise, C., Brown, R. J., & Perez, J. (2019). Towards a Multi-Level Phenomenology of Delusional Disorder: The Dissociative Thought-Script. Psychopathology, 52(1), 50–58. https://doi.org/10.1159/000499596
Wulandari, D. (2025). Analisis Penerapan Metode Decision Tree C4.5 dalam Klasifikasi Penyakit Jantung. Journal of Informatics and Applied Computing, 7(2), 101–109.
Han, J., Kamber, M., & Pei, J. (2012). Data Mining: Concepts and Techniques. Morgan Kaufmann.
Sucipto, H., & Rachman, F. (2020). Penerapan Algoritma C4.5 untuk Klasifikasi Penyakit Jantung Berdasarkan Data Rekam Medis Pasien. Jurnal Teknologi dan Sistem Komputer, 8(3), 223–230.
Yulia, R., & Santoso, B. (2019). Penerapan Data Mining untuk Klasifikasi Penyakit Kanker Serviks Menggunakan Algoritma C4.5. Jurnal Rekayasa Sistem dan Teknologi Informasi (RESTI), 3(2), 235–242.
Andini, L., & Prasetyo, J. D. (2022). Implementasi Data Mining Menggunakan Algoritma C4.5 untuk Prediksi Penyakit Jantung. Jurnal RESTI (Rekayasa Sistem dan Teknologi Informasi), 6(1), 123–130.
Lestari, N., & Wibowo, D. (2023). Analisis Prediksi Risiko Stroke Menggunakan Algoritma Decision Tree C4.5. Jurnal Sistem Cerdas, 5(2), 201–210.
Setiawan, B., & Ramadhani, E. (2024). Penerapan Metode C4.5 untuk Klasifikasi Penyakit Demam Berdarah Berdasarkan Gejala Klinis. Jurnal Sains Komputer dan Informatika (JSAKTI), 9(1), 33–41.
Rohman, M., & Supriyanto, A. (2021). Penerapan Algoritma C4.5 untuk Klasifikasi Penyakit Diabetes Melitus. Jurnal Teknologi dan Sistem Informasi (JTSI), 9(2), 87–94.
Kusuma, D., & Arifin, M. (2020). Klasifikasi Data Rekam Medis Menggunakan Algoritma C4.5 dan Naïve Bayes. Jurnal Ilmiah Informatika dan Komputer (JIIK), 8(3), 155–164.






