Analisis Klasifikasi Status Perokok Menggunakan Algoritma Decision Tree Berbasis RapidMiner
DOI:
https://doi.org/10.35473/jamastika.v5i1.4639Abstract
Perilaku merokok merupakan salah satu kebiasaan yang berdampak negatif terhadap kesehatan dan menjadi faktor utama berbagai penyakit kronis. Penelitian ini bertujuan untuk menganalisis klasifikasi status perokok menggunakan algoritma Decision Tree berbasis RapidMiner. Data yang digunakan meliputi atribut seperti usia, jenis kelamin, tingkat pendidikan, pekerjaan, serta jumlah konsumsi rokok per hari. Melalui penerapan algoritma Decision Tree, proses klasifikasi dilakukan untuk membedakan individu ke dalam kategori perokok ringan, sedang, dan berat. Hasil penelitian menunjukkan bahwa algoritma Decision Tree mampu menghasilkan tingkat akurasi yang baik dalam mengidentifikasi status perokok berdasarkan pola data yang dianalisis. Implementasi model ini diharapkan dapat membantu pihak terkait dalam memahami faktor-faktor yang mempengaruhi kebiasaan merokok dan menjadi dasar dalam upaya pengendalian perilaku merokok di masyarakat.
Kata Kunci: Decision Tree, Klasifikasi, Status Perokok, RapidMiner, Data Mining.
Smoking is a major risk factor for various chronic diseases, such as lung cancer and heart disease. This study aims to classify smoker status using a decision tree algorithm based on RapidMiner software. The data used consists of several attributes such as age, gender, education level, occupation, and daily cigarette consumption frequency. The C4.5 algorithm was used as the basis for the decision tree method due to its ability to handle both numeric and categorical data. The research process included data collection, data cleaning, model development, and evaluation using a confusion matrix with accuracy, precision, and recall parameters. Test results showed that the classification model using the Decision Tree algorithm achieved an accuracy rate of 92.4%, precision of 91.2%, and recall of 90.8%. This demonstrates the effectiveness of the RapidMiner-based Decision Tree in classifying smoker status in the Indonesian community.
Keywords: Decision Tree, RapidMiner, C4.5, Classification, Smoker Status.
References
Fazrin Meila Azzahra Sofyan, A. V. Y. U. (2023). 6810-Article Text-24745-1-10-20230910. JATI(Jurnal Mahasiswa Teknik Informatika), 7(2), 1–7.
Hussein, S., Kristian, L., Alfi, M., & Munajid, K. (2024). Penerapan Decision Tree Pada Penjualan Harga Rokok ( Application Of The Decision Tree In Cigarette Sales Prices ). 3(2), 190–197.
Kurniawati, L., Priyanto, D., Sulistianingsih, N., & Syahrir, M. (2025). Perbandingan Metode Berbasis Decision Tree untuk Mendeteksi Penyakit Paru Comparison of Decision Tree-Based Methods in Lung Disease Detection. 7(1), 51–62. https://doi.org/10.30812/bite.v7i1.4909
Laksono, P., Lorensia, A., & Suryadinata, R. V. (2023). Pengetahuan Penyakit Pernapasan Kronik pada Perokok Aktif (Knowledge of Chronic Respiratory Diseases in Active Smokers). CoMPHI Journal: Community Medicine and Public Health of Indonesia Journal, 3(3), 225–234. http://repository.ubaya.ac.id/45032/
Machfud, S., & Cahyono, Y. (2024). Klasifikasi Penyakit Kanker Paru-Paru Menggunakan Metode C4 . 5. 5(2), 109–117. https://doi.org/10.31284/j.kernel.2024.v5i2.7315
Putri, A. D., Sholekhah, F., & Dadynata, E. (2024). The Application of C4 . 5 Decision Tree Algorithm for Predicting the Survival Rate of Thyroid Cancer Patients Penerapan Algoritma Decesion Tree C4 . 5 untuk Memprediksi Tingkat Kelangsungan Hidup Pasien Kanker Tiroid. 4(October), 1485–1495.
World Health Organization. (2021). WHO report on the global tobacco epidemic. WHO Press.
Gervasoni, J. P., & Gonzales, V. A. (2020). Smoking behavior classification using decision tree algorithm. International Journal of Computer Applications, 176(12), 15–22.
Putra, A. P., & Sari, D. M. (2021). Penerapan algoritma C4.5 untuk klasifikasi perokok berdasarkan faktor risiko kesehatan. Jurnal Teknologi Informasi dan Ilmu Komputer, 8(4), 455–462.
Nugroho, Y., & Prasetyo, E. (2022). Analisis faktor kebiasaan merokok dan klasifikasi status perokok menggunakan machine learning. Jurnal Informatika, 19(2), 123–131.
Yanti, R., & Hidayat, S. (2020). Implementasi algoritma decision tree untuk klasifikasi risiko penyakit paru-paru. Jurnal Sistem Informasi, 16(3), 299–308.
Syahputra, M. H., & Ningsih, Y. (2023). Penerapan metode C4.5 untuk memprediksi kategori perokok pada data kesehatan. Jurnal Teknologi dan Sains, 11(2), 88–96.
Indonesia Ministry of Health. (2020). Laporan nasional perilaku merokok masyarakat Indonesia. Kementerian Kesehatan Republik Indonesia.
Hastie, T., Tibshirani, R., & Friedman, J. (2017). The elements of statistical learning: Data mining, inference, and prediction (2nd ed.). Springer.
Oktaviani, L., & Setiawan, A. (2021). Analisis pohon keputusan untuk menentukan kebiasaan merokok pada kalangan remaja. Jurnal Ilmiah Informatika, 6(1), 45–53.






