Klasifikasi Komentar YouTube pada Video Pembelajaran Bahasa Inggris Menggunakan Naïve Bayes Classifier (NBC)
DOI:
https://doi.org/10.35473/jamastika.v5i1.4668Abstract
Perkembangan teknologi informasi yang pesat telah menempatkan platform YouTube sebagai sumber utama untuk memperoleh informasi dan pendidikan, khususnya dalam konteks pembelajaran bahasa Inggris, yang menghasilkan volume umpan balik pengguna yang besar dalam bentuk komentar. Tujuan penelitian ini adalah menganalisis dan mengklasifikasikan sentimen (Positif, Negatif, dan Netral) dari 50.954 komentar pada video pembelajaran bahasa Inggris di YouTube dengan mengaplikasikan algoritma Naïve Bayes Classifier (NBC). Metode penelitian kuantitatif ini melibatkan tahapan text mining yang komprehensif, mulai dari preprocessing data, pelabelan otomatis menggunakan VADER Sentiment Analyzer, hingga pembentukan matriks fitur (confusion matrix) dengan TF-IDF. Hasil evaluasi kinerja model NBC menunjukkan Akurasi Keseluruhan sebesar 84%. Walaupun akurasi tinggi, ditemukan adanya ketidakseimbangan kelas (class imbalance) yang signifikan, dengan sentimen Netral mendominasi (56.34%). Analisis metrik per kelas mengungkapkan bahwa model lemah dalam mengklasifikasikan sentimen Negatif (memiliki Recall 0.41), dengan 313 komentar Negatif salah diprediksi sebagai Positif. Penelitian menyimpulkan bahwa NBC merupakan solusi valid dan efektif, namun disarankan untuk mengaplikasikan teknik penanganan class imbalance pada studi mendatang guna meningkatkan kemampuan deteksi sentimen Negatif, yang merupakan umpan balik penting untuk peningkatan kualitas konten.
Kata Kunci: Analisis Sentimen, Naïve Bayes Classifier, YouTube, Pembelajaran Bahasa Inggris, Class Imbalance
The rapid development of information technology has positioned YouTube as a primary platform for accessing information and education, particularly within the context of English language learning, which generates a substantial volume of user feedback in the form of comments. This research aims to analyze and classify the sentiments (Positive, Negative, and Neutral) of 50,954 comments on English learning videos on YouTube using the Naïve Bayes Classifier (NBC) algorithm. This quantitative research employs a comprehensive text mining workflow, including data preprocessing, automated labeling using the VADER Sentiment Analyzer, and feature matrix construction with TF-IDF. The performance evaluation of the NBC model shows an overall accuracy of 84%. Despite this high accuracy, a significant class imbalance was identified, with Neutral sentiment dominating (56.34%). Class-wise metric analysis reveals that the model underperforms in classifying Negative sentiment (with a Recall of 0.41), where 313 Negative comments were misclassified as Positive. This study concludes that NBC serves as a valid and effective approach; however, it is recommended that future research incorporate class imbalance handling techniques to enhance the detection of Negative sentiment, which provides essential feedback for improving content quality.
Keywords: Class Imbalance, English Language Learning, Naïve Bayes Classifier, Sentiment Analysis, YouTube
References
Al, H., Harpizon, R., Kurniawan, R., & Iskandar, I. (2022). Analisis Sentimen Komentar Di YouTube Tentang Ceramah Ustadz Abdul Somad Menggunakan Algoritma Naïve Bayes. 5(1), 131–140.
Anam, K. (2025). Comparison ff Sentiment Labeling Using Textblob , Vader , and Flair in Public Opinion Analysis Post-2024 Presidential Inauguration with IndoBERT. 6(2), 803–818.
Aqsalia, Z. Y., Sari, S., & Umi, N. (2024). Optimasi Algoritma Naive Bayes Untuk Menganalisis Sentimen Pada Konten Pemindahan Ibu Kota di Youtube. 5(2), 68–83.
Arrahman Firsttama, R., Anjani Arifiyanti, A., & Satria Yudha Kartika, D. (2024). Analisis Sentimen Komentar Youtube Konferensi Tingkat Tinggi G20 Menggunakan Metode Naive Bayes. 6(2), 282–285.
Fatah, Z. (2025). TIK dan Masyarakat (T. P. P. Media (ed.); first). PT Penamuda Media.
Febrialdi Ansyah, M., Ghofur, A., & Fakih Lidimillah, L. (2024). G-Tech : Jurnal Teknologi Terapan. 8(2), 847–856.
Huwaida, S. F., Kusumawati, R., & Isnaini, B. (2024). Analisis sentimen komentar youtube terhadap pemindahan ibu kota negara menggunakan metode Naïve Bayes. 6(1), 26–39. https://doi.org/10.37905/jji.v6i1.24718
Jamil, M., Hadiyanto, H., & Sanjaya, R. (2024). Ingénierie des Systèmes d ’ Information Sentiment Analysis : Classifying Public Comments on YouTube in Disaster Management Simulation in Indonesia Using Naï ve Bayes and Support Vector Machine. 29(2), 437–446.
Jelita, H. P., & Saad, M. I. (2025). Penerapan Algoritma Naïve Bayes Dalam Analisis Sentimen Masyarakat Terhadap STMIK Widya Cipta Dharma. 6(2), 148–160. https://doi.org/10.47065/bit.v5i2.2029
Khanafiyah, Y., Informatika, T., Group, S., Informatika, T., Group, S., Sari, D. K., Informatika, T., Group, S., Bayes, N., & Vote, D. (2025). Analisis Sentimen Komentar Youtube Kanal Dirty Vote Menggunakan Metode Naive Bayes Classifier. 12(4), 6723–6728.
Mareta, A., Subroto, D. E., Aulia, L., & Nuryanah, S. (2025). Peran Media Sosial Youtube sebagai Media Edukasi dalam Pendidikan Generasi Z.
Misrun, C. A., Haerani, E., Fikry, M., & Budianita, E. (2024). Jurnal Computer Science and Information Technology ( CoSciTech ) naive bayes classifier method. 4(1), 207–215.
Morgan, P., Show, B., & Media, N. (2022). Analisis Sentimen Pengguna Youtube Terhadap Tayangan # Matanajwamenantiterawan Dengan Metode Naïve Bayes Sentiment Analysis Of User Comments On Youtube Video # Matanajwamenantiterawan With Naive Bayes Classifier Method. 5(1), 1–6. https://doi.org/10.33387/jiko
Nur Hidayah, W. (2021). Jurnal Pendidikan Indonesia ( Japendi ) Pendidikan Konsep Solusi Terhadap Problem Keterampilan ( Skills ) Berbahasa Inggris Di Lembaga Pendidikan Indonesia Widha Nur Hidayah * Universitas Islam Negeri Sunan Kalijaga Yogyakarta , Indonesia Email : widha.hi. 2(10), 1824–1834.
Polus, M. E. (2021). Development For Performance Of Porter Stemmer Algorithm. 2, 6–13. https://doi.org/10.15587/1729-4061.2021.225362
Putri, A. A., Bautista, C., Irsyad, H., Rahman, A., Multi, U., Palembang, D., Selatan, S., Multi, U., Palembang, D., Selatan, S., Multi, U., Palembang, D., Selatan, S., Multi, U., Palembang, D., & Selatan, S. (2025). Opini Publik Terhadap Isu Keaslian Ijazah Pada Platform Youtube Dengan Naïve Bayes , Knn , Dan. 11(2), 231–242.
Rahman, A., Rahmat, F., Fariqi, M. Y., & Adi, S. (2020). Metode Naive Bayes untuk Menganalisis Akurasi Sentimen Komentar di Youtube. 14(1), 31–34.
Taufiqurahman, M. D., Anraeni, S., & Darwis, H. (2024). Analisis Sentimen Komentar Konten Kreator Gaming Menggunakan Metode Naive Bayes dan KNN. 1(4), 317–327.
Yasir, M., & Suraji, R. (2023). Perbandingan Metode Klasifikasi Naïve Bayes , Decision Tree , Random Forest Terhadap Analisis Sentimen Kenaikan Biaya Haji 2023 Pada Media Sosial Youtube Muhammad Yasir 1 , Robertus Suraji2 Perbandingan Metode Klasifikasi Naïve Bayes , Decision Tree , Ran.






