Klasifikasi Sentimen Komentar Youtube tentang Tagar #KaburAjaDulu dengan Algoritma Naïve Bayes untuk Menggambarkan Persepsi Gen Z Indonesia

Authors

  • Nauradhia Shofarianti Putri Universitas Ibrahimy
  • Zaehol fatah Universitas Ibrahimy

DOI:

https://doi.org/10.35473/jamastika.v5i1.4672

Abstract

Tagar #KaburAjaDulu mencerminkan keresahan yang dirasakan Generasi Z di Indonesia mengenai dinamika sosial, ekonomi, dan politik saat ini. Fenomena ini sekaligus menggambarkan dorongan kuat untuk mencari peluang hidup yang dinilai lebih menjanjikan di luar negeri. Penelitian ini bertujuan mengidentifikasi kecenderungan sentimen masyarakat yang terekam dalam komentar YouTube, dengan memanfaatkan metode klasifikasi Multinomial Naive Bayes. Sebanyak 2.667 komentar dari 15 video dikumpulkan. Penelitian ini menganalisis sentimen dari komentar dengan melalui beberapa tahapan preprocessing (pemrosesan awal) data, yaitu normalisasi (penyeragaman format), tokenisasi (pemecahan teks menjadi kata-kata), penghapusan stopword (kata-kata umum yang tidak relevan), dan stemming (pengembalian kata ke bentuk dasar). Selanjutnya, semua komentar diberi label sentimen secara manual menjadi positif, negatif, atau netral. Untuk mengatasi masalah ketidakseimbangan jumlah data antar kelas sentimen, digunakan teknik Random Oversampling. Setelah itu, data dibagi menjadi set pelatihan dan pengujian. Algoritma yang dipilih untuk klasifikasi adalah Multinomial Naive Bayes, karena dianggap paling sesuai untuk menangani karakteristik teks yang singkat dan tidak formal. Hasil penilaian menggunakan berbagai indikator seperti akurasi, presisi, recall, dan F1-score menunjukkan bahwa model bekerja secara konsisten, dengan akurasi yang mencapai 89,3%. Temuan ini memberikan gambaran mengenai ekspresi digital Generasi Z sekaligus memperlihatkan efektivitas pendekatan klasifikasi teks dalam analisis opini berbasis media sosial.

Kata Kunci: Analisis sentimen, YouTube, Naive Bayes, Generasi Z, klasifikasi teks.

 The hashtag #KaburAjaDulu reflects the anxiety felt by Generation Z in Indonesia regarding current social, economic, and political dynamics. This phenomenon also illustrates a strong urge to seek out opportunities for a better life abroad. This study aims to identify trends in public sentiment recorded in YouTube comments, using the Multinomial Naive Bayes classification method. A total of 2,667 comments from 15 videos were collected. This study analyzes sentiment from comments through several stages of data preprocessing, namely normalization (format standardization), tokenization (breaking text into words), stopword removal (irrelevant common words), and stemming (returning words to their basic form). Next, all comments were manually labeled as positive, negative, or neutral. To overcome the problem of data imbalance between sentiment classes, the Random Oversampling technique was used. After that, the data is divided into training and testing sets. The algorithm chosen for classification is Multinomial Naive Bayes, as it is considered the most suitable for handling short and informal text characteristics. Evaluation through metrics such as accuracy, precision, recall, and F1-score indicates that the model performs consistently, achieving an accuracy of 89.3%. These findings provide an overview of Generation Z's digital expressions while demonstrating the effectiveness of the text classification approach in social media-based opinion analysis.

Keywords: Sentiment analysis, YouTube, Naive Bayes, Generation Z, text classification

References

Adamansyah, E. P., Yudhistira, A., Informasi, S., Teknik, F., & Indonesia, U. T. (2025). Evaluasi Opini Publik di Media Sosial X terhadap Kebijakan Pajak Pertambahan Nilai 12 % di Indonesia Menggunakan Naive Bayes dan Decision Tree Informatika , Fakultas Teknik dan Ilmu Komputer , Universitas Teknokrat Indonesia , Indonesia Evaluation of Publ. Jurnal Pendidikan Dan Teknologi Indonesia (JPTI), 5(3), 831–843.

Alwie, rahayu deny danar dan alvi furwanti, Prasetio, A. B., Andespa, R., Lhokseumawe, P. N., & Pengantar, K. (2020). Tugas Akhir Tugas Akhir. Jurnal Ekonomi Volume 18, Nomor 1 Maret201, 2(1), 41–49.

Dzulfian Syafrian, dkk. (2025). No Title. Sustainability (Switzerland), 11(1), 1–14.

Erlisya, V., Aisyah Aulia, Ferik Clodya, Nursyidah, & Wahjoe Pangestoeti. (2025). FENOMENA #KABURAJADULU: ANALISIS DAMPAK BRAIN DRAIN TERHADAP PEREKONOMIAN INDONESIA. JURNAL ILMIAH EKONOMI DAN MANAJEMEN, 3(6), 171–177. https://doi.org/10.61722/jiem.v3i6.5083

Fitrianti, S., Yudhistira, A., Teknik, F., & Indonesia, U. T. (2025). Analisis Sentimen Media Sosial Terhadap Calon Pilkada 2024 Dengan Metode Naïve Bayes Social Media Sentiment Analysis Towards 2024 Regional Election Candidates Using the Naïve Bayes Method. Jurnal Pendidikan Dan Teknologi Indonesia (JPTI), 5(1), 167–176.

Gudiato, C., Cahyaningtyas, C., & P., N. (2024). Analisis Sentimen Komentar Youtube Terhadap Tayangan #Terbaru! Temuan dan Masalah Ahlak Di Ponpes Al-zaytun Menggunakan Metode Naïve Bayes. G-Tech : Jurnal Teknologi Terapan, 8(1), 186–195.

Hudha, M., Supriyati, E., & Listyorini, T. (2022). Analisis Sentimen Pengguna Youtube Terhadap Tayangan #Matanajwamenantiterawan Dengan Metode Naïve Bayes Classifier. JIKO (Jurnal Informatika Dan Komputer), 5(1), 1–6. https://doi.org/10.33387/jiko.v5i1.3376

Jamil, M., Hadiyanto, H., & Sanjaya, R. (2024). Sentiment Analysis: Classifying Public Comments on YouTube in Disaster Management Simulation in Indonesia Using Naïve Bayes and Support Vector Machine. Ingenierie Des Systemes d’Information, 29(2), 437–446. https://doi.org/10.18280/isi.290205

Khanafiyah, Y., Informatika, T., Group, S., Informatika, T., Group, S., Sari, D. K., Informatika, T., Group, S., Bayes, N., & Vote, D. (2025). Analisis Sentimen Komentar Youtube Kanal Dirty Vote Menggunakan Metode Naive Bayes Classifier. 12(4), 6723–6728.

Novendri, R., Callista, A. S., Pratama, D. N., & Puspita, C. E. (2020). Sentiment Analysis of YouTube Movie Trailer Comments Using Naïve Bayes. Bulletin of Computer Science and Electrical Engineering, 1(1), 26–32. https://doi.org/10.25008/bcsee.v1i1.5

Pada, L. B., Indonesia, D., Social, W. A., Youtube, P., Social, W. A., Jiwa, J., & Indonesia, R. (2023). BAB I. 1–17.

Rahmatulloh, R., Ibrahim, M. I., & Handayani, M. R. (2025). Model Klasifikasi Naive Bayes untuk Pemetaan Persepsi Publik Secara Real-Time pada Media Sosial : Studi Kasus RUU TNI 2025. Jurnal Pendidikan Teknologi Informasi, 5(2), 365–379.

Rais, T. I. (2022). Analisis Sentimen Terhadap Komentar Video Youtube Raiden Shogun-Judgment of Euthymia Menggunakan Metode Majority Voting. Fakultas Sain Dan Teknologi, Universitas Islam Negeri Syarif Hidayatullah.

Rara, E. L., & Mailoa, E. (2024). Implementasi Algoritma Naive Bayes Terhadap Analisis Sentimen Perubahan Piala Dunia U-20. Progresif: Jurnal Ilmiah Komputer, 20(1), 259. https://doi.org/10.35889/progresif.v20i1.1550

Saepudin, S., Widiastuti, S., & Irawan, C. (2023). Sentiment Analysis of Social Media Platform Reviews Using the Naïve Bayes Classifier Algorithm. Jurnal Sisfokom (Sistem Informasi Dan Komputer), 12(2), 236–243. https://doi.org/10.32736/sisfokom.v12i2.1650

Sodik, F., & Kharisudin, I. (2021). Sentiment Analysis with SVM, Naïve Bayes, and KNN for Studying Indonesian Public Responses to the Covid-19 Pandemic on Twitter Social Media. Prisma, 4, 628–634.

Tumanggor, T., & Sazali, H. (2025). Penggunaan Hashtag #KaburAjaDulu dalam Pembentukan Algoritma Kritik Publik di Media Baru. Jurnal Indonesia : Manajemen Informatika Dan Komunikasi, 6(2), 1353–1362. https://doi.org/10.63447/jimik.v6i2.1425

Downloads

Published

2026-04-16