Analisis Komprehensif Kinerja Model Klasifikasi Sentimen: Evaluasi Lintas Metrik pada Dataset Tweet Film Bahasa Indonesia

Data Sentimen Analitik dari Tweteer (X) Tentang Film Berbahasa Indoensia

Penulis

  • Riadi Marta Dinata ISTN
  • Marhaeni Marhaeni
  • Kurniawan Atmadja
  • Elda Rayhana
  • Veriah Hadi
  • Ujang Al Kaf

Abstrak

Penilaian kinerja model klasifikasi teks tidak dapat hanya bergantung pada akurasi semata, terutama ketika dataset yang digunakan bersifat tidak seimbang atau tujuan evaluasi memiliki sensitivitas terhadap jenis kesalahan tertentu. Penelitian ini mengkaji performa lima algoritma klasifikasi—K-Nearest Neighbor, Support Vector Machine, Random Forest, Logistic Regression, dan Naive Bayes—pada dataset opini film berbahasa Indonesia. Setiap model dievaluasi berdasarkan empat metrik utama: akurasi, presisi, recall, dan F1-score, melalui strategi holdout sebanyak 10 iterasi untuk menangkap konsistensi kinerja. Hasil menunjukkan bahwa SVM memiliki performa tertinggi pada seluruh metrik, dengan akurasi rata-rata sebesar 85,5%, diikuti oleh Naive Bayes (83,0%) dan Logistic Regression (82,3%). Meskipun Random Forest memiliki presisi tinggi (85,6%), model ini menunjukkan kelemahan dalam recall (65,3%), yang berdampak pada ketidakseimbangan dalam klasifikasi. Pendekatan evaluasi berbasis tujuan—termasuk sensitivitas terhadap false negative dan analisis pada distribusi probabilistik—membuktikan pentingnya penggunaan metrik yang beragam. Kesimpulan menyatakan bahwa SVM menjadi pilihan utama dalam konteks klasifikasi sentimen teks dengan keseimbangan metrik terbaik, sementara Random Forest cenderung tidak stabil dalam situasi distribusi data yang kompleks.
Kata Kunci: Klasifikasi Sentimen, Evaluasi Model, Text Mining, Algoritma Supervised Learning, Bahasa Indonesia

##submission.downloads##

Diterbitkan

2025-07-16

Cara Mengutip

Dinata, R. M., Marhaeni, M., Atmadja, K., Rayhana, E., Hadi, V., & Al Kaf, U. (2025). Analisis Komprehensif Kinerja Model Klasifikasi Sentimen: Evaluasi Lintas Metrik pada Dataset Tweet Film Bahasa Indonesia: Data Sentimen Analitik dari Tweteer (X) Tentang Film Berbahasa Indoensia. Jurnal Rekayasa Informasi, 14(1), 38–47. Diambil dari https://journal.istn.ac.id/rekayasainformasi/article/view/2361

Artikel paling banyak dibaca berdasarkan penulis yang sama

1 2 3 > >>