Jasa Skripsi Tesis Disertasi Weka ~ Klasifikasi Sentimen Ulasan Produk E-Commerce Menggunakan WEKA (Naïve Bayes vs Random Forest)
Berikut adalah silabus 20× sesi @1,5 jam untuk topik “Klasifikasi Sentimen Ulasan Produk E-Commerce Menggunakan WEKA (Naïve Bayes vs Random Forest)”
Tujuan Akhir
Peserta mampu:
-
Mengimpor dan memproses dataset ulasan produk e-commerce.
-
Menerapkan Naïve Bayes dan Random Forest di WEKA.
-
Membandingkan performa kedua algoritma dengan berbagai metrik evaluasi.
-
Menyajikan hasil dalam bentuk laporan ilmiah.
Silabus 20 Sesi (Total 30 Jam)
Modul 1 — Dasar WEKA & Dataset Sentimen
Sesi 1. Pengenalan WEKA dan Lingkup Proyek
-
Materi: Konsep machine learning, antarmuka WEKA (Explorer, Experimenter).
-
Praktik: Instalasi WEKA, eksplorasi dataset bawaan (mis.
iris.arff).
Sesi 2. Pengenalan Analisis Sentimen E-Commerce
-
Materi: Konsep sentiment analysis, studi kasus e-commerce Indonesia.
-
Praktik: Mengumpulkan dataset contoh (Kaggle/Tokopedia/Shopee).
Sesi 3. Format Data & ARFF
-
Materi: Struktur
.arff, konversi CSV ke ARFF. -
Praktik: Import dataset ulasan produk, cek tipe atribut (string/nominal).
Sesi 4. Preprocessing Teks
-
Materi: Text Cleaning (lowercase, stopwords, stemming, tokenizing).
-
Praktik: Gunakan
StringToWordVectordi WEKA dengan TF-IDF.
Modul 2 — Dasar Algoritma Naïve Bayes & Random Forest
Sesi 5. Teori Naïve Bayes
-
Materi: Prinsip probabilistik, asumsi independensi fitur.
-
Praktik: Latih Naïve Bayes di WEKA, lihat Confusion Matrix.
Sesi 6. Teori Random Forest
-
Materi: Konsep ensemble, bagging, parameter utama (
numTrees,maxDepth). -
Praktik: Latih Random Forest di WEKA, bandingkan hasil awal dengan NB.
Sesi 7. Validasi Model
-
Materi: Hold-out vs k-fold cross-validation.
-
Praktik: Bandingkan akurasi dengan 10-fold CV pada kedua algoritma.
Sesi 8. Metrik Evaluasi
-
Materi: Accuracy, Precision, Recall, F1-score, ROC-AUC.
-
Praktik: Evaluasi lengkap + interpretasi hasil.
Modul 3 — Optimasi & Penyesuaian Model
Sesi 9. Tuning Parameter Naïve Bayes
-
Materi: Filter kata, laplace smoothing, reduksi fitur.
-
Praktik: Bandingkan NB default vs NB dengan FS (InfoGain).
Sesi 10. Tuning Parameter Random Forest
-
Materi:
numTrees,maxDepth,numFeatures. -
Praktik: Uji kombinasi parameter untuk hasil optimal.
Sesi 11. Feature Selection
-
Materi: InfoGain, Chi-Squared, WrapperSubsetEval.
-
Praktik: Uji pengaruh FS terhadap performa NB dan RF.
Sesi 12. Penanganan Data Tidak Seimbang
-
Materi: SMOTE, resampling.
-
Praktik: Terapkan SMOTE di dataset sentimen.
Modul 4 — Analisis Lanjutan & Eksperimen
Sesi 13. Experimenter di WEKA
-
Materi: Menjalankan batch eksperimen otomatis.
-
Praktik: NB vs RF dengan 5 variasi preprocessing.
Sesi 14. KnowledgeFlow
-
Materi: Membangun pipeline end-to-end.
-
Praktik: Automasi proses mulai dari import data hingga evaluasi.
Sesi 15. Analisis Perbandingan
-
Materi: Uji signifikan (paired t-test) antara NB dan RF.
-
Praktik: Interpretasi hasil statistik.
Sesi 16. Visualisasi Hasil
-
Materi: Grafik ROC, Precision-Recall Curve, tabel komparasi.
-
Praktik: Ekspor grafik dan tabel untuk laporan.
Modul 5 — Proyek Akhir & Laporan
Sesi 17. Penyusunan Hasil Eksperimen
-
Aktivitas: Mengumpulkan semua metrik dan grafik hasil eksperimen.
Sesi 18. Diskusi dan Analisis
-
Aktivitas: Interpretasi hasil, identifikasi kelebihan & kekurangan algoritma.
Sesi 19. Penulisan Laporan Ilmiah
-
Materi: Struktur IMRaD (Introduction, Methods, Results, Discussion).
-
Praktik: Menulis Bab IV (hasil) & Bab V (kesimpulan).
Sesi 20. Presentasi Proyek
-
Aktivitas: Presentasi hasil klasifikasi, tanya jawab, evaluasi akhir.
Dataset yang Bisa Digunakan
-
Shopee/Tokopedia Review Dataset (Kaggle)
-
Amazon Product Reviews (untuk latihan awal)
-
Dataset ulasan lokal yang dikumpulkan via scraping




