Tutorial Belajar Rapidminer (Bagian 25) - Membuat Permodelan Text Sentiment Analysis

Senin, 13 Nopember 2017 16:33:14 ,Oleh ,Dilihat : 48 x

Diasuh oleh Dr. Ir. Agus Wibowo, M.Kom, M.Si, M.M

       Analisis sentimen merupakan sebuah cabang penelitian di domain Text Mining yang mulai booming pada awal tahun 2002-an. Riset-nya mulai marak semenjak paper dari B.Pang dan L.Lee keluar. Pada pembahasan kali ini kita akan mendeteksi sentimen dalam teks menggunakan model klasifikasi yang terlatih berdasarkan kategori ulasan dari pengguna. Hingga sekarang, hampir sebagian besar penelitian di bidang sentiment analysis hanya ditujukan untuk Bahasa Inggris karena memang Tools/Resources untuk bahasa inggris sangat banyak.

Langkah 1.

1. Jalankan rapidminer , pada template pilih Sentiment Analysys

2. Akan tampil model template untuk analisa sentimen berdasarkan teks


3. Operator Retrieve Historical Sentiment berfungsi untuk mengimpor data teks dengan beberapa kriteria penilaian terhadap sentimen yang terkait. 


4. Operator Set Role : operator ini digunakan untuk mengubah peran satu atau lebih atribut. Pada attribut name diatur ke Sentiment, sedangkan parameter target role diatur ke label.


5. Operator Nominal to Text berfungsi untuk mengubah jenis atribut nominal yang dipilih menjadi teks. Operator ini juga memetakan semua nilai dari atribut ini ke nilai string yang sesuai. Data teks diproses untuk mengekstrak kata-kata dan mengirimkan kata -vektor (numerik untuk mewakili teks).
6. Operator  Process Documents from Data berfungsi menghasilkan kata vektor dari atribut string.

Langkah 2. Melakukan pelatihan model SVM dan melakukan validasi untuk mengumpulkan kinerja data.
1. Operator Cross Validation berfungsi melakukan validasi silang untuk memperkirakan kinerja statistik operator pembelajaran (biasanya pada kumpulan data yang tidak terlihat). Hal ini terutama digunakan untuk memperkirakan seberapa akurat sebuah model (dipelajari oleh operator pembelajaran tertentu) akan ditampilkan dalam praktik. Operator ini juga akan mengembalikan data berlabel jika diinginkan. 

2. Operator SVM ini berfungsi melakukan pembelajaran pada SVM (Support Vector Machine). Operator ini didasarkan pada implementasi Java mySVM oleh Stefan Rueping.

3. Operator Apply Model berfungsi menerapkan model yang sudah dipelajari atau dilatih pada contoh data pelatihan.


4. Operator Performance digunakan untuk evaluasi kinerja statistik dari tugas klasifikasi binominal yaitu tugas klasifikasi dimana atribut label memiliki tipe binominal. Operator ini memberikan daftar nilai kriteria kinerja dari tugas klasifikasi binominal.

Langkah 3. Membuat dokumen baru dari teks (tambahkan teks milik kita serta mencoba sendiri), lalu lakukan proses sebagai yang pertama. Daftar kata yang telah diinisialisasi digunakan sebagai tambahan bagi input.
1. Operator Create Document berfungsi untuk membuat dokumen yang akan dianalisa

2. Operator Process Documents berfungsi menghasilkan  vektor kata dari objek teks.

Klik 2 kali operator Process documents sehingga muncul sub jendela yang berisi proses lainnya
3. Operator Tokenize berfungsi membuat token pada dokumen
4. Operator Transform Cases berfungsi mengubah karakter  huruf besar menjadi kecil pada dokumen
5. Operator Filter Stopwords berfungsi menghapus kata kunci bahasa Inggris dari sebuah dokumen 

6. Operator Apply model berfungsi menerapkan model yang sudah dipelajari atau dilatih pada contoh data pelatihan

TOP