Tutorial Belajar Rapidminer (Bagian 17) - Membuat Permodelan menggunakan Rapidminer

Senin, 18 September 2017 14:56:19 ,Oleh ,Dilihat : 154 x

Diasuh oleh Dr. Ir. Agus Wibowo, M.Kom, M.Si, M.M       

       Sejauh ini, kita telah melihat langkah yang paling penting  untuk penanganan data dan bagaimana menggabungkannya ke proses yang fleksibel. Sekarang, kita akan memfokuskan pada bagaimana cra membangun model prediktif, menggunakannya untuk mencetak poin data baru, dan memvalidasi seberapa baik model tersebut akan bekerja untuk situasi yang baru tersebut.

       Predictive Modeling adalah seperangkat teknik pembelajaran mesin yang mencari pola dalam dataset yang besar dan menggunakan pola tersebut untuk membuat prediksi untuk situasi baru. Prediksi tersebut dapat dikategorikan (disebut pembelajaran klasifikasi) atau numerik (pembelajaran regresi). Tipe model tersebut juga merupakan pilihan yang sangat baik jika kita ingin lebih memahami proses mendasar yang mengarah pada hasil tertentu.

       Dalam tutorial ini, kita akan membuat tiga model klasifikasi yang berbeda untuk data Titanic kita: pohon keputusan (decision tree),seperangkat aturan ( a set of rules), dan model Bayes. Kita akan menjelajahi model-model tersebut  dan melihat apakah kita bisa mengetahui lebih banyak tentang peristiwa kecelakaan itu dan lebih memahami siapa yang memiliki kesempatan terbaik untuk bertahan hidup.

Langkah 1. Menyiapkan data pelatihan

Seret data Titanic Training dari  Sampel repositori ke dalam proses Anda.

       Kita telah menyiapkan data Pelatihan Titanic untuk model pelatihan:  dalam artian tidak ada nilai yang hilang serta labelnya telah didefinisikan. Harap diingat bahwa label adalah atribut yang ingin kita prediksi , dalam kasus ini : selamat(survived). kita memerlukan data pelatihan dengan label yang dikenal sebagai masukan untuk metode pembelajaran mesin semacam ini. Inilah sebabnya mengapa kita menyebut metode pembelajaran yang diawasi (supervised learning)

Langkah 2. Membangun tiga model yang berbeda.

1. Seret pada operator Decision Tree dan hubungkan ke port "out" dari Retrieve Titanic Training


2. Seret di operator Naive Bayes dan hubungkan port input sampel set nya dengan output "exa" dari Decision Tree


3. Seret ke operator Rule Induction dan hubungkan contohnya dengan set port input dengan output "exa" dari Naive Bayes.

4. Hubungkan port "mod" dari operator pemodelan ke port hasil "res" di kanan, lalu jalankan prosesnya. 

5. Periksa tiga model yang berbeda.

Hasil prediksi dari Rule Model

Hasil prediksi dari Naive Bayes

Hasil prediksi dari Decision Tree (Pohon Keputusan)


       Pohon keputusan dengan jelas menunjukkan bahwa ukuran keluarga lebih menentukan daripada kelas penumpang untuk wanita. Pola perilaku ini tidak bisa dideteksi untuk pria. Secara umum, pria memiliki kemungkinan lebih rendah untuk bertahan hidup ("dahulukan wanita dan anak "). Cara termudah untuk melihat hal ini adalah pada visualisasi Chart model Naive Bayes. Meski biasanya Naive Bayes bukan tipe model yang paling akurat, secara umum aturan yang ditetapkan adalah format yang mudah dibaca, di mana bisa berguna saat kita ingin menafsirkan model.


TOP