Tutorial Belajar Rapidminer (Bagian 15) - Perulangan dan Percabangan

Senin, 04 September 2017 16:23:43 ,Oleh ,Dilihat : 821 x

Diasuh oleh Dr. Ir. Agus Wibowo, M.Kom, M.Si, M.M

       Perulangan dan percabangan adalah konsep yang sangat berguna yang dikenal di hampir semua bahasa pemrograman. RapidMiner menawarkan puluhan operator untuk perulangan contoh, atribut, atau nilai atribut tertentu. Dalam tutorial ini, kita akan membangun sebuah proses yang membahas tiga kelas penumpang yang berbeda dari data Titanic dan memeriksa apakah jumlah sampelnya lebih tinggi dari angka yang telah ditentukan sebelumnya. Jika lebih tinggi, kita menurunkan subkelompok ini ke jumlah sebelumnya, jika tidak kita akan menyimpan semua contohnya saja. Proses seperti ini misalnya, dapat digunakan untuk menyeimbangkan kelas dalam kasus di mana beberapa kelas yang sangat besar mendominasi beberapa kelas minoritas.

Langkah 1 Menyiapkan data dan makro.

1. Seret data Titanic ke dalam proses.


2. Tambahkan operator Set Macro ke proses dan hubungkan.

3. Gunakan ukuran max size sebagai makro dan 400 sebagai value pada Parameters.


 

       Kita akan menggunakan 400 contoh sebagai jumlah maksimum untuk masing-masing dari tiga kelas penumpang. Dengan mendefinisikan ukuran max size dengan makro pada awal proses, akan memudahkan untuk membuat perubahan pada pengaturannya nanti. Hal ini sangat berguna jika kita menggunakan nilai di banyak bagian proses.

Langkah 2 . Melakukan perulangan nilai atribut.

       Kita akan melakukan perulangan pada  tiga kelas penumpang dan memeriksa sebuah kondisi untuk masing-masing kelas. Dalam kasus ini, kondisinya adalah bahwa kelas harus memiliki nilai lebih kecil  dari max size sampel. Berikut langkahnya :

1. Cari operator Loop  Values dan seret ke dalam proses. Kemudian hubungkan operator.


2. Pada Parameter, atur attribut ke Passenger Class


Langkah 3. Pengaturan di dalam perulangan

       Apakah Anda memperhatikan ikon kecil di sudut kanan bawah Nilai Loop operator? Ikon ini menunjukkan bahwa operator ini dapat memiliki operator lain yang bersarang di dalamnya. Klik dua kali operator Loop Values untuk melihat isinya.

 1. Klik dua kali Loop Values


 

       Di dalam perulangan kita dapat menentukan sub-proses yang akan dijalankan untuk masing-masing dari tiga kelas penumpang yang sedang dilakukan proses perulangan. Kapan pun kita berada dalam sub-proses nested, kita bisa menemukan nama sub-proses di pojok kiri atas. Di bagian atas panel  Process, kita juga akan menemukan jalur yang dapat digunakan untuk navigasi kembali ke proses utama.

Langkah 4. Menyimpan sampel untuk kelas .

       Konsep operator bersarang memungkinkan proses yang sangat berguna. Kita akan sering melihat ini dalam proses selanjutnya saat kita memvalidasi model atau mengoptimalkan pengaturan parameter. Untuk saat ini, kita mendefinisikan apa yang terjadi di dalam perulangan.

 1. Pastikan kita berada di dalam operator Loop dengan mengklik dua kali, 

2. Di dalam operator Loop Values, lakukan hal berikut:


3. Tambahkan Operator Filter Examples.

4. Hubungkan input filter dengan port di sebelah kiri sub-proses. Ini akan memungkinkan data set dikirimkan ke Operator Loop untuk mengalir menuju sub-proses. Pada Parameters dari Filter Example, tambahkan filter baru dengan setting Passenger Class, equals, dan  %{loop_value} 


       Macro loop_value adalah makro yang telah ditentukan dari operator Loop Values yang dapat digunakan di dalam operator. Dalam setiap iterasi, makro diatur ke nilai atribut loop saat ini. Kita bisa menggunakan makro pada operator lain seperti misalnya, Filter Example. Kita hanya menyimpan sekumpulan sampel asli yang memiliki nilai atribut dari iterasi loop saat ini.


TOP