Tutorial Belajar Rapidminer (Bagian 3) - Operator dan Proses

Senin, 29 Mei 2017 13:54:28 ,Oleh ,Dilihat : 300 x

Diasuh oleh Dr. Ir. Agus Wibowo, M.Kom, M.Si, M.M.

Rapidminer Studio memiliki tampilan antarmuka pengguna yang mudah untuk dioperasikan. Ketika dijalankan, Rapidminer Studio menampilkan jendela dialog dengan tiga opsi yaitu : learn yang berisi tutorial dasar penggunaan Rapidminer Studio, new process untuk menjalankan proses yang baru serta open process untuk membuka proses yang sebelumnya pernah dibuat. Untuk dasar pembelajaran kali ini maka pilih opsi new process, kemudian pilih Blank.

Setelah itu akan ditampilkan design perspektif

Berikut penjelasan antarmuka di Rapidminer Studio versi 7.5

Panel Repositori :
Repositori digunakan  untuk  mengelola  dan  menata proses analisis Anda  menjadi  proyek  dan  pada  saat yang  sama  juga  dapat  digunakan  sebagai  sumber  data dan yang berkaitan dengan metadata.

Panel Operator :
Berisi operator-operator yang dapat  digunakan pada proses analisis. Pada  Operator  View  ini  terdapat beberapa kelompok operator sebagai berikut:

  • Data  Access  :
    kelompok  ini  terdiri  dari semua  operator  yang  berguna  untuk membaca dan menulis file dari repositori lokal atau cloud, mengakses file dijejaring social seperti twitter . Kelompok import  digunakan untuk membaca data dan objek dari format tertentu seperti file, database, dan lain-lain. Kelompok export digunakan  untuk  menulis data dan objek menjadi format tertentu.
  • Blending  :
    kelompok  ini  terdiri  dari semua  operator  yang  berguna  untuk transformasi data pada table yang berkaitan dengan atribut (membuat, menghilangkan, menyalin, agregasi, pengubahan bobot, join, union, interseksi dan lainnya).
  • Cleansing
    kelompok  ini  terdiri  dari operator untuk melakukan normalisasi/denormalisasi data, memperbaiki data yang hilang atau terduplikasi,  pengubahan dimensi serta operasi diskrit (binning, size, dimensi)
  • Utility  : 
    kelompok  ini  terdiri dari Operator bantuan, seperti  operator macros, logging, subproses, dan operator  perulangan  dan  percabangan  yang dapat mengatur aliran proses.
  • Modeling  :
    kolompok  ini  berisi  proses  data mining  untuk  menerapkan  model  yang dihasilkan menjadi set data yang baru untuk keperluan prediksi, segmentasi, asosiasi, korelasi, kesamaan, optimasi serta pembobotan
  • Scoring :
    kelompok  ini  terdiri  dari semua  operator  yang  berguna  untuk penerapan model, mencari, membuat dan menerapkan ambang batas, menghasilkan prediksi serta pemeringkatan.
  • Validation  : 
    kelompok  ini  berisi  operator  yang dapat  digunakan  untuk  menghitung  kinerja pemodelan serta untuk data baru.
  • Extension :
    Berisi operator yang dikembangkan oleh pihak ketiga untuk keperluan khusus seperti pemrosesan teks, akses data pasar keuangan, transformasi deret waktu, transformasi data mengunakan integral, diferensial, moving average, eksponensial

Latihan cara menjalankan proses sederhana:
1.    Cari panel Repositori yang terletak pada sebelah kiri layar
2.    Buka folder samples, kemudian buka data
3.    Drag dan drop dataset Titanic Training pada panel process

4. Hubungkan port (“out”) dari operator Retrieve Titanic Training dengan port (“res”) pada panel proses yang terletak disebelah kanan dengan cara melakukan klik kiri pada port (“out”) dilanjutkan dengan melakukan klik kiri pada port (“res”).


5. Tekan tombol Run untuk menjalankan proses.


6. Pada tabulasi Data, Anda bisa melihat data mentah tentang penumpang Titanic seperti ukuran keluarga atau usianya.

7. Pada tabulasi Statistics, kita mendapatkan ringkasan statistik, yang memberikan informasi yang berguna yaitu terdapat 349 penumpang yang selamat dari kecelakaan Titanic.




TOP