Tutorial Belajar Rapidminer (Bagian 8) - Membuat dan Menghilangkan Atribut

Senin, 10 Juli 2017 16:07:11 ,Oleh ,Dilihat : 1.058 x

Diasuh oleh Dr. Ir. Agus Wibowo, M.Kom, M.Si, M.M.

       Kita sudah hampir siap untuk membangun model prediksi pertama menggunakan RapidMiner! Tapi pertama-tama, kita perlu terlebih dahulu mempelajarin dua operasi yang sangat penting untuk mengubah dataset (kumpulan data) kita menjadi format yang lebih sesuai untuk pembelajaran. Awal proses dari ini sama dengan yang sebelumnya. Ini adalah kesempatan besar bagi kita untuk menerapkan apa yang telah kita pelajari sejauh ini. Kita kemudian akan membuat kolom data baru dan menghapus  beberapa kolom dari data yang tidak terpakai / tidak diperlukan. 

Berikut langkah untuk bekerja dengan atribut :

1. Seret dataset  Transactions(Transaksi) dan Products  (Produk) ke dalam Proses.

2. Tambahkan operator Join (Gabung).

3. Hubungkan semua operator.


 4. Tentukan kolom yang akan digunakan di Parameters for Join dengan cara meng klik operator join(1). Kemudian hilangkan tanda centang pada opsi use id attributes as key (2), 


 

klik Edit List (3) 

5. Gunakan Product ID untuk atribut kunci kiri(1) dan kanan(2) kemudian tekan tombol Apply (3).


Langkah di atas akan menghasilkan keluaran berupa semua transaksi dengan rincian produk untuk setiap transaksi.

Proses berikutnya adalah mendefinisikan  atribut baru, berikut langkahnya :

1. Tambahkan operator Generate Attributes.

2. Hubungkan operator dengan Join.


3. Klik operator Join(1), kemudian klik Edit List di Parameters (2) untuk Menghasilkan Atribut untuk menentukan atribut baru (kolom). Dialog akan muncul. 


 4. Di kolom kiri dialog, masukkan Total untuk nama atribut.

5. Di kolom kanan, ketik Amount  *  Price untuk ekspresi fungsi.


 Berikutnya adalah membuang atribut yang tidak diperlukan. Langkahnya adalah sebagai berikut :

1. Tambahkan operator Select Attributes ke proses dan hubungkan.  

 

2. Buat perubahan berikut pada Parameter:   Atur  attribute filter type ke subset. Secara umum, operator ini hanya akan diterapkan pada atribut (kolom) yang sudah kita tentukan. Hal  ini akan memungkinkan kita memilih subkumpulan kolom untuk disimpan dalam data - semua kolom lainnya akan dihapus. 


 4. Kemudian Klik opsi Select Atribut. Pada dialog yang dihasilkan, pilih atribut Customer ID (ID Pelanggan), Product Name (Nama Produk), dan Total. Jika daftarnya masih kosong, mungkin  kita lupa menghubungkan operator terlebih dahulu 

5. Jalankan prosesnya


 



TOP