Tutorial Belajar Rapidminer (Bagian 9) - Mengubah Tipe dan Role dari Atribut

Minggu, 16 Juli 2017 15:00:37 ,Oleh ,Dilihat : 2.203 x

Diasuh oleh Dr. Ir. Agus Wibowo, M.Kom, M.Si, M.M

       Untuk belajar membangun model prediktif, mari kembali ke data Titanic dari sebelumnya. Data ini agak sederhana dan tidak perlu banyak persiapan, tapi kita masih perlu menentukan kolom mana yang ingin kita prediksi! Berikut tahapan yang harus kita kerjakan.

Tahap 1 : Menambah detil produk ke transaksi :

1. Tarik data Titanic ke dalam proses.

 2. Sekarang, arahkan mouse ke port output operator Retrieve dan tunggu sampai jendela kecil muncul dan menampilkan beberapa meta data  tentang dataset Titanic. Beberapa informasi yang Anda tahu dari tab Statistik

3. Perhatikan dua kolom Role dan Type di tabel di bagian bawah.

        Setiap atribut memiliki tipe yang mendefinisikan nilai yang mungkin untuk kolom (misalnya, jika nilai bisa nominal atau numerik).

Tahap 2 : Mendefinisikan Tipe  dan Peran Atribut :

1. Tambahkan Discretize by Binning operator dan hubungkan 


 2. Tetapkan jenis filter atribut menjadi single (yaitu Anda hanya mengerjakan salah satu atribut).

 3. Ubah opsi  attribut ke Age (Umur).

4. Ubah opsi  jumlah binning menjadi 3.

       "Binning" adalah teknik umum untuk mengubah tipe dari numerik menjadi polinominal (nominal dengan lebih dari 2 nilai). Di sini, kita membuat tiga "binning" yang mencakup rangkaian nilai lengkap. Operator kemudian mengganti nilai numerik asli dengan nama bin yang dimiliknya.


Tahap 3 : Mendefinisikan kolom mana yang akan diprediksi  :

Pada RapidMiner, kita menyebut kolom yang harus diprediksi dengan nama label. Terkadang juga disebut sebagai target atau kelas.

Langkah :

1. Tambahkan operator Set Role dan hubungkan.

 

2. Pada parameter, untuk nama atribut ubah ke Survived, kemudian pada opsi target role ubah menjadi label


 3. Jalankan proses dan periksa hasilnya.

       Lihat tab Statistik di tampilan Results. Perhatikan bahwa role Survived telah berubah menjadi label. Atribut Age juga memiliki tipe baru sekarang: nilai numerik untuk Age telah diganti dengan nama baru.


TOP