Tutorial Belajar Rapidminer (Bagian 23) - Membuat Permodelan Telecommunication Customers Churn

Senin, 23 Oktober 2017 15:26:23 ,Oleh ,Dilihat : 43 x

Diasuh oleh Dr. Ir. Agus Wibowo, M.Kom, M.Si, M.M

       Pada tutorial kali ini kita akan membuat permodelan Telecommunication customers churn.  Customers churn merupakan istilah yang digunakan untuk menjelaskan bahwa pelanggan telah menghentikan layanan pada provider tertentu, ada pula yang mengatakan bahwa tidak hanya berhenti, melainkan berpindah ke provider pesaing . Pembuat model churn berdasarkan perilaku churn yang diamati: melatih, mengoptimalkan dan mengevaluasi model pohon keputusan dengan menggunakan dataset pelatihan yang seimbang.

Langkah 1:

1. Jalankan rapid miner, pilih opsi New Process, kemudian pilih template : Churn modelling  


2.Memuat dataset pelanggan yang berisi atribut pelanggan seperti:

  • Umur
  • Teknologi yang digunakan (4G, fiber, dll)
  • Tanggal sejak yang bersangkutan menjadi pelanggan
  • Rata-rata tagihan tahun yang lalu
  • Jumlah dukungan layanan
  • Apakah pelanggan meninggalkan layanan pada tahun yang lalu?


Langkah 2:

Edit, ubah & pelajari (ETL : Edit, transform & learn) dan mempersiapkan data: Tandai kolom label target (yaitu indikator churn) dan ubah kolom churn numerik menjadi biner. 

 

 Langkah 3:

1. Validasi model merupakan kuncinya. Validasi silang ini membagi dataset untuk pelatihan dan sisanya untuk pengujian independen. Pemisahan ini dilakukan beberapa kali untuk mendapatkan perkiraan kinerja yang lebih baik.

2. Klik dua kali pada operator Optimize Parameters untuk melihat pelatihan itu sendiri.

 

3. Kita berharap  agar masih banyak lagi pelanggan yang setia dibandingkan yang tidak melanjutkan (churn). Agar model kita dapat mempelajari bagaimana perilaku churner, kita menyeimbangkan ulang data agar lebih terfokus pada kasus yang kita teliti.

4. Kita akan mengoptimalkan model daripada hanya menambahkan model yang dikonfigurasi dengan cara manual . Klik 2 kali pada bagian pojok kanan bawah dari operator Optimize Parameters.


 5. Berdasarkan rekomendasi 'kebijaksanaan dari kesimpangsiuran' untuk Pohon Keputusan (Decission tree), kita akan mengoptimalkan kedalaman maksimal (maximal depth)  dalam kisaran 20 sampai 29.

 

Kita akan memilih konfigurasi pohon dengan akurasi yang optimal pada dataset pelatihan  dan dilanjutkan ke tahap pengujian.

6. Model yang dilatih menggunakan data pelatihan diterapkan pada dataset uji independen, kemudian melakukan perhitungan kinerja model. 

      Nilai kinerja yang diperoleh pada skala yang berbeda dari validasi silang, kemudian dirata-ratakan untuk menghasilkan ukuran kinerja rata-rata sekaligus ukuran dispersi , di mana memberikan perkiraan stabilitas model saat diterapkan pada sampel data yang berbeda. 


Langkah 4: Jalankan proses

1. Tekan tombol Run 

 2. Pilih opsi downsample data  

Hasil dari output :

  • Model pohon (dilatih menggunakan data masukan lengkap) yang menganalisis perilaku churn dan dapat diterapkan pada setiap pelanggan untuk memperkirakan probabilitas churn.
  • menginput data asli
  • Perkiraan (yaitu validasi silang) kinerja model.



 

  





TOP