Contoh kasus Credit Risk dengan pohon keputusanya

Friday 3 May 20130 comments



Credit Risk

Berikut ini merupakan contoh dari salah satu kasus resiko kredit (credit risk)
yang menggunakan decision tree untuk menentukan apakah seorang potential
customer dengan karakteristik saving, asset dan income tertentu memiliki good credit
risk atau bad credit risk.

Dapat dilihat pada gambar tersebut, bahwa target variable dari decision tree
tersebut atau variable yang akan diprediksi adalah credit risk dengan menggunakan
predictor variable : saving, asset, dan income. Setiap nilai atribut dari predictor
variable akan memiliki cabang menuju predictor variable selanjutnya, dan seterusnya
hingga tidak dapat dipecah dan menuju pada target variable.
Penentuan apakah diteruskan menuju predictor variable (decision node) atau menuju
target variable (leaf node) tergantung pada keyakinan (knowledge) apakah potential
customer dengan nilai atribut variable keputusan tertentu memiliki keakuratan nilai
target variable 100% atau tidak. Misalnya pada kasus di atas untuk saving medium,
ternyata knowledge yang dimiliki bahwa untuk seluruh potential customer dengan
saving medium memiliki credit risk yang baik dengan keakuratan 100%. Sedangkan
untuk nilai low asset terdapat kemungkinan good credit risk dan bad credit risk.
Jika tidak terdapat pemisahan lagi yang mungkin dilakukan, maka algoritma
decision tree akan berhenti membentuk decision node yang baru. Seharusnya setiap
branches diakhiri dengan “pure” leaf node, yaitu leaf node dengan target variable
yang bersifat unary untuk setiap records pada node tersebut, di mana untuk setiap nilai predictor variable yang sama akan memiliki nilai target variable yang sama.
Tetapi, terdapat kemungkinan decision node memiliki “diverse” atributes, yaitu
bersifat nonunary untuk nilai target variablenya, di mana untuk setiap record dengan
nilai predictor variable yang sama ternyata memiliki nilai target variable yang
berbeda. Kondisi tersebut menyebabkan tidak dapat dilakukan pencabangan lagi
berdasarkan nilai predictor variable. Sehingga solusinya adalah membentuk leaf node
yang disebut “diverse” leaf node, dengan menyatakan level kepercayaan dari diverse
leaf node tersebut. Misalnya untuk contoh data berikut ini :

Dari training data tersebut kemudian disusunlah alternatif untuk candidate
split, sehingga setiap nilai untuk predictor variable di atas hanya membentuk 2
cabang, yaitu sebagai berikut:

Kemudian untuk setiap candidate split di atas, dihitung variabelvariabel
berikut berdasarkan training data yang dimiliki. Adapun variabelvariabel tersebut,
yaitu :
di mana

Adapun contoh hasil perhitungannya adalah sebagai berikut :
Dapat dilihat dari contoh perhitungan di atas, bahwa yang memiliki nilai
goodness of split * Φ(s/t) + yang terbesar, yaitu split 4 dengan nilai 0.64275. Oleh
karena itu split 4 lah yang akan digunakan pada root node, yaitu split dengan : assets
= low dengan assets = {medium, high}.
Untuk penentuan pencabangan, dapat dilihat bahwa dengan assets=low maka
didapatkan pure node leaf, yaitu bad risk (untuk record 2 dan 7). Sedangkan untuk
assets = {medium, high} masih terdapat 2 nilai, yaitu good credit risk dan bad credit
risk. Sehingga pencabangan untuk assets = {medium, high} memiliki decision node
baru. Adapun pemilihan split yang akan digunakan, yaitu dengan menyusun
perhitungan nilai Φ(s/t) yang baru tanpa melihat split 4, record 2 dan 7.

Demikian seterusnya hingga akhirnya dibentuk leaf node dan membentuk
decision tree yang utuh (fully grown form) seperti di bawah ini :

Donasi Pada Blog Ini Cukup Mengklik Iklan Yang Ada, Klik Anda Sangat Berguna Untuk Kelangsungan Blog Ini. Terima Kasih

Post a Comment

 
Support : Creating Website | Johny Template | Mas Template
Copyright © 2011. BANYAK HAL - All Rights Reserved
Template Created by Creating Website Published by Mas Template
Proudly powered by Blogger