1、基本軟件與模型介紹
在構建該信用風險評估系統(tǒng)時,一是采用的是Weka軟件。該軟件能對數(shù)據(jù)進行初步處理、分類、回歸、聚類、關聯(lián)規(guī)則等,并實現(xiàn)可視化操作。本文對收集的數(shù)據(jù)采用了初步處理、利用Apriori關聯(lián)規(guī)則挖掘分析的方法。二是利用MSBNx貝葉斯網(wǎng)分類工具,采用貝葉斯信念網(wǎng)絡分類進行類型劃分,利用相關的算法。以此確定出因素之間的相關關系以及相應的概率,為模型的建立以及結論的產(chǎn)生提供參考依據(jù)。
2、房貸信用風險樣本調(diào)查結果
本文選取6類最具代表性的指標,即財產(chǎn)狀況、年齡、婚姻狀況、有無固定電話、信用保證金額、信用等級。由于Weka軟件只識別英文,將以上6類用英文代替,分別是property、age、status、telephone、creditamount、class。調(diào)查結果如表1所示。
3、數(shù)據(jù)挖掘過程
3.1數(shù)據(jù)初步處理。首先對數(shù)據(jù)進行初步處理,以保證數(shù)據(jù)挖掘的質量。依次進行數(shù)據(jù)缺失項處理;數(shù)據(jù)的標準化處理;數(shù)據(jù)的規(guī)范化處理,規(guī)范到[-1,+1]區(qū)間。3.2Apriori關聯(lián)規(guī)則挖掘分析。使用Apriori算法獲取關聯(lián)信息并進行分析,對初步處理的數(shù)據(jù)進行關聯(lián)規(guī)則挖掘。采用支持度、置信度2個指標,分別確定數(shù)據(jù)集的頻繁程度、Y在包含X的事物出現(xiàn)的概率。同時將滿足最小支持度、最小置信度閾值的規(guī)則稱為強規(guī)則。首先,采用支持度閾值為25%、置信度閾值為85%,對挖掘的最佳關聯(lián)規(guī)則第1、2條進行分析。結果表明有房產(chǎn)與信用額度有強關聯(lián)(lift=1.22>1);年齡在35~49與信用額度小關聯(lián)較?。ǎ欤椋妫簦剑保埃罚kS后采用置信度閾值為55%進行分析,找出:“status=malesingle,telephone=none==>property=realestate”規(guī)則的置信度和提升讀。結果表明有房產(chǎn)單身男性與沒有電話號碼有強關聯(lián)規(guī)(lift=1.22)。
4、數(shù)據(jù)挖掘分類分析結果
通過上述過程得出的結果,運用MSBNx工具中的貝葉斯信念網(wǎng)絡分類方法進行分析,得出最終的結果。貝葉斯信念網(wǎng)絡分類:首先,將年齡與信用額度離散成3類,得到年齡與信用額度離散結果,隨后,構建貝葉斯信念網(wǎng)絡分類進行類型劃分,如圖1中橢圓圈及箭頭所構成的網(wǎng)絡。最后,可求得信用等級(class)好(Good)、壞(bad)的概率。例:求“有車、年齡超過50歲、無電話、信用額小于3000”的信貸評級。根據(jù)系統(tǒng)給出的結果得出good、bad概率分別為0.835443、0.164557,信用等級好的概率大,故銀行可提供貸款給借款人。
5、結語
由于實際情況復雜,本文只選?。额惔硇灾笜苏{(diào)查,設計出信用風險評估系統(tǒng),并給出操作示范。最終決策客觀、規(guī)范,實現(xiàn)風險控制的目標。同時為其他需要信用風險評估的機構或組織提供了一個有效的操作方法,這是該信用風險評估系統(tǒng)更為深層的作用。
? 2019-2021 All rights reserved. 北京轉創(chuàng)國際管理咨詢有限公司 京ICP備19055770號-1
Beijing TransVenture International Management Consulting Co., Ltd.
地址:梅州市豐順縣留隍鎮(zhèn)新興路881號
北京市大興區(qū)新源大街25號院恒大未來城7號樓1102室
北京市海淀區(qū)西禪寺(華北項目部)
深圳市南山區(qū)高新科技園南區(qū)R2-B棟4樓12室
深圳市福田區(qū)華能大廈
佛山順德區(qū)北滘工業(yè)大道云創(chuàng)空間
汕頭市龍湖區(qū)泰星路9號壹品灣三區(qū)
長沙市芙蓉區(qū)韶山北路139號文化大廈
歡迎來到本網(wǎng)站,請問有什么可以幫您?
稍后再說 現(xiàn)在咨詢