決策樹(shù)算法實(shí)現(xiàn)及其在信用風(fēng)險(xiǎn)控制中的應(yīng)用
本文關(guān)鍵詞:決策樹(shù)算法實(shí)現(xiàn)及其在信用風(fēng)險(xiǎn)控制中的應(yīng)用,由筆耕文化傳播整理發(fā)布。
【摘要】:在本學(xué)位論文中,我們主要考慮決策樹(shù)C4.5算法在信用風(fēng)險(xiǎn)控制方面的作用,并且為了減少預(yù)測(cè)誤差,運(yùn)用二項(xiàng)分布置信區(qū)間估計(jì)的方法改進(jìn)了其悲觀錯(cuò)誤修剪算法。 為此,我們先簡(jiǎn)要介紹了信用風(fēng)險(xiǎn)及其常有用的控制方法;然后闡述了決策樹(shù)的內(nèi)容,并指出其在控制信用風(fēng)險(xiǎn)中的應(yīng)用;從理論上介紹決策樹(shù)C4.5算法模型,包括其生成的信息熵、信息增益理論,修剪時(shí)所用的悲觀錯(cuò)誤修剪法及運(yùn)用貝葉斯原理及二項(xiàng)分布區(qū)間估計(jì)原理改進(jìn)后的悲觀錯(cuò)誤修剪算法等;最后用恒豐銀行制造業(yè)及房地產(chǎn)業(yè)數(shù)據(jù)運(yùn)用Matlab軟件編程實(shí)現(xiàn)算法,建立模型,以實(shí)例驗(yàn)證決策樹(shù)算法在信用風(fēng)險(xiǎn)控制上的應(yīng)用及其顯著作用。 由實(shí)例應(yīng)用可得,決策樹(shù)模型對(duì)信用風(fēng)險(xiǎn)的識(shí)別能力較強(qiáng)從而能夠較好的控制信用風(fēng)險(xiǎn);所選取的作為判斷分類條件的指標(biāo)具有普遍性,具有較強(qiáng)的說(shuō)服力。并且決策樹(shù)C4.5模型具有以下優(yōu)點(diǎn): 1.能夠生成易于理解的決策規(guī)則,易被人理解; 2.清晰呈現(xiàn)重要的決策屬性指標(biāo),便于以后做出決策判斷及積累數(shù)據(jù); 3.計(jì)算量較小,大大提高了計(jì)算速度; 4.既能處理數(shù)據(jù)量較小的情況,又能處理數(shù)據(jù)量較大的情況; 5.可以同時(shí)處理連續(xù)的和離散的數(shù)據(jù)。這些優(yōu)點(diǎn)使得我們能在有限的數(shù)據(jù)量下,方便快速準(zhǔn)確的預(yù)測(cè)客戶的信用風(fēng)險(xiǎn),有助于銀行信用風(fēng)險(xiǎn)管理人員及監(jiān)管機(jī)構(gòu)及時(shí)準(zhǔn)確的掌握客戶的信用風(fēng)險(xiǎn)狀況,從而及時(shí)作出規(guī)避或降低信用風(fēng)險(xiǎn)的舉措。 但是,決策樹(shù)法穩(wěn)健性較差,即雖然其對(duì)訓(xùn)練樣本的分類效果很好,但將所建立的決策樹(shù)用于對(duì)保留樣本的分類時(shí),其錯(cuò)誤比率有較大幅度的上升。在實(shí)際中,新的貸款申請(qǐng)人所屬的總體可能與建?傮w有一定的差異,決策樹(shù)法的這種不穩(wěn)健性可能造成錯(cuò)誤分類率高。因此,我們?cè)谶\(yùn)用決策樹(shù)進(jìn)行分類預(yù)測(cè)時(shí),一定要注意被預(yù)測(cè)樣本所屬的總體是否與所用模型屬于同一總體。為解決這一問(wèn)題,我們可以分行業(yè)對(duì)數(shù)據(jù)進(jìn)行建模,也可以通過(guò)聚類分析找出待預(yù)測(cè)樣本所屬的總體,然后進(jìn)行預(yù)測(cè)。
【關(guān)鍵詞】:決策樹(shù)C4.5 信用風(fēng)險(xiǎn) 悲觀錯(cuò)誤修剪法 二項(xiàng)分布區(qū)間估計(jì) 算法實(shí)現(xiàn)
【學(xué)位授予單位】:山東大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2013
【分類號(hào)】:C934;TP18
【目錄】:
- 中文摘要8-10
- ABSTRACT10-12
- 第一章 導(dǎo)論12-14
- §1.1 背景介紹12-13
- §1.2 研究思路13
- §1.3 創(chuàng)新點(diǎn)13-14
- 第二章 信用風(fēng)險(xiǎn)14-17
- §2.1 信用風(fēng)險(xiǎn)簡(jiǎn)介14-15
- §2 .2 信用風(fēng)險(xiǎn)控制15-17
- 第三章 決策樹(shù)17-22
- §3.1 國(guó)內(nèi)外研究現(xiàn)狀18
- §3.2 決策樹(shù)的建立18-22
- 第四章 C4.5決策樹(shù)理論介紹22-34
- §4.1 信息熵22-25
- §4.2 信息增益率25-29
- §4.3 悲觀錯(cuò)誤修剪法29-34
- 第五章 算法實(shí)現(xiàn)及應(yīng)用34-43
- §5.1 算法步驟34-37
- §5.2 Matlab程序說(shuō)明37-39
- §5.3 應(yīng)用39-43
- 第六章 結(jié)論43-46
- 附錄46-54
- 參考文獻(xiàn)54-57
- 致謝57-58
- 學(xué)位論文評(píng)閱及答辯情況表58
【參考文獻(xiàn)】
中國(guó)期刊全文數(shù)據(jù)庫(kù) 前7條
1 黃文;;決策樹(shù)的經(jīng)典算法:ID3與C4.5[J];四川文理學(xué)院學(xué)報(bào);2007年05期
2 范潔,楊岳湘;決策樹(shù)后剪枝算法的研究[J];湖南廣播電視大學(xué)學(xué)報(bào);2005年01期
3 田振清,周越;信息熵基本性質(zhì)的研究[J];內(nèi)蒙古師范大學(xué)學(xué)報(bào)(自然科學(xué)漢文版);2002年04期
4 劉小虎,李生;決策樹(shù)的優(yōu)化算法[J];軟件學(xué)報(bào);1998年10期
5 魏紅寧;決策樹(shù)剪枝方法的比較[J];西南交通大學(xué)學(xué)報(bào);2005年01期
6 譚旭,王麗珍,卓明;利用決策樹(shù)發(fā)掘分類規(guī)則的算法研究[J];云南大學(xué)學(xué)報(bào)(自然科學(xué)版);2000年06期
7 李鴻;;二項(xiàng)分布的參數(shù)估計(jì)問(wèn)題研究[J];應(yīng)用數(shù)學(xué)學(xué)報(bào);2010年03期
本文關(guān)鍵詞:決策樹(shù)算法實(shí)現(xiàn)及其在信用風(fēng)險(xiǎn)控制中的應(yīng)用,由筆耕文化傳播整理發(fā)布。
,本文編號(hào):321660
本文鏈接:http://sikaile.net/guanlilunwen/lindaojc/321660.html