決策樹算法實現(xiàn)及其在信用風(fēng)險控制中的應(yīng)用
發(fā)布時間:2017-04-23 02:11
本文關(guān)鍵詞:決策樹算法實現(xiàn)及其在信用風(fēng)險控制中的應(yīng)用,由筆耕文化傳播整理發(fā)布。
【摘要】:在本學(xué)位論文中,我們主要考慮決策樹C4.5算法在信用風(fēng)險控制方面的作用,并且為了減少預(yù)測誤差,運用二項分布置信區(qū)間估計的方法改進了其悲觀錯誤修剪算法。 為此,我們先簡要介紹了信用風(fēng)險及其常有用的控制方法;然后闡述了決策樹的內(nèi)容,并指出其在控制信用風(fēng)險中的應(yīng)用;從理論上介紹決策樹C4.5算法模型,包括其生成的信息熵、信息增益理論,修剪時所用的悲觀錯誤修剪法及運用貝葉斯原理及二項分布區(qū)間估計原理改進后的悲觀錯誤修剪算法等;最后用恒豐銀行制造業(yè)及房地產(chǎn)業(yè)數(shù)據(jù)運用Matlab軟件編程實現(xiàn)算法,建立模型,以實例驗證決策樹算法在信用風(fēng)險控制上的應(yīng)用及其顯著作用。 由實例應(yīng)用可得,決策樹模型對信用風(fēng)險的識別能力較強從而能夠較好的控制信用風(fēng)險;所選取的作為判斷分類條件的指標(biāo)具有普遍性,具有較強的說服力。并且決策樹C4.5模型具有以下優(yōu)點: 1.能夠生成易于理解的決策規(guī)則,易被人理解; 2.清晰呈現(xiàn)重要的決策屬性指標(biāo),便于以后做出決策判斷及積累數(shù)據(jù); 3.計算量較小,大大提高了計算速度; 4.既能處理數(shù)據(jù)量較小的情況,又能處理數(shù)據(jù)量較大的情況; 5.可以同時處理連續(xù)的和離散的數(shù)據(jù)。這些優(yōu)點使得我們能在有限的數(shù)據(jù)量下,方便快速準(zhǔn)確的預(yù)測客戶的信用風(fēng)險,有助于銀行信用風(fēng)險管理人員及監(jiān)管機構(gòu)及時準(zhǔn)確的掌握客戶的信用風(fēng)險狀況,從而及時作出規(guī)避或降低信用風(fēng)險的舉措。 但是,決策樹法穩(wěn)健性較差,即雖然其對訓(xùn)練樣本的分類效果很好,但將所建立的決策樹用于對保留樣本的分類時,其錯誤比率有較大幅度的上升。在實際中,新的貸款申請人所屬的總體可能與建模總體有一定的差異,決策樹法的這種不穩(wěn)健性可能造成錯誤分類率高。因此,我們在運用決策樹進行分類預(yù)測時,一定要注意被預(yù)測樣本所屬的總體是否與所用模型屬于同一總體。為解決這一問題,我們可以分行業(yè)對數(shù)據(jù)進行建模,也可以通過聚類分析找出待預(yù)測樣本所屬的總體,然后進行預(yù)測。
【關(guān)鍵詞】:決策樹C4.5 信用風(fēng)險 悲觀錯誤修剪法 二項分布區(qū)間估計 算法實現(xiàn)
【學(xué)位授予單位】:山東大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2013
【分類號】:C934;TP18
【目錄】:
- 中文摘要8-10
- ABSTRACT10-12
- 第一章 導(dǎo)論12-14
- §1.1 背景介紹12-13
- §1.2 研究思路13
- §1.3 創(chuàng)新點13-14
- 第二章 信用風(fēng)險14-17
- §2.1 信用風(fēng)險簡介14-15
- §2 .2 信用風(fēng)險控制15-17
- 第三章 決策樹17-22
- §3.1 國內(nèi)外研究現(xiàn)狀18
- §3.2 決策樹的建立18-22
- 第四章 C4.5決策樹理論介紹22-34
- §4.1 信息熵22-25
- §4.2 信息增益率25-29
- §4.3 悲觀錯誤修剪法29-34
- 第五章 算法實現(xiàn)及應(yīng)用34-43
- §5.1 算法步驟34-37
- §5.2 Matlab程序說明37-39
- §5.3 應(yīng)用39-43
- 第六章 結(jié)論43-46
- 附錄46-54
- 參考文獻54-57
- 致謝57-58
- 學(xué)位論文評閱及答辯情況表58
【參考文獻】
中國期刊全文數(shù)據(jù)庫 前7條
1 黃文;;決策樹的經(jīng)典算法:ID3與C4.5[J];四川文理學(xué)院學(xué)報;2007年05期
2 范潔,楊岳湘;決策樹后剪枝算法的研究[J];湖南廣播電視大學(xué)學(xué)報;2005年01期
3 田振清,周越;信息熵基本性質(zhì)的研究[J];內(nèi)蒙古師范大學(xué)學(xué)報(自然科學(xué)漢文版);2002年04期
4 劉小虎,李生;決策樹的優(yōu)化算法[J];軟件學(xué)報;1998年10期
5 魏紅寧;決策樹剪枝方法的比較[J];西南交通大學(xué)學(xué)報;2005年01期
6 譚旭,王麗珍,卓明;利用決策樹發(fā)掘分類規(guī)則的算法研究[J];云南大學(xué)學(xué)報(自然科學(xué)版);2000年06期
7 李鴻;;二項分布的參數(shù)估計問題研究[J];應(yīng)用數(shù)學(xué)學(xué)報;2010年03期
本文關(guān)鍵詞:決策樹算法實現(xiàn)及其在信用風(fēng)險控制中的應(yīng)用,由筆耕文化傳播整理發(fā)布。
,本文編號:321660
本文鏈接:http://sikaile.net/guanlilunwen/lindaojc/321660.html
最近更新
教材專著