應(yīng)用決策樹構(gòu)建個人住房貸款風(fēng)險評估模型
發(fā)布時間:2017-05-23 10:16
本文關(guān)鍵詞:應(yīng)用決策樹構(gòu)建個人住房貸款風(fēng)險評估模型,由筆耕文化傳播整理發(fā)布。
【摘要】: 本文主要運用數(shù)據(jù)挖掘中的決策樹技術(shù)對經(jīng)過預(yù)處理后的個人住房貸款挖掘數(shù)據(jù)集中的數(shù)據(jù)進(jìn)行分析,發(fā)現(xiàn)隱藏在大量數(shù)據(jù)中的隱含模式,最終得到個人住房貸款風(fēng)險評估模型。本文研究的內(nèi)容主要包括數(shù)據(jù)采集、數(shù)據(jù)預(yù)處理以及模型的建立,而這三部分又是基于數(shù)據(jù)挖掘以及決策樹的相關(guān)理論,根據(jù)業(yè)務(wù)需求并按照數(shù)據(jù)挖掘工作的一般步驟展開的。 論文針對我國商業(yè)銀行信貸資產(chǎn)質(zhì)量低下和風(fēng)險加大的客觀情況,借鑒外資銀行應(yīng)用數(shù)據(jù)挖掘決策樹技術(shù)建立客戶信用評價系統(tǒng)的成功經(jīng)驗,在明確挖掘目的的前提下,深入理解數(shù)據(jù)挖掘、決策樹、數(shù)據(jù)采集、數(shù)據(jù)預(yù)處理、聚類分析以及模型評價等方面的相關(guān)概念。在此基礎(chǔ)上,結(jié)合本文研究的問題以及數(shù)據(jù)的特點,通過各種方法的分析與比較,用適合的數(shù)據(jù)采集和預(yù)處理方法對數(shù)據(jù)庫中的一半數(shù)據(jù)進(jìn)行處理,建立適合挖掘的數(shù)據(jù)集,應(yīng)用決策樹C4.5算法以及聚類k-平均算法對這些數(shù)據(jù)進(jìn)行挖掘和分析,通過計算風(fēng)險度量值和決策影響程度值,確定每個屬性各個取值的分?jǐn)?shù)值,得到個人住房貸款風(fēng)險評估模型。最后使用剩余的一半數(shù)據(jù)作為測試樣本來評價這個模型,證明此模型具有較強的預(yù)測能力,是當(dāng)前商業(yè)銀行可以采用的最優(yōu)模型,值得在實踐中推廣。 具體來說,本文的研究內(nèi)容主要有以下幾個方面: 1.針對我國個人住房貸款違約率上升的現(xiàn)象,借鑒國外銀行取得的成果,提出使用數(shù)據(jù)挖掘決策樹技術(shù)構(gòu)建個人住房貸款風(fēng)險評估模型將會給商業(yè)銀行帶來很多直接效益。 2.通過數(shù)據(jù)挖掘分類算法的比較,選擇決策樹技術(shù)以及經(jīng)典的C4.5算法作為本研究使用的算法,,并介紹其基本理論。 3.依據(jù)數(shù)據(jù)挖掘步驟,明確挖掘目的,以某商業(yè)銀行個人信貸數(shù)據(jù)為分析對象,分析研究個人住房貸款原始數(shù)據(jù)庫的數(shù)據(jù),通過隨機(jī)序列發(fā)生器,從中隨機(jī)抽取一半數(shù)據(jù)作為本研究的樣本數(shù)據(jù),得到個人住房貸款處理數(shù)據(jù)集,為數(shù)據(jù)挖掘后續(xù)步驟奠定數(shù)據(jù)基礎(chǔ),另外一半將被用來測試。 4.兼顧數(shù)據(jù)質(zhì)量和計算效率,對一些重要的預(yù)處理方法深入地研究和實踐,選擇較為完善的預(yù)處理方法對個人住房貸款處理數(shù)據(jù)集進(jìn)行了一系列的處理,得到適合挖掘的個人住房貸款挖掘數(shù)據(jù)集。 5.在數(shù)據(jù)挖掘及決策樹理論的指導(dǎo)下,使用決策樹分類技術(shù)和聚類技術(shù),應(yīng)用C4.5算法計算信息增益率創(chuàng)建決策樹,在此基礎(chǔ)上,計算風(fēng)險度量值和決策影響程度值得到個人住房貸款風(fēng)險評估模型,進(jìn)而通過聚類k-平均算法劃分風(fēng)險評估等級。 6.使用原始數(shù)據(jù)庫中的另一半數(shù)據(jù)對個人住房貸款風(fēng)險評估模型進(jìn)行測試和評價,證明其預(yù)測準(zhǔn)確率較高,穩(wěn)健性好,易于理解,效率高,推廣能力強。
【關(guān)鍵詞】:決策樹 個人住房貸款 風(fēng)險評估 數(shù)據(jù)預(yù)處理 數(shù)據(jù)挖掘
【學(xué)位授予單位】:東北財經(jīng)大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2007
【分類號】:F832.4;F224
【目錄】:
- 摘要2-4
- ABSTRACT4-8
- 第1章 緒論8-13
- 1.1 課題背景及選題意義8-10
- 1.2 數(shù)據(jù)挖掘決策樹技術(shù)在國內(nèi)外銀行信貸業(yè)務(wù)的應(yīng)用現(xiàn)狀10-11
- 1.3 本文的研究方法及內(nèi)容11-13
- 第2章 數(shù)據(jù)挖掘的基本理論13-22
- 2.1 數(shù)據(jù)挖掘的定義13-14
- 2.1.1 技術(shù)角度的定義13
- 2.1.2 商業(yè)角度的定義13-14
- 2.2 數(shù)據(jù)挖掘的作用及功能14-15
- 2.3 數(shù)據(jù)挖掘的一般過程及具體應(yīng)用15-17
- 2.3.1 數(shù)據(jù)挖掘的一般過程15-16
- 2.3.2 個人住房貸款數(shù)據(jù)挖掘的過程16-17
- 2.4 數(shù)據(jù)挖掘的方法與選擇17-22
- 2.4.1 傳統(tǒng)統(tǒng)計分析18
- 2.4.2 神經(jīng)網(wǎng)絡(luò)技術(shù)18-19
- 2.4.3 決策樹方法19-20
- 2.4.4 數(shù)據(jù)挖掘方法的選擇20-22
- 第3章 決策樹的基本理論22-31
- 3.1 決策樹的基本概念22-23
- 3.2 決策樹算法及選擇23-26
- 3.2.1 ID3算法23-24
- 3.2.2 C4.5算法24-26
- 3.2.3 算法比較與選擇26
- 3.3 決策樹的構(gòu)造26-31
- 3.3.1 決策樹生成的操作過程26-28
- 3.3.2 決策樹的生長28-29
- 3.3.3 C4.5算法決策樹的修剪29
- 3.3.4 C4.5算法規(guī)則提取29-31
- 第4章 數(shù)據(jù)準(zhǔn)備31-44
- 4.1 數(shù)據(jù)采集31-32
- 4.1.1 數(shù)據(jù)采集方法31-32
- 4.1.2 數(shù)據(jù)采集結(jié)果32
- 4.2 數(shù)據(jù)預(yù)處理32-44
- 4.2.1 數(shù)據(jù)預(yù)處理的必要性32-34
- 4.2.2 數(shù)據(jù)預(yù)處理的內(nèi)容和方法34-42
- 4.2.3 數(shù)據(jù)預(yù)處理的結(jié)果42-44
- 第5章 個人住房貸款信用風(fēng)險評估模型的建立44-56
- 5.1 決策屬性信息增益率的計算44-47
- 5.2 依據(jù) C4.5算法構(gòu)造決策樹47-48
- 5.3 基于決策樹構(gòu)建風(fēng)險評估模型48-50
- 5.4 聚類分析確定風(fēng)險評估等級50-54
- 5.4.1 聚類的概念以及k-平均算法50-52
- 5.4.2 確定風(fēng)險評估等級52-54
- 5.5 模型評價54-56
- 第6章 總結(jié)與展望56-58
- 參考文獻(xiàn)58-62
- 后記62-63
【引證文獻(xiàn)】
中國期刊全文數(shù)據(jù)庫 前1條
1 潘浩;藺莉;;基于決策樹的畢業(yè)生課程優(yōu)化算法設(shè)計[J];信息技術(shù);2010年08期
本文關(guān)鍵詞:應(yīng)用決策樹構(gòu)建個人住房貸款風(fēng)險評估模型,由筆耕文化傳播整理發(fā)布。
本文編號:387637
本文鏈接:http://sikaile.net/guanlilunwen/bankxd/387637.html
最近更新
教材專著