一種基于Boosting算法的新模型在銀行信用評級中的應(yīng)用
本文關(guān)鍵詞:一種基于Boosting算法的新模型在銀行信用評級中的應(yīng)用
更多相關(guān)文章: 信用評級 不平衡數(shù)據(jù) HSBoost算法
【摘要】:銀行擁有大量的信用貸款數(shù)據(jù),大數(shù)據(jù)時代運(yùn)用信用評分模型去準(zhǔn)確地判斷申請人的信用風(fēng)險是未來發(fā)展的趨勢。在實(shí)際的信用評分?jǐn)?shù)據(jù)庫中,信用好的申請者通常都比信用不好的申請者多很多,從而導(dǎo)致了數(shù)據(jù)集的不平衡,而機(jī)器學(xué)習(xí)在不平衡數(shù)據(jù)集上的訓(xùn)練往往對小類的識別率比較低,錯誤地給予信用不好的申請者貸款會給銀行帶來巨大的商業(yè)危害,因此提高分類器對小類的識別至關(guān)重要。本文提出了一種基于混合重抽樣和Boosting算法的新模型HSBoosto第一階段,對不平衡數(shù)據(jù)集進(jìn)行混合重抽樣處理,從而獲得平衡的樣本訓(xùn)練集;第二階段,利用Boosting算法更改容易被錯誤分類的小類樣本的權(quán)值,從而來提高分類器對小類樣本的識別能力。本文利用UCI數(shù)據(jù)庫的信用評分?jǐn)?shù)據(jù)集,運(yùn)用HSBoost算法做實(shí)證分析,用SVM、BP神經(jīng)網(wǎng)絡(luò)、DT作為基本分類器,對比已有的RUSBoost算法、SMOTEBoost算法、混合重抽樣技術(shù)和兩種基本重抽樣技術(shù),驗(yàn)證了HSBoost算法的有效性和可行性,提高了分類器對小類的識別率。同時利用非參數(shù)Wilcoxon配對符號秩檢驗(yàn),證明了HSBoost算法顯著優(yōu)于SMOTEBoost算法。
【關(guān)鍵詞】:信用評級 不平衡數(shù)據(jù) HSBoost算法
【學(xué)位授予單位】:北京交通大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2016
【分類號】:TP311.13;F830.5
【目錄】:
- 致謝5-6
- 摘要6-7
- ABSTRACT7-10
- 1 引言10-15
- 1.1 研究背景和意義10-11
- 1.2 研究現(xiàn)狀11-13
- 1.2.1 不平衡數(shù)據(jù)集分類困難的原因11-12
- 1.2.2 國內(nèi)外研究狀況12-13
- 1.3 創(chuàng)新點(diǎn)13
- 1.4 論文安排13-15
- 2 不平衡數(shù)據(jù)的分類方法15-29
- 2.1 基于數(shù)據(jù)層面15-16
- 2.1.1 欠抽樣(under-sampling)15-16
- 2.1.2 過抽樣(over-sampling)16
- 2.2 基于算法層面16-19
- 2.2.1 Boosting16-18
- 2.2.2 代價敏感法18-19
- 2.3 基于判別準(zhǔn)則19-21
- 2.3.1 AUC20-21
- 2.4 分類器21-29
- 2.4.1 支持向量機(jī)21-24
- 2.4.2 BP神經(jīng)網(wǎng)絡(luò)24-26
- 2.4.3 決策樹26-29
- 3 一種新的混合式集成算法29-33
- 3.1 抽樣方法和集成算法的混合應(yīng)用29-30
- 3.1.1 混合重抽樣算法(Hybrid Sampling)29
- 3.1.2 SMOTEBoost算法29-30
- 3.1.3 RUSBoost算法30
- 3.2 一種新的混合式集成算法(HSBoost)30-33
- 4 HSBoost算法實(shí)證研究33-45
- 4.1 數(shù)據(jù)預(yù)處理33-34
- 4.2 模型構(gòu)建及參數(shù)設(shè)置34-36
- 4.2.1 模型構(gòu)建34-35
- 4.2.2 參數(shù)設(shè)置35-36
- 4.3 實(shí)證結(jié)果分析36-42
- 4.4 非參數(shù)檢驗(yàn)42-45
- 5 結(jié)論和展望45-46
- 參考文獻(xiàn)46-48
- 作者簡歷及攻讀碩士學(xué)位期間取得的研究成果48-50
- 學(xué)位論文數(shù)據(jù)集50
【相似文獻(xiàn)】
中國期刊全文數(shù)據(jù)庫 前10條
1 涂承勝;刁力力;魯明羽;陸玉昌;;Boosting家族Boost-by-majority系列代表算法[J];計算機(jī)科學(xué);2003年04期
2 陳愛斌,夏利民;基于Boosting算法的入侵檢測[J];計算機(jī)工程;2004年11期
3 朱文球,羅三定;基于級聯(lián)式Boosting方法的人臉檢測[J];計算機(jī)應(yīng)用;2005年09期
4 唐軼;;多分類Boosting算法的一致性[J];計算機(jī)工程與應(yīng)用;2006年18期
5 董樂紅;耿國華;高原;;Boosting算法綜述[J];計算機(jī)應(yīng)用與軟件;2006年08期
6 花小朋;王歡;蘭少華;;Boosting算法在入侵檢測中的應(yīng)用[J];通信技術(shù);2007年09期
7 章樺;;多示例人臉的Boosting檢測[J];軟件導(dǎo)刊;2008年05期
8 孫顯;王宏琦;張正;;基于對象的Boosting方法自動提取高分辨率遙感圖像中建筑物目標(biāo)[J];電子與信息學(xué)報;2009年01期
9 ;Thickness Measurement of Insulation Coating by NIR Spectrometry Based on Boosting-KPLS[J];光譜學(xué)與光譜分析;2011年08期
10 于振洋;;基于Boosting的網(wǎng)絡(luò)異常流量檢測算法研究[J];淮陰工學(xué)院學(xué)報;2011年05期
中國重要會議論文全文數(shù)據(jù)庫 前9條
1 翟素蘭;羅斌;郭玉堂;;雙向Boosting模糊聚類集成[A];第二十六屆中國控制會議論文集[C];2007年
2 李秋潔;茅耀斌;王執(zhí)銓;;一種基于boosting的不平衡數(shù)據(jù)分類算法[A];中國自動化學(xué)會控制理論專業(yè)委員會C卷[C];2011年
3 ;Boosting MBR Based kNN Search Over Multimedia Data by Approximate Pruning Metric[A];Information Technology and Computer Science—Proceedings of 2012 National Conference on Information Technology and Computer Science[C];2012年
4 ;A Target Recognition and Segmentation Method Based On Boosting and PDE[A];第24屆中國控制與決策會議論文集[C];2012年
5 李訓(xùn)青;黃磊;劉迎建;;基于Boosting集成的SMO增強(qiáng)型分類器設(shè)計[A];第八屆全國漢字識別學(xué)術(shù)會議論文集[C];2002年
6 房一飛;張冬茉;;基于boosting的文本分類在股市領(lǐng)域信息抽取系統(tǒng)中的應(yīng)用[A];輝煌二十年——中國中文信息學(xué)會二十周年學(xué)術(shù)會議論文集[C];2001年
7 Günter Reiter;Stephen S.D.Cheng;;Boosting Mechanical Properties of Polymer Materials by building Nacre-like Hierarchy Micro-sheet Structure in Bulk Polymer[A];2009年全國高分子學(xué)術(shù)論文報告會論文摘要集(上冊)[C];2009年
8 許青松;;QSAR建模的boosting方法[A];第九屆全國計算(機(jī))化學(xué)學(xué)術(shù)會議論文摘要集[C];2007年
9 李月敏;陳杰;高文;尹寶才;;快速人臉檢測技術(shù)綜述[A];全國第16屆計算機(jī)科學(xué)與技術(shù)應(yīng)用(CACIS)學(xué)術(shù)會議論文集[C];2004年
中國碩士學(xué)位論文全文數(shù)據(jù)庫 前10條
1 嚴(yán)愛玉;基于Stockwell變換與Boosting算法的自動癲癇檢測[D];山東大學(xué);2015年
2 賈璋衡;基于隨機(jī)森林和boosting思想的推薦算法的研究[D];廣西師范大學(xué);2015年
3 郭連坤;基于多核Boosting多特征組合高光譜分類技術(shù)研究[D];西安科技大學(xué);2015年
4 翟璐;一種基于Boosting算法的新模型在銀行信用評級中的應(yīng)用[D];北京交通大學(xué);2016年
5 曾慶尚;基于Boosting策略的啟動子預(yù)測方法研究[D];煙臺大學(xué);2009年
6 姚睿;基于代價敏感Boosting算法的醫(yī)學(xué)影像分析方法研究[D];上海交通大學(xué);2011年
7 江鵬;基于Boosting的分布估計算法[D];上海交通大學(xué);2009年
8 王笑坤;Boosting算法及其應(yīng)用[D];西北大學(xué);2007年
9 沈丁成;基于在線Boosting算法的目標(biāo)跟蹤研究[D];天津理工大學(xué);2013年
10 丁紅帥;基于Boosting的分布估計算法[D];上海交通大學(xué);2010年
,本文編號:777170
本文鏈接:http://sikaile.net/guanlilunwen/bankxd/777170.html