天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

基于RUSBoost算法的違約風(fēng)險(xiǎn)預(yù)測(cè)模型構(gòu)建與應(yīng)用

發(fā)布時(shí)間:2020-10-27 14:16
   針對(duì)金融借貸數(shù)據(jù)存在的較嚴(yán)重的類別不平衡問(wèn)題,構(gòu)建基于RUSBoost算法的違約風(fēng)險(xiǎn)預(yù)測(cè)模型。作為一種集成學(xué)習(xí)方法,RUSBoost算法利用欠采樣實(shí)現(xiàn)了訓(xùn)練集的類別均衡,同時(shí)又通過(guò)對(duì)基學(xué)習(xí)器的獨(dú)立采樣有效克服了因欠采樣而造成的信息丟失問(wèn)題,從而實(shí)現(xiàn)了對(duì)類別不平衡數(shù)據(jù)的較強(qiáng)適應(yīng)能力。基于某網(wǎng)絡(luò)借貸平臺(tái)的金融大數(shù)據(jù),首次將RUSBoost算法應(yīng)用于違約風(fēng)險(xiǎn)預(yù)測(cè),同時(shí)也將隨機(jī)森林、決策樹以及支持向量機(jī)等數(shù)據(jù)挖掘方法分別應(yīng)用于違約風(fēng)險(xiǎn)預(yù)測(cè)問(wèn)題,并與傳統(tǒng)的Logistic回歸方法和最小二乘模型進(jìn)行對(duì)比分析。從實(shí)驗(yàn)結(jié)果來(lái)看,絕大部分?jǐn)?shù)據(jù)挖掘模型的預(yù)測(cè)性能要明顯優(yōu)于傳統(tǒng)模型,而基于RUSBoost算法的違約風(fēng)險(xiǎn)預(yù)測(cè)模型又明顯優(yōu)于其他數(shù)據(jù)挖掘模型。
【部分圖文】:

分布情況,訂單,分布情況,借款期限


本文研究的樣本數(shù)據(jù)來(lái)源于網(wǎng)絡(luò)借貸平臺(tái)“人人貸”2010年10月~2018年5月發(fā)布的借款訂單數(shù)據(jù)。該初始樣本包含了1358004個(gè)借款訂單,涉及1132918個(gè)借款人。所有訂單的借款額以及借款期限的分布情況分別如圖2和圖3所示,其中縱軸為訂單數(shù)量,橫軸分別為借款額(單位為元)和借款期限(單位為月)。從圖2可以看出,大部分訂單的借款額在5.5萬(wàn)元以內(nèi),訂單數(shù)量分布最集中的前三個(gè)區(qū)間分別為10萬(wàn)~15萬(wàn)元、5萬(wàn)~5.5萬(wàn)元以及3萬(wàn)~3.5萬(wàn)元。同時(shí),由圖3可知,借款期限的分布更集中。對(duì)于大部分借款成功的訂單,其還款期限長(zhǎng)則1~2年,短則3~6個(gè)月。其中,申請(qǐng)還款期限為36個(gè)月的訂單雖然數(shù)量較多,但大部分都是借款額在10萬(wàn)元以上的大額訂單,借款成功率很低。圖3 所有訂單的借款期限分布情況

模型圖,模型,ROC曲線,結(jié)論


不同模型的AUC值

ROC曲線,ROC曲線,模型,違約風(fēng)險(xiǎn)


不同模型的ROC曲線及其對(duì)應(yīng)的AUC值分別如圖6和圖7所示。從中可以看出,SVM模型和Logistic回歸模型的ROC曲線最接近對(duì)角線,它們的AUC值也是最小的。而RUSBoost算法的ROC曲線最靠近左上角,并且基本包含了其他模型的ROC曲線。這說(shuō)明基于RUSBoost算法的違約風(fēng)險(xiǎn)預(yù)測(cè)模型是有效的。圖7 不同模型的AUC值
【相似文獻(xiàn)】

相關(guān)期刊論文 前10條

1 韓文倩;;灰色預(yù)測(cè)模型在山東省保費(fèi)預(yù)測(cè)中的應(yīng)用[J];保險(xiǎn)職業(yè)學(xué)院學(xué)報(bào);2017年01期

2 楊萌;;基于灰色預(yù)測(cè)模型的山西省批發(fā)零售業(yè)人員需求分析[J];數(shù)學(xué)的實(shí)踐與認(rèn)識(shí);2017年04期

3 張春濤;關(guān)文忠;劉學(xué)飛;;混沌時(shí)間序列的2階預(yù)測(cè)模型[J];數(shù)學(xué)的實(shí)踐與認(rèn)識(shí);2016年05期

4 祖定利;;一類優(yōu)化的預(yù)測(cè)模型[J];山西青年;2013年24期

5 胡堃;李亞辰;崔欣茹;;灰色預(yù)測(cè)模型及其應(yīng)用[J];旅游縱覽(行業(yè)版);2012年05期

6 王曉軍;王述珍;;社會(huì)保障基金長(zhǎng)期財(cái)務(wù)隨機(jī)預(yù)測(cè)模型的比較與選擇[J];統(tǒng)計(jì)研究;2012年09期

7 趙文霞;;生存壽命的聯(lián)合預(yù)測(cè)模型及其應(yīng)用[J];保定師范?茖W(xué)校學(xué)報(bào);2007年02期

8 羅鄂湘;錢省三;李銳;;可變參數(shù)動(dòng)態(tài)灰色預(yù)測(cè)模型的建立與實(shí)證研究[J];上海理工大學(xué)學(xué)報(bào);2006年05期

9 馬麗萍,褚立國(guó);試論平均預(yù)測(cè)模型假設(shè)[J];內(nèi)蒙古科技與經(jīng)濟(jì);2004年14期

10 鮑祥霖;一個(gè)新的銷量預(yù)測(cè)模型[J];系統(tǒng)工程理論方法應(yīng)用;2000年01期


相關(guān)博士學(xué)位論文 前8條

1 王冬光;控制技術(shù)在投資預(yù)測(cè)模型建立中的應(yīng)用研究[D];哈爾濱工程大學(xué);2005年

2 張麗峰;中國(guó)能源供求預(yù)測(cè)模型及發(fā)展對(duì)策研究[D];首都經(jīng)濟(jì)貿(mào)易大學(xué);2006年

3 畢玉革;北方干寒地區(qū)日光溫室小氣候環(huán)境預(yù)測(cè)模型與數(shù)字化研究[D];內(nèi)蒙古農(nóng)業(yè)大學(xué);2010年

4 沈巍;建立股指波動(dòng)預(yù)測(cè)模型的方法研究及應(yīng)用[D];華北電力大學(xué)(北京);2011年

5 孫忠林;煤礦安全生產(chǎn)預(yù)測(cè)模型的研究[D];山東科技大學(xué);2009年

6 曾波;灰色預(yù)測(cè)建模技術(shù)研究[D];南京航空航天大學(xué);2012年

7 張瑞;不常用備件需求預(yù)測(cè)模型與方法研究[D];華中科技大學(xué);2011年

8 郭暉;區(qū)域航空公司收益管理模型及其應(yīng)用研究[D];華中科技大學(xué);2008年


相關(guān)碩士學(xué)位論文 前10條

1 鄭強(qiáng);基于深度學(xué)習(xí)的光伏發(fā)電量預(yù)測(cè)模型研究[D];華北電力大學(xué);2019年

2 程麗;湖南省GDP預(yù)測(cè)模型比較[D];湘潭大學(xué);2019年

3 王竟羽;基于Stacking的P2P貸款違約預(yù)測(cè)模型構(gòu)建及應(yīng)用[D];成都理工大學(xué);2019年

4 陳麗;基于決策樹最優(yōu)組合的企業(yè)違約預(yù)測(cè)模型[D];大連理工大學(xué);2019年

5 李蘭茜;基于復(fù)雜網(wǎng)絡(luò)結(jié)構(gòu)的鏈路預(yù)測(cè)技術(shù)研究[D];北京郵電大學(xué);2019年

6 戈英杰;混合風(fēng)速預(yù)測(cè)模型的建立與評(píng)估[D];東北財(cái)經(jīng)大學(xué);2018年

7 張建輝;基于BP神經(jīng)網(wǎng)絡(luò)的時(shí)序預(yù)測(cè)模型的研究[D];太原理工大學(xué);2017年

8 張珂;滬銅期貸價(jià)格預(yù)測(cè)模型的構(gòu)建與預(yù)測(cè)研究[D];蘭州交通大學(xué);2017年

9 何巧玲;沙漠化預(yù)測(cè)模型及其定性分析[D];新疆大學(xué);2014年

10 李燕;灰色預(yù)測(cè)模型的研究及其應(yīng)用[D];浙江理工大學(xué);2012年



本文編號(hào):2858631

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/jingjilunwen/jingjiguanlilunwen/2858631.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶a3c93***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com