P2P網(wǎng)絡(luò)借貸個人信用風(fēng)險(xiǎn)評估模型研究
發(fā)布時間:2021-02-08 09:41
P2P網(wǎng)絡(luò)借貸出現(xiàn)于21世紀(jì)初,是在金融行業(yè)和互聯(lián)網(wǎng)技術(shù)逐漸成熟的社會背景下發(fā)展而來的。它是民間普惠金融和互聯(lián)網(wǎng)金融的重要組成部分,是小額信貸領(lǐng)域的一種延續(xù)和創(chuàng)新,對傳統(tǒng)信貸業(yè)務(wù)結(jié)構(gòu)構(gòu)成了補(bǔ)充,自出現(xiàn)以來在全球范圍內(nèi)迅速發(fā)展。然而我國的P2P網(wǎng)絡(luò)借貸起步較晚,信用體系的不完善加之相關(guān)法律法規(guī)的缺失使得該行業(yè)存在嚴(yán)重的資金安全隱患。隨著大數(shù)據(jù)時代的到來,從海量數(shù)據(jù)中提取有用信息,構(gòu)建有效、可靠的信用風(fēng)險(xiǎn)評估模型對違約情況實(shí)現(xiàn)準(zhǔn)確預(yù)測,提高P2P平臺及投資者的風(fēng)險(xiǎn)監(jiān)控和識別能力,這對促進(jìn)該行業(yè)的健康、穩(wěn)定發(fā)展具有重要的現(xiàn)實(shí)意義。雖然在P2P網(wǎng)絡(luò)借貸信用風(fēng)險(xiǎn)評估方面已有較多的研究成果,但大多數(shù)研究都是針對單一模型,并且隨著不斷地改良,單一模型性能提升的空間已經(jīng)非常有限。近年來,組合模型因具有更優(yōu)異的預(yù)測效果而備受推崇,但這方面的相關(guān)研究還較少。于是,本文分別采用傳統(tǒng)的統(tǒng)計(jì)學(xué)方法Logistic回歸和新興的機(jī)器學(xué)習(xí)中隨機(jī)森林的方法建立了單一模型,并嘗試將單一模型進(jìn)行組合,本文所用的方法和得出的模型完善了這方面的研究。本文選用美國的Lending Club這一 P2P平臺的借貸數(shù)據(jù)作為實(shí)證數(shù)據(jù)集...
【文章來源】:山東大學(xué)山東省 211工程院校 985工程院校 教育部直屬院校
【文章頁數(shù)】:59 頁
【學(xué)位級別】:碩士
【圖文】:
圖2_2行業(yè)成交量變化趨勢??9??
,所以可以有效??避免過擬合。??調(diào)練樣本集??/??/?bootstrap?抽樣?Z??????1?????—iZZ?—[“?口:1.——?;?;??f?淵練集2?II?調(diào)練集k??S?公?為?Sb??_^?決策樹!?決策樹2?決策數(shù)Jc??1?1?"j??決策樹1分炎1?決策樹2分類'?決策樹k分類??成囤歸結(jié)果?成罔歸結(jié)果? ̄?或回掃結(jié)果??\:^?一,一??/ ̄sa*5a?5i??7??/?結(jié)*或?灼結(jié)果?丨!??圖3-1隨機(jī)森林的構(gòu)建過程??隨機(jī)森林模型利用Bootstrap法抽取樣本時,原始數(shù)據(jù)中約有36.8%的樣本??不會出現(xiàn)在Bootstrap樣本中,這些數(shù)據(jù)成為袋外數(shù)據(jù),可用來估計(jì)模型的泛化??誤差。每棵決策樹都有一個OOB誤差估計(jì),取森林中所有決策樹OOB估計(jì)的??平均值就是隨機(jī)森林的泛化誤差估計(jì)。Breiman證明,OOB估計(jì)是無偏估計(jì),與??交叉驗(yàn)證相比,OOB估計(jì)不僅高效,且兩者非常接近。??3.6模型評價(jià)??本文選用由混淆矩陣得出的相關(guān)指標(biāo)以及ROC曲線、KS曲線對模型進(jìn)行??評價(jià),首先引入混淆矩陣的概念。??3.6.1混淆矩陣??以二分類模型為例,表3-2的混淆矩陣呈現(xiàn)了分類結(jié)果。TP(Tme?Positive)??稱為真正例數(shù),是實(shí)際類別為1,預(yù)測類別也為1的樣本數(shù);TN(True?Negative)??稱為真負(fù)例數(shù),是實(shí)際類別為0,預(yù)測類別也為0的樣本數(shù);FN(False?Negative)??稱為假負(fù)例數(shù),是實(shí)際類別為1,預(yù)測類別為0的樣本數(shù);FP(FaIse?Positive)稱??為假正例數(shù),是實(shí)際類別為0,預(yù)測類別
baLgt?0?0.156?0.237?-0.379?-0.131?0.100?0.145?0.163??percentjc_gt_75?-0.137?0.315?0.132?-0.265?-0.112?-0.163??tot_HLcred_lim?0.286?0.167?0.284?-0.184?0.147?0.103??totaljjcjinit?0.342?-0.154?0.155?-0.123?-0.181?-0.177?-0.309?-0.147??圖4-3?Comp.卜Comp.?11的意義??對這11個主成分加上4.1.5中的5個虛擬變量gradel、grade2、homel、??home2、term進(jìn)行基于逐步回歸的邏輯回歸,模型并未進(jìn)一步剔除變量,且除??Comp.8外,其余變量均在1%的顯著性水平下顯著。回歸結(jié)果如圖4-4:??coefficients:??Estimate?std.?Error?z?value?Pr(>|z|)??(intercept)?-0.135534?0.048595?-2.789?0.00529?**??term?0.384042?0.033600?11.430?<?2e-16?***??homel?-0.145761?0.048639?-2.997?0.00273?**??home2?0.139721?0.045997?3.038?0.00238?**??gradel?-0.307728?0.044810?-6.867?6.54e-12?***??g「ade2?0.298434?0.037815?7.892?2.97e-15?***??Com
【參考文獻(xiàn)】:
期刊論文
[1]基于機(jī)器學(xué)習(xí)模型的P2P網(wǎng)貸平臺風(fēng)險(xiǎn)預(yù)警研究[J]. 嚴(yán)武,馮凌秉,蔣志慧,孔雯. 金融與經(jīng)濟(jì). 2019(09)
[2]基于偏最小二乘回歸的P2P網(wǎng)絡(luò)借貸平臺信用風(fēng)險(xiǎn)評估探究[J]. 陳為民,龍小凡,楊密,袁旭宏. 湖南人文科技學(xué)院學(xué)報(bào). 2019(05)
[3]P2P網(wǎng)絡(luò)借貸平臺信用風(fēng)險(xiǎn)識別研究[J]. 仝凌云,曹澤陽,安利平,梁強(qiáng)強(qiáng). 金融理論與實(shí)踐. 2019(10)
[4]互聯(lián)網(wǎng)金融P2P貸款違約風(fēng)險(xiǎn)評估、貸款期限和風(fēng)險(xiǎn)溢價(jià)[J]. 王浩名,馬樹才. 財(cái)經(jīng)論叢. 2019(07)
[5]基于機(jī)器學(xué)習(xí)的P2P違約預(yù)測算法比較——以“人人貸”為例[J]. 李汛,龍真,付懷宇,劉品璐. 統(tǒng)計(jì)與管理. 2019(06)
[6]基于多分類器動態(tài)集成的P2P違約風(fēng)險(xiǎn)評估[J]. 胡忠義,王超群,陳遠(yuǎn),吳江,鮑玉昆. 管理學(xué)報(bào). 2019(06)
[7]文本信息在P2P借貸平臺違約評價(jià)中的作用——基于Multinomial Lasso-logistic模型[J]. 宓超,劉佳佳. 數(shù)學(xué)的實(shí)踐與認(rèn)識. 2019(05)
[8]基于非均衡模糊近似支持向量機(jī)的P2P網(wǎng)貸借款人信用風(fēng)險(xiǎn)評估及應(yīng)用[J]. 張衛(wèi)國,盧媛媛,劉勇軍. 系統(tǒng)工程理論與實(shí)踐. 2018(10)
[9]基于SVM-Logistic組合模型的P2P借款者信用風(fēng)險(xiǎn)評估——以微貸網(wǎng)為例[J]. 都紅雯,盧孝偉. 生產(chǎn)力研究. 2018(10)
[10]基于LightGBM算法的P2P項(xiàng)目信用評級模型的設(shè)計(jì)及應(yīng)用[J]. 馬曉君,沙靖嵐,牛雪琪. 數(shù)量經(jīng)濟(jì)技術(shù)經(jīng)濟(jì)研究. 2018(05)
碩士論文
[1]基于多個分類模型的P2P借款人信貸風(fēng)險(xiǎn)評估研究[D]. 王敏佳.浙江工商大學(xué) 2018
[2]隨機(jī)森林在P2P網(wǎng)貸借款信用風(fēng)險(xiǎn)評估中的應(yīng)用[D]. 徐婷婷.山東大學(xué) 2017
本文編號:3023722
【文章來源】:山東大學(xué)山東省 211工程院校 985工程院校 教育部直屬院校
【文章頁數(shù)】:59 頁
【學(xué)位級別】:碩士
【圖文】:
圖2_2行業(yè)成交量變化趨勢??9??
,所以可以有效??避免過擬合。??調(diào)練樣本集??/??/?bootstrap?抽樣?Z??????1?????—iZZ?—[“?口:1.——?;?;??f?淵練集2?II?調(diào)練集k??S?公?為?Sb??_^?決策樹!?決策樹2?決策數(shù)Jc??1?1?"j??決策樹1分炎1?決策樹2分類'?決策樹k分類??成囤歸結(jié)果?成罔歸結(jié)果? ̄?或回掃結(jié)果??\:^?一,一??/ ̄sa*5a?5i??7??/?結(jié)*或?灼結(jié)果?丨!??圖3-1隨機(jī)森林的構(gòu)建過程??隨機(jī)森林模型利用Bootstrap法抽取樣本時,原始數(shù)據(jù)中約有36.8%的樣本??不會出現(xiàn)在Bootstrap樣本中,這些數(shù)據(jù)成為袋外數(shù)據(jù),可用來估計(jì)模型的泛化??誤差。每棵決策樹都有一個OOB誤差估計(jì),取森林中所有決策樹OOB估計(jì)的??平均值就是隨機(jī)森林的泛化誤差估計(jì)。Breiman證明,OOB估計(jì)是無偏估計(jì),與??交叉驗(yàn)證相比,OOB估計(jì)不僅高效,且兩者非常接近。??3.6模型評價(jià)??本文選用由混淆矩陣得出的相關(guān)指標(biāo)以及ROC曲線、KS曲線對模型進(jìn)行??評價(jià),首先引入混淆矩陣的概念。??3.6.1混淆矩陣??以二分類模型為例,表3-2的混淆矩陣呈現(xiàn)了分類結(jié)果。TP(Tme?Positive)??稱為真正例數(shù),是實(shí)際類別為1,預(yù)測類別也為1的樣本數(shù);TN(True?Negative)??稱為真負(fù)例數(shù),是實(shí)際類別為0,預(yù)測類別也為0的樣本數(shù);FN(False?Negative)??稱為假負(fù)例數(shù),是實(shí)際類別為1,預(yù)測類別為0的樣本數(shù);FP(FaIse?Positive)稱??為假正例數(shù),是實(shí)際類別為0,預(yù)測類別
baLgt?0?0.156?0.237?-0.379?-0.131?0.100?0.145?0.163??percentjc_gt_75?-0.137?0.315?0.132?-0.265?-0.112?-0.163??tot_HLcred_lim?0.286?0.167?0.284?-0.184?0.147?0.103??totaljjcjinit?0.342?-0.154?0.155?-0.123?-0.181?-0.177?-0.309?-0.147??圖4-3?Comp.卜Comp.?11的意義??對這11個主成分加上4.1.5中的5個虛擬變量gradel、grade2、homel、??home2、term進(jìn)行基于逐步回歸的邏輯回歸,模型并未進(jìn)一步剔除變量,且除??Comp.8外,其余變量均在1%的顯著性水平下顯著。回歸結(jié)果如圖4-4:??coefficients:??Estimate?std.?Error?z?value?Pr(>|z|)??(intercept)?-0.135534?0.048595?-2.789?0.00529?**??term?0.384042?0.033600?11.430?<?2e-16?***??homel?-0.145761?0.048639?-2.997?0.00273?**??home2?0.139721?0.045997?3.038?0.00238?**??gradel?-0.307728?0.044810?-6.867?6.54e-12?***??g「ade2?0.298434?0.037815?7.892?2.97e-15?***??Com
【參考文獻(xiàn)】:
期刊論文
[1]基于機(jī)器學(xué)習(xí)模型的P2P網(wǎng)貸平臺風(fēng)險(xiǎn)預(yù)警研究[J]. 嚴(yán)武,馮凌秉,蔣志慧,孔雯. 金融與經(jīng)濟(jì). 2019(09)
[2]基于偏最小二乘回歸的P2P網(wǎng)絡(luò)借貸平臺信用風(fēng)險(xiǎn)評估探究[J]. 陳為民,龍小凡,楊密,袁旭宏. 湖南人文科技學(xué)院學(xué)報(bào). 2019(05)
[3]P2P網(wǎng)絡(luò)借貸平臺信用風(fēng)險(xiǎn)識別研究[J]. 仝凌云,曹澤陽,安利平,梁強(qiáng)強(qiáng). 金融理論與實(shí)踐. 2019(10)
[4]互聯(lián)網(wǎng)金融P2P貸款違約風(fēng)險(xiǎn)評估、貸款期限和風(fēng)險(xiǎn)溢價(jià)[J]. 王浩名,馬樹才. 財(cái)經(jīng)論叢. 2019(07)
[5]基于機(jī)器學(xué)習(xí)的P2P違約預(yù)測算法比較——以“人人貸”為例[J]. 李汛,龍真,付懷宇,劉品璐. 統(tǒng)計(jì)與管理. 2019(06)
[6]基于多分類器動態(tài)集成的P2P違約風(fēng)險(xiǎn)評估[J]. 胡忠義,王超群,陳遠(yuǎn),吳江,鮑玉昆. 管理學(xué)報(bào). 2019(06)
[7]文本信息在P2P借貸平臺違約評價(jià)中的作用——基于Multinomial Lasso-logistic模型[J]. 宓超,劉佳佳. 數(shù)學(xué)的實(shí)踐與認(rèn)識. 2019(05)
[8]基于非均衡模糊近似支持向量機(jī)的P2P網(wǎng)貸借款人信用風(fēng)險(xiǎn)評估及應(yīng)用[J]. 張衛(wèi)國,盧媛媛,劉勇軍. 系統(tǒng)工程理論與實(shí)踐. 2018(10)
[9]基于SVM-Logistic組合模型的P2P借款者信用風(fēng)險(xiǎn)評估——以微貸網(wǎng)為例[J]. 都紅雯,盧孝偉. 生產(chǎn)力研究. 2018(10)
[10]基于LightGBM算法的P2P項(xiàng)目信用評級模型的設(shè)計(jì)及應(yīng)用[J]. 馬曉君,沙靖嵐,牛雪琪. 數(shù)量經(jīng)濟(jì)技術(shù)經(jīng)濟(jì)研究. 2018(05)
碩士論文
[1]基于多個分類模型的P2P借款人信貸風(fēng)險(xiǎn)評估研究[D]. 王敏佳.浙江工商大學(xué) 2018
[2]隨機(jī)森林在P2P網(wǎng)貸借款信用風(fēng)險(xiǎn)評估中的應(yīng)用[D]. 徐婷婷.山東大學(xué) 2017
本文編號:3023722
本文鏈接:http://sikaile.net/shoufeilunwen/xixikjs/3023722.html
最近更新
教材專著