基于樹集成模型的P2P網(wǎng)貸平臺借款人信用風險研究
發(fā)布時間:2020-03-24 14:30
【摘要】:P2P(Peer to Peer)即表示個人對個人.P2P網(wǎng)貸作為互聯(lián)金融的子業(yè),是個人與個人之間借助網(wǎng)貸平臺直接實現(xiàn)雙方借貸交易的業(yè)務模式.近年來,P2P網(wǎng)貸行業(yè)在國內外發(fā)展進行的十分火熱,各類模式的網(wǎng)貸平臺也隨之陸續(xù)出現(xiàn).尤其是在國內,根據(jù)網(wǎng)貸之家數(shù)據(jù)顯示,直至2018年年底,P2P網(wǎng)貸平臺已經累積達到6000家以上,但是網(wǎng)貸平臺同時也爆發(fā)出跑路、停業(yè)等惡劣現(xiàn)象,其中平臺借款人大量出現(xiàn)違約行為會嚴重影響P2P網(wǎng)貸行業(yè)的穩(wěn)定發(fā)展.因此本文對網(wǎng)貸平臺借款人信用風險進行重點研究,建立一個快速而有效的網(wǎng)貸平臺貸前審核借款人信用風險評估模型,從而促進P2P網(wǎng)貸行業(yè)未來的健康發(fā)展.本文首先介紹了三種樹的集成模型對網(wǎng)貸平臺借款人信用風險進行快速有效評估,分別是梯度提升決策樹(GBDT)模型、隨機森林(RF)模型和極端梯度提升(XGBOOST)模型,然后通過獲取人人貸平臺散標借款人網(wǎng)貸數(shù)據(jù),將預處理完后的數(shù)據(jù)隨機分為原始訓練集和原始測試集.由于借款人網(wǎng)貸數(shù)據(jù)存在不平衡現(xiàn)象,利用Borderline-SMOTE算法平衡化原始訓練集后,得到BLSMOTE訓練集.在各模型進行建模及預測前,選用5折交叉驗證法進行模型參數(shù)調優(yōu)取較優(yōu)值,分別在原始訓練集和BLSMOTE訓練集下各模型訓練預測得出相應的分類評價指標和運行時間.將各模型的分類評價指標和運行時間作對比,得出結論:在BLSMOTE訓練集下,XGBOOST模型和GBDT模型的分類性能有所提高,而RF模型的分類性能略微下降.在原始訓練集和BLSMOTE訓練集下,XGBOOST的分類性能均比GBDT模型和RF模型要好,其中分類評價指標中的ACC值和AUC值均比后兩者大,相應得到的ROC曲線也比后兩者要更往左上方(0,1)點處靠攏.XGBOOST模型預測得出FP和FPR(第一類誤分率,即將較差還款人誤分為較好還款人的比例)均比GBDT模型和RF模型要小.在運行時間上,XGBOOST模型消耗時間最短.因此,本文認為XGBOOST模型是一個快速而有效的網(wǎng)貸平臺貸前審核借款人信用風險評估模型,可以為平臺管理者提供有效評估和管理的參考價值.
【圖文】:
P2P網(wǎng)貸行業(yè)正常運營平臺數(shù)量
P2P網(wǎng)貸行業(yè)成交量
【學位授予單位】:廣州大學
【學位級別】:碩士
【學位授予年份】:2019
【分類號】:F832.4;F724.6
本文編號:2598459
【圖文】:
P2P網(wǎng)貸行業(yè)正常運營平臺數(shù)量
P2P網(wǎng)貸行業(yè)成交量
【學位授予單位】:廣州大學
【學位級別】:碩士
【學位授予年份】:2019
【分類號】:F832.4;F724.6
【參考文獻】
相關期刊論文 前5條
1 何劍;王小康;于淑利;;中國P2P網(wǎng)貸行業(yè)的風險評析——基于126家P2P網(wǎng)貸平臺的實證[J];嘉應學院學報;2015年06期
2 郭海鳳;陳霄;;P2P網(wǎng)貸平臺綜合競爭力評價研究[J];金融論壇;2015年02期
3 肖曼君;歐緣媛;李穎;;我國P2P網(wǎng)絡借貸信用風險影響因素研究——基于排序選擇模型的實證分析[J];財經理論與實踐;2015年01期
4 繆蓮英;陳金龍;;P2P網(wǎng)絡借貸中社會資本對借款者違約風險的影響——以Prosper為例[J];金融論壇;2014年03期
5 李悅雷;郭陽;張維;;中國P2P小額貸款市場借貸成功率影響因素分析[J];金融研究;2013年07期
,本文編號:2598459
本文鏈接:http://sikaile.net/jingjilunwen/guojimaoyilunwen/2598459.html