期望損失代價(jià)敏感優(yōu)化的借貸預(yù)測(cè)算法研究
發(fā)布時(shí)間:2021-11-23 05:21
借貸數(shù)據(jù)規(guī)模大、維度復(fù)雜和極度不平衡等特性致使借貸預(yù)測(cè)的精度一直難以提升。為此,設(shè)計(jì)量化借貸期望損失值作為代價(jià)敏感項(xiàng)來(lái)優(yōu)化集成模型的借貸預(yù)測(cè)算法,實(shí)現(xiàn)消除比例失衡的訓(xùn)練樣本對(duì)預(yù)測(cè)模型的影響;提出基于代價(jià)敏感集成學(xué)習(xí)的借貸預(yù)測(cè)算法——ES-XGB和ES-LGB。其核心是改進(jìn)了近年來(lái)表現(xiàn)優(yōu)異的集成算法XGBoost和LightGBM,將優(yōu)化后損失項(xiàng)加入模型的迭代學(xué)習(xí)過(guò)程中,以達(dá)到提升整體預(yù)測(cè)精度和提高違約類檢出的目的。使用Lending Club平臺(tái)提供的數(shù)據(jù)來(lái)做數(shù)值實(shí)驗(yàn),證明所提出的算法模型在借貸預(yù)測(cè)中表現(xiàn)最佳。
【文章來(lái)源】:浙江工業(yè)大學(xué)學(xué)報(bào). 2020,48(04)北大核心
【文章頁(yè)數(shù)】:8 頁(yè)
【部分圖文】:
各年份不同狀態(tài)的借貸數(shù)量和比例
篩選出模型ES-LGB中貢獻(xiàn)率排名前20的特征值,繪制權(quán)重比圖,如圖2所示。特征所對(duì)應(yīng)的橫向直方圖越長(zhǎng)代表在模型中分類貢獻(xiàn)性越強(qiáng)。特征項(xiàng)2和特征項(xiàng)18為本研究根據(jù)借貸場(chǎng)景創(chuàng)建的特征,其中特征項(xiàng)2“月收入與月還款額比率”排名第二,說(shuō)明特征工程創(chuàng)建的特征項(xiàng)可以很好幫助劃分借貸人的類別。根據(jù)ES-LGB建模還可以學(xué)習(xí)到屬于“銀行賬戶信息”“信用記錄”的特征因素對(duì)借貸申請(qǐng)人的還款行為有較大影響,而屬于“個(gè)人信息”維度的特征項(xiàng)沒(méi)有進(jìn)入重要特征的前20位,對(duì)模型分類能力影響較弱。
【參考文獻(xiàn)】:
期刊論文
[1]基于Expectile回歸的均值-ES組合投資決策[J]. 許啟發(fā),丁曉涵,蔣翠俠. 中國(guó)管理科學(xué). 2018(10)
[2]基于LightGBM算法的P2P項(xiàng)目信用評(píng)級(jí)模型的設(shè)計(jì)及應(yīng)用[J]. 馬曉君,沙靖嵐,牛雪琪. 數(shù)量經(jīng)濟(jì)技術(shù)經(jīng)濟(jì)研究. 2018(05)
[3]結(jié)合背景差分與光流法的人群狀態(tài)突變檢測(cè)[J]. 高鵬輝,趙武峰,沈繼忠. 浙江大學(xué)學(xué)報(bào)(工學(xué)版). 2018(04)
[4]一種基于最小二乘估計(jì)的LTEMR電平信號(hào)定位方法[J]. 王衛(wèi)紅,琚波,楊潔,程宏兵. 浙江工業(yè)大學(xué)學(xué)報(bào). 2015(05)
[5]基于AHP和GIS的海塘工程安全評(píng)價(jià)研究[J]. 劉俊萍. 浙江工業(yè)大學(xué)學(xué)報(bào). 2014(04)
碩士論文
[1]基于數(shù)據(jù)挖掘的我國(guó)P2P網(wǎng)絡(luò)借貸違約預(yù)測(cè)模型研究[D]. 劉瑾雯.大連理工大學(xué) 2016
本文編號(hào):3513212
【文章來(lái)源】:浙江工業(yè)大學(xué)學(xué)報(bào). 2020,48(04)北大核心
【文章頁(yè)數(shù)】:8 頁(yè)
【部分圖文】:
各年份不同狀態(tài)的借貸數(shù)量和比例
篩選出模型ES-LGB中貢獻(xiàn)率排名前20的特征值,繪制權(quán)重比圖,如圖2所示。特征所對(duì)應(yīng)的橫向直方圖越長(zhǎng)代表在模型中分類貢獻(xiàn)性越強(qiáng)。特征項(xiàng)2和特征項(xiàng)18為本研究根據(jù)借貸場(chǎng)景創(chuàng)建的特征,其中特征項(xiàng)2“月收入與月還款額比率”排名第二,說(shuō)明特征工程創(chuàng)建的特征項(xiàng)可以很好幫助劃分借貸人的類別。根據(jù)ES-LGB建模還可以學(xué)習(xí)到屬于“銀行賬戶信息”“信用記錄”的特征因素對(duì)借貸申請(qǐng)人的還款行為有較大影響,而屬于“個(gè)人信息”維度的特征項(xiàng)沒(méi)有進(jìn)入重要特征的前20位,對(duì)模型分類能力影響較弱。
【參考文獻(xiàn)】:
期刊論文
[1]基于Expectile回歸的均值-ES組合投資決策[J]. 許啟發(fā),丁曉涵,蔣翠俠. 中國(guó)管理科學(xué). 2018(10)
[2]基于LightGBM算法的P2P項(xiàng)目信用評(píng)級(jí)模型的設(shè)計(jì)及應(yīng)用[J]. 馬曉君,沙靖嵐,牛雪琪. 數(shù)量經(jīng)濟(jì)技術(shù)經(jīng)濟(jì)研究. 2018(05)
[3]結(jié)合背景差分與光流法的人群狀態(tài)突變檢測(cè)[J]. 高鵬輝,趙武峰,沈繼忠. 浙江大學(xué)學(xué)報(bào)(工學(xué)版). 2018(04)
[4]一種基于最小二乘估計(jì)的LTEMR電平信號(hào)定位方法[J]. 王衛(wèi)紅,琚波,楊潔,程宏兵. 浙江工業(yè)大學(xué)學(xué)報(bào). 2015(05)
[5]基于AHP和GIS的海塘工程安全評(píng)價(jià)研究[J]. 劉俊萍. 浙江工業(yè)大學(xué)學(xué)報(bào). 2014(04)
碩士論文
[1]基于數(shù)據(jù)挖掘的我國(guó)P2P網(wǎng)絡(luò)借貸違約預(yù)測(cè)模型研究[D]. 劉瑾雯.大連理工大學(xué) 2016
本文編號(hào):3513212
本文鏈接:http://sikaile.net/jingjilunwen/hongguanjingjilunwen/3513212.html
最近更新
教材專著