變量篩選后的個人信貸評分模型與統(tǒng)計(jì)學(xué)習(xí)
發(fā)布時間:2022-01-17 15:00
如何通過構(gòu)建可靠的信用評分模型來評估貸款申請人的信用風(fēng)險(xiǎn)在信貸風(fēng)險(xiǎn)管理行業(yè)中發(fā)揮著重要的作用,這也成為學(xué)術(shù)界和商業(yè)界的一項(xiàng)重要研究課題。本文通過先篩選數(shù)據(jù)變量,然后再建立模型的方法,探討了3種不同連接函數(shù)下廣義線性模型的分類問題,并且當(dāng)連接函數(shù)為logit (對應(yīng)logistic回歸模型)時,加入了自變量的交互項(xiàng)以優(yōu)化模型。以德國UCI數(shù)據(jù)集為例,采用AUC和KS指標(biāo)作為評價(jià)指標(biāo),與隨機(jī)森林、支持向量機(jī)和XGBoost模型等目前信貸評分中最常用的統(tǒng)計(jì)學(xué)習(xí)模型進(jìn)行了分析對比,結(jié)果表明:廣義線性模型中l(wèi)ogistic回歸模型和SVM預(yù)測效果尚佳;對于連接函數(shù)為logit的廣義線性模型,加入交互項(xiàng)后AUC和KS有所提高,表明交互項(xiàng)的加入優(yōu)化了模型。
【文章來源】:數(shù)理統(tǒng)計(jì)與管理. 2020,39(02)北大核心CSSCI
【文章頁數(shù)】:13 頁
【文章目錄】:
0 引言
0.1背景介紹
0.2研究現(xiàn)狀
1 特征處理與變量篩選指標(biāo)
1.1 虛擬變量設(shè)置
1.2 卡方距離
1.3 MV指數(shù)
2 模型與評價(jià)指標(biāo)
2.1 Logistic回歸(Logistic regression,簡寫LR)
2.2 隨機(jī)森林(Random forest,簡寫RF)
2.3 SVM
2.4 XGBoost
2.5 GLM
2.6 評價(jià)指標(biāo)
2.6.1 AUC
2.6.2 KS值
3 實(shí)證分析與比較
3.1 變量掃描與篩選
3.2 模型預(yù)測結(jié)果分析
3.2.1 RF預(yù)測結(jié)果分析
3.2.2 SVM預(yù)測結(jié)果分析
3.2.3 XGBoost預(yù)測結(jié)果分析
3.2.4 GLM預(yù)測結(jié)果分析
3.3 模型預(yù)測結(jié)果穩(wěn)定性分析
4 結(jié)論與展望
【參考文獻(xiàn)】:
期刊論文
[1]回歸模型中啞變量的相對重要性指數(shù)[J]. 李海超,王開軍,胡淼,陳黎飛. 計(jì)算機(jī)應(yīng)用. 2017(11)
[2]基于Ext-GBDT集成的類別不平衡信用評分模型[J]. 陳啟偉,王偉,馬迪,毛偉. 計(jì)算機(jī)應(yīng)用研究. 2018(02)
[3]關(guān)于促進(jìn)互聯(lián)網(wǎng)金融健康發(fā)展的指導(dǎo)意見[J]. 信息技術(shù)與信息化. 2015(06)
[4]基于隨機(jī)森林的個人信用評估模型研究及實(shí)證分析[J]. 蕭超武,蔡文學(xué),黃曉宇,陳康. 管理現(xiàn)代化. 2014(06)
[5]信用評分模型應(yīng)用比較研究——基于個體工商戶數(shù)據(jù)的檢驗(yàn)[J]. 晏艷陽,蔣恒波. 統(tǒng)計(jì)與信息論壇. 2010(05)
[6]信用評分主要模型方法比較研究[J]. 楊力,汪克亮,王建民. 經(jīng)濟(jì)管理. 2008(06)
[7]基于KMOD核函數(shù)的SVM方法在信用評分中的應(yīng)用[J]. 陳為民,馬超群,馮廣波. 經(jīng)濟(jì)數(shù)學(xué). 2008(01)
[8]我國商業(yè)銀行個人信用評分指標(biāo)體系分析[J]. 張麗娜,趙敏. 市場周刊(理論研究). 2007(08)
[9]多種個人信用評分模型在中國應(yīng)用的比較研究[J]. 石慶焱,靳云匯. 統(tǒng)計(jì)研究. 2004(06)
本文編號:3594938
【文章來源】:數(shù)理統(tǒng)計(jì)與管理. 2020,39(02)北大核心CSSCI
【文章頁數(shù)】:13 頁
【文章目錄】:
0 引言
0.1背景介紹
0.2研究現(xiàn)狀
1 特征處理與變量篩選指標(biāo)
1.1 虛擬變量設(shè)置
1.2 卡方距離
1.3 MV指數(shù)
2 模型與評價(jià)指標(biāo)
2.1 Logistic回歸(Logistic regression,簡寫LR)
2.2 隨機(jī)森林(Random forest,簡寫RF)
2.3 SVM
2.4 XGBoost
2.5 GLM
2.6 評價(jià)指標(biāo)
2.6.1 AUC
2.6.2 KS值
3 實(shí)證分析與比較
3.1 變量掃描與篩選
3.2 模型預(yù)測結(jié)果分析
3.2.1 RF預(yù)測結(jié)果分析
3.2.2 SVM預(yù)測結(jié)果分析
3.2.3 XGBoost預(yù)測結(jié)果分析
3.2.4 GLM預(yù)測結(jié)果分析
3.3 模型預(yù)測結(jié)果穩(wěn)定性分析
4 結(jié)論與展望
【參考文獻(xiàn)】:
期刊論文
[1]回歸模型中啞變量的相對重要性指數(shù)[J]. 李海超,王開軍,胡淼,陳黎飛. 計(jì)算機(jī)應(yīng)用. 2017(11)
[2]基于Ext-GBDT集成的類別不平衡信用評分模型[J]. 陳啟偉,王偉,馬迪,毛偉. 計(jì)算機(jī)應(yīng)用研究. 2018(02)
[3]關(guān)于促進(jìn)互聯(lián)網(wǎng)金融健康發(fā)展的指導(dǎo)意見[J]. 信息技術(shù)與信息化. 2015(06)
[4]基于隨機(jī)森林的個人信用評估模型研究及實(shí)證分析[J]. 蕭超武,蔡文學(xué),黃曉宇,陳康. 管理現(xiàn)代化. 2014(06)
[5]信用評分模型應(yīng)用比較研究——基于個體工商戶數(shù)據(jù)的檢驗(yàn)[J]. 晏艷陽,蔣恒波. 統(tǒng)計(jì)與信息論壇. 2010(05)
[6]信用評分主要模型方法比較研究[J]. 楊力,汪克亮,王建民. 經(jīng)濟(jì)管理. 2008(06)
[7]基于KMOD核函數(shù)的SVM方法在信用評分中的應(yīng)用[J]. 陳為民,馬超群,馮廣波. 經(jīng)濟(jì)數(shù)學(xué). 2008(01)
[8]我國商業(yè)銀行個人信用評分指標(biāo)體系分析[J]. 張麗娜,趙敏. 市場周刊(理論研究). 2007(08)
[9]多種個人信用評分模型在中國應(yīng)用的比較研究[J]. 石慶焱,靳云匯. 統(tǒng)計(jì)研究. 2004(06)
本文編號:3594938
本文鏈接:http://sikaile.net/jingjilunwen/jingjiguanlilunwen/3594938.html
最近更新
教材專著