基于Stacking選擇性集成算法的個(gè)人信用風(fēng)險(xiǎn)評(píng)估研究
發(fā)布時(shí)間:2021-10-30 23:53
隨著我國(guó)信用經(jīng)濟(jì)的快速發(fā)展,信貸消費(fèi)、個(gè)人無(wú)抵押貸款等業(yè)務(wù)在各類金融機(jī)構(gòu)中所占的比例越來(lái)越大,信用消費(fèi)方式在我國(guó)經(jīng)濟(jì)和人們?nèi)粘I钪械膽?yīng)用也得到了極大的提高和擴(kuò)展。如何均衡消費(fèi)信貸業(yè)務(wù)的規(guī)模與個(gè)人信貸的違約比率,是目前學(xué)術(shù)界研究的主要技術(shù)性問(wèn)題之一,也是我國(guó)商業(yè)銀行等各類金融機(jī)構(gòu)在發(fā)展中有待解決的戰(zhàn)略性技術(shù)問(wèn)題。而這些技術(shù)性問(wèn)題歸根結(jié)底就是要如何解決金融機(jī)構(gòu)個(gè)人信貸的配給風(fēng)險(xiǎn)問(wèn)題。在個(gè)人信貸的配給中,最主要的技術(shù)性難題就是如何科學(xué)準(zhǔn)確的選擇個(gè)人貸款者,而個(gè)人信用風(fēng)險(xiǎn)評(píng)估恰好能解決這一問(wèn)題。通過(guò)對(duì)個(gè)人基本屬性、借貸相關(guān)等信息并利用機(jī)器學(xué)習(xí)方法進(jìn)行研究,來(lái)量化信用風(fēng)險(xiǎn),從而對(duì)解決個(gè)人信貸配給問(wèn)題具有重要的意義。本文首先選取了Kaggle競(jìng)賽平臺(tái)的信用違約預(yù)測(cè)(Give Me Some Credit)數(shù)據(jù),并對(duì)其數(shù)據(jù)進(jìn)行了大量的預(yù)處理和描述性分析。在本文第四章節(jié)中,預(yù)處理過(guò)程中依據(jù)缺失特征的分布情況選擇眾數(shù)填補(bǔ)了缺失值,并根據(jù)箱線圖法的判別結(jié)果剔除了特征中的極端異常值,還繪制了特征的相關(guān)系數(shù)熱力圖發(fā)現(xiàn)逾期筆數(shù)這三個(gè)特征之間存在共線性,通過(guò)保留重要特征,取另外兩個(gè)特征比值的方式消除了共線性的影...
【文章來(lái)源】:云南財(cái)經(jīng)大學(xué)云南省
【文章頁(yè)數(shù)】:70 頁(yè)
【學(xué)位級(jí)別】:碩士
【部分圖文】:
用戶月收入和家屬數(shù)量核密度曲線圖
第三章樣本數(shù)據(jù)的優(yōu)化研究11圖3.2特征相關(guān)系數(shù)熱力圖從上面的相關(guān)系數(shù)熱力圖中,我們可以看出逾期筆數(shù)這三個(gè)特征有很高的共線性,兩兩之間的相關(guān)系數(shù)均達(dá)到了0.9以上?紤]去除共線性,我們通過(guò)對(duì)比這三個(gè)特征和違約標(biāo)識(shí)(是否違約)的相關(guān)系數(shù),發(fā)現(xiàn)特征逾期30-59天的筆數(shù)和違約標(biāo)識(shí)之間的相關(guān)系為0.13,相對(duì)較高。因此,我們考慮保留特征逾期30-59天的筆數(shù),并取另外兩個(gè)逾期筆數(shù)特征的比值。再繪制去除共線性的逾期筆數(shù)特征相關(guān)系數(shù)熱力圖如下:圖3.3去除共線性的相關(guān)系數(shù)熱力圖
第三章樣本數(shù)據(jù)的優(yōu)化研究11圖3.2特征相關(guān)系數(shù)熱力圖從上面的相關(guān)系數(shù)熱力圖中,我們可以看出逾期筆數(shù)這三個(gè)特征有很高的共線性,兩兩之間的相關(guān)系數(shù)均達(dá)到了0.9以上?紤]去除共線性,我們通過(guò)對(duì)比這三個(gè)特征和違約標(biāo)識(shí)(是否違約)的相關(guān)系數(shù),發(fā)現(xiàn)特征逾期30-59天的筆數(shù)和違約標(biāo)識(shí)之間的相關(guān)系為0.13,相對(duì)較高。因此,我們考慮保留特征逾期30-59天的筆數(shù),并取另外兩個(gè)逾期筆數(shù)特征的比值。再繪制去除共線性的逾期筆數(shù)特征相關(guān)系數(shù)熱力圖如下:圖3.3去除共線性的相關(guān)系數(shù)熱力圖
【參考文獻(xiàn)】:
期刊論文
[1]基于IGSO-BP協(xié)同集成算法的社交網(wǎng)絡(luò)用戶信用評(píng)價(jià)方法研究[J]. 袁章帥,袁曉萌,徐孟帆. 科技經(jīng)濟(jì)導(dǎo)刊. 2019(06)
[2]個(gè)人信用評(píng)分模型比較數(shù)據(jù)挖掘分析[J]. 李卯. 時(shí)代金融. 2017(06)
[3]基于隨機(jī)森林融合樸素貝葉斯的信用評(píng)估模型[J]. 葉曉楓,魯亞會(huì). 數(shù)學(xué)的實(shí)踐與認(rèn)識(shí). 2017(02)
[4]基于信息增益和Bagging集成學(xué)習(xí)算法的個(gè)人信用評(píng)估模型研究[J]. 曹杰,邵笑笑. 數(shù)學(xué)的實(shí)踐與認(rèn)識(shí). 2016(08)
[5]從微觀角度研究信貸配給[J]. 王婷,江鈺媛. 中國(guó)集體經(jīng)濟(jì). 2015(36)
[6]基于優(yōu)化CBR的個(gè)人信用評(píng)分研究[J]. 姜明輝,許佩,韓旖桐,覃志. 中國(guó)軟科學(xué). 2014(12)
[7]數(shù)據(jù)挖掘模型在小企業(yè)主信用評(píng)分領(lǐng)域的應(yīng)用[J]. 王磊,范超,解明明. 統(tǒng)計(jì)研究. 2014(10)
[8]選擇性集成學(xué)習(xí)算法綜述[J]. 張春霞,張講社. 計(jì)算機(jī)學(xué)報(bào). 2011(08)
[9]美國(guó)個(gè)人信用評(píng)分體系研究及啟示[J]. 白云峰,畢強(qiáng). 現(xiàn)代管理科學(xué). 2010(12)
[10]商業(yè)銀行信用風(fēng)險(xiǎn)預(yù)警模型的實(shí)證研究[J]. 劉倩. 財(cái)經(jīng)理論與實(shí)踐. 2010(04)
博士論文
[1]基于選擇性集成算法的個(gè)人信用評(píng)分方法研究[D]. 陳昊潔.哈爾濱工業(yè)大學(xué) 2016
[2]信貸配給微觀機(jī)理研究[D]. 王征.遼寧大學(xué) 2011
[3]個(gè)人信用評(píng)分組合模型研究與應(yīng)用[D]. 向暉.湖南大學(xué) 2011
[4]信用評(píng)分理論與應(yīng)用研究[D]. 劉弢.湖南大學(xué) 2010
碩士論文
[1]數(shù)據(jù)分類算法性能的大規(guī)模實(shí)驗(yàn)對(duì)比分析[D]. 劉暢暢.河南大學(xué) 2016
[2]基于優(yōu)化的xgboost-LMT模型的供應(yīng)商信用評(píng)價(jià)研究[D]. 樊鵬.廣東工業(yè)大學(xué) 2016
[3]基于預(yù)警理論的商業(yè)銀行信貸風(fēng)險(xiǎn)管理評(píng)價(jià)體系研究[D]. 吳亞琴.浙江工業(yè)大學(xué) 2012
[4]投票式組合預(yù)測(cè)模型在個(gè)人信用評(píng)估中的應(yīng)用研究[D]. 王雪.哈爾濱工業(yè)大學(xué) 2011
[5]基于組合評(píng)估法的風(fēng)險(xiǎn)評(píng)估模型研究及其系統(tǒng)實(shí)現(xiàn)[D]. 但強(qiáng).電子科技大學(xué) 2009
本文編號(hào):3467654
【文章來(lái)源】:云南財(cái)經(jīng)大學(xué)云南省
【文章頁(yè)數(shù)】:70 頁(yè)
【學(xué)位級(jí)別】:碩士
【部分圖文】:
用戶月收入和家屬數(shù)量核密度曲線圖
第三章樣本數(shù)據(jù)的優(yōu)化研究11圖3.2特征相關(guān)系數(shù)熱力圖從上面的相關(guān)系數(shù)熱力圖中,我們可以看出逾期筆數(shù)這三個(gè)特征有很高的共線性,兩兩之間的相關(guān)系數(shù)均達(dá)到了0.9以上?紤]去除共線性,我們通過(guò)對(duì)比這三個(gè)特征和違約標(biāo)識(shí)(是否違約)的相關(guān)系數(shù),發(fā)現(xiàn)特征逾期30-59天的筆數(shù)和違約標(biāo)識(shí)之間的相關(guān)系為0.13,相對(duì)較高。因此,我們考慮保留特征逾期30-59天的筆數(shù),并取另外兩個(gè)逾期筆數(shù)特征的比值。再繪制去除共線性的逾期筆數(shù)特征相關(guān)系數(shù)熱力圖如下:圖3.3去除共線性的相關(guān)系數(shù)熱力圖
第三章樣本數(shù)據(jù)的優(yōu)化研究11圖3.2特征相關(guān)系數(shù)熱力圖從上面的相關(guān)系數(shù)熱力圖中,我們可以看出逾期筆數(shù)這三個(gè)特征有很高的共線性,兩兩之間的相關(guān)系數(shù)均達(dá)到了0.9以上?紤]去除共線性,我們通過(guò)對(duì)比這三個(gè)特征和違約標(biāo)識(shí)(是否違約)的相關(guān)系數(shù),發(fā)現(xiàn)特征逾期30-59天的筆數(shù)和違約標(biāo)識(shí)之間的相關(guān)系為0.13,相對(duì)較高。因此,我們考慮保留特征逾期30-59天的筆數(shù),并取另外兩個(gè)逾期筆數(shù)特征的比值。再繪制去除共線性的逾期筆數(shù)特征相關(guān)系數(shù)熱力圖如下:圖3.3去除共線性的相關(guān)系數(shù)熱力圖
【參考文獻(xiàn)】:
期刊論文
[1]基于IGSO-BP協(xié)同集成算法的社交網(wǎng)絡(luò)用戶信用評(píng)價(jià)方法研究[J]. 袁章帥,袁曉萌,徐孟帆. 科技經(jīng)濟(jì)導(dǎo)刊. 2019(06)
[2]個(gè)人信用評(píng)分模型比較數(shù)據(jù)挖掘分析[J]. 李卯. 時(shí)代金融. 2017(06)
[3]基于隨機(jī)森林融合樸素貝葉斯的信用評(píng)估模型[J]. 葉曉楓,魯亞會(huì). 數(shù)學(xué)的實(shí)踐與認(rèn)識(shí). 2017(02)
[4]基于信息增益和Bagging集成學(xué)習(xí)算法的個(gè)人信用評(píng)估模型研究[J]. 曹杰,邵笑笑. 數(shù)學(xué)的實(shí)踐與認(rèn)識(shí). 2016(08)
[5]從微觀角度研究信貸配給[J]. 王婷,江鈺媛. 中國(guó)集體經(jīng)濟(jì). 2015(36)
[6]基于優(yōu)化CBR的個(gè)人信用評(píng)分研究[J]. 姜明輝,許佩,韓旖桐,覃志. 中國(guó)軟科學(xué). 2014(12)
[7]數(shù)據(jù)挖掘模型在小企業(yè)主信用評(píng)分領(lǐng)域的應(yīng)用[J]. 王磊,范超,解明明. 統(tǒng)計(jì)研究. 2014(10)
[8]選擇性集成學(xué)習(xí)算法綜述[J]. 張春霞,張講社. 計(jì)算機(jī)學(xué)報(bào). 2011(08)
[9]美國(guó)個(gè)人信用評(píng)分體系研究及啟示[J]. 白云峰,畢強(qiáng). 現(xiàn)代管理科學(xué). 2010(12)
[10]商業(yè)銀行信用風(fēng)險(xiǎn)預(yù)警模型的實(shí)證研究[J]. 劉倩. 財(cái)經(jīng)理論與實(shí)踐. 2010(04)
博士論文
[1]基于選擇性集成算法的個(gè)人信用評(píng)分方法研究[D]. 陳昊潔.哈爾濱工業(yè)大學(xué) 2016
[2]信貸配給微觀機(jī)理研究[D]. 王征.遼寧大學(xué) 2011
[3]個(gè)人信用評(píng)分組合模型研究與應(yīng)用[D]. 向暉.湖南大學(xué) 2011
[4]信用評(píng)分理論與應(yīng)用研究[D]. 劉弢.湖南大學(xué) 2010
碩士論文
[1]數(shù)據(jù)分類算法性能的大規(guī)模實(shí)驗(yàn)對(duì)比分析[D]. 劉暢暢.河南大學(xué) 2016
[2]基于優(yōu)化的xgboost-LMT模型的供應(yīng)商信用評(píng)價(jià)研究[D]. 樊鵬.廣東工業(yè)大學(xué) 2016
[3]基于預(yù)警理論的商業(yè)銀行信貸風(fēng)險(xiǎn)管理評(píng)價(jià)體系研究[D]. 吳亞琴.浙江工業(yè)大學(xué) 2012
[4]投票式組合預(yù)測(cè)模型在個(gè)人信用評(píng)估中的應(yīng)用研究[D]. 王雪.哈爾濱工業(yè)大學(xué) 2011
[5]基于組合評(píng)估法的風(fēng)險(xiǎn)評(píng)估模型研究及其系統(tǒng)實(shí)現(xiàn)[D]. 但強(qiáng).電子科技大學(xué) 2009
本文編號(hào):3467654
本文鏈接:http://sikaile.net/shoufeilunwen/benkebiyelunwen/3467654.html
最近更新
教材專著