基于數(shù)據(jù)挖掘技術(shù)的信用評(píng)分卡模型研究
發(fā)布時(shí)間:2021-10-05 00:18
近年來,隨著互聯(lián)網(wǎng)金融中的個(gè)人消費(fèi)信貸領(lǐng)域的飛快發(fā)展,如何根據(jù)客戶的特征行為數(shù)據(jù)對(duì)客戶的行為進(jìn)行分析,優(yōu)化客戶分類,更科學(xué)地為管理者提供數(shù)據(jù)支持,更有效地進(jìn)行風(fēng)險(xiǎn)管理,具有非常重要的現(xiàn)實(shí)意義。為了有效直觀地評(píng)估風(fēng)險(xiǎn),引入信用評(píng)分卡模型。本文主要通過如下五個(gè)部分來進(jìn)行分析:第一部分主要是介紹選題的研究背景及意義、國內(nèi)外研究概況,第二部分是對(duì)數(shù)據(jù)挖掘技術(shù)進(jìn)行了簡單的介紹,以及介紹評(píng)分卡的發(fā)展歷程及分類。第三部分主要是對(duì)數(shù)據(jù)進(jìn)行預(yù)處理,包括:缺失值處理、異常值處理、數(shù)據(jù)探索、特征處理、類不平衡處理。第四部分是構(gòu)建模型,本文選用了邏輯回歸、決策樹和支持向量機(jī)三種方法進(jìn)行建模,利用準(zhǔn)確率、召回率、F1值和AUC值對(duì)所建的模型進(jìn)行評(píng)估,從預(yù)測能力和解釋能力兩個(gè)方面綜合考慮,選擇用邏輯回歸方法建立信用評(píng)分卡模型。第五部分是對(duì)本文所做工作進(jìn)行總結(jié)與展望。結(jié)果表明,在所有原始特征中,關(guān)于歷史逾期行為的特征都用于最后的建模,說明歷史逾期行為對(duì)用戶是否違約具有顯著性的影響。在選擇模型時(shí),綜合整體評(píng)估,預(yù)測能力方面:決策樹的AUC值是最高的,達(dá)到0.8373,邏輯回歸也達(dá)到了0.8309,相差不大;解釋能力方...
【文章來源】:華中科技大學(xué)湖北省 211工程院校 985工程院校 教育部直屬院校
【文章頁數(shù)】:51 頁
【學(xué)位級(jí)別】:碩士
【部分圖文】:
age年齡箱形圖
12圖 3-2 percentage(可用額度比值)及 DebtRatio(負(fù)債率)箱形圖于 percentage(可用額度比值)及 DebtRatio(負(fù)債率)而言,這兩是百分比,因此刪除大于 1 的值。
圖 3-3 30-59、60-89、90-三個(gè)變量箱形圖三個(gè)變量都有離群值,查看各個(gè)特征離群值的數(shù)量,它們離群值的數(shù)量都比則把這些離群值都刪除。其他變量離群值不是很明顯,暫時(shí)不做處理。 數(shù)據(jù)探索單變量分析(年齡)變量
【參考文獻(xiàn)】:
期刊論文
[1]信用評(píng)分模型比較綜述——基于傳統(tǒng)方法與數(shù)據(jù)挖掘的對(duì)比[J]. 何珊,劉振東,馬小林. 征信. 2019(02)
[2]基于XGBOOST的用戶信用評(píng)分建模[J]. 韓修龍. 電腦知識(shí)與技術(shù). 2018(05)
[3]數(shù)據(jù)挖掘技術(shù)綜述[J]. 鄒祎. 信息通信. 2016(12)
[4]信用評(píng)分卡體系的發(fā)展及應(yīng)用[J]. 李延?xùn)|,鄭小娟. 青海金融. 2016(06)
[5]數(shù)據(jù)挖掘技術(shù)的綜述[J]. 王雅軒,頊聰. 電子技術(shù)與軟件工程. 2015(08)
[6]信用評(píng)分卡綜述[J]. 黎玉華. 黑龍江科技信息. 2010(17)
[7]基于GP+BP的信用評(píng)估模型研究[J]. 徐娟,胡學(xué)鋼. 合肥工業(yè)大學(xué)學(xué)報(bào)(自然科學(xué)版). 2010(04)
[8]個(gè)人信用卡信用風(fēng)險(xiǎn)評(píng)價(jià)體系與模型研究[J]. 遲國泰,許文,孫秀峰. 同濟(jì)大學(xué)學(xué)報(bào)(自然科學(xué)版). 2006(04)
[9]我國上市公司財(cái)務(wù)風(fēng)險(xiǎn)預(yù)警模型的構(gòu)建及實(shí)證分析[J]. 鄭茂. 金融論壇. 2003(10)
[10]組合預(yù)測在商業(yè)銀行信用風(fēng)險(xiǎn)評(píng)估中的應(yīng)用[J]. 王春峰,萬海暉,張維. 管理工程學(xué)報(bào). 1999(01)
碩士論文
[1]信用評(píng)分卡的建立與應(yīng)用[D]. 楊靜.天津商業(yè)大學(xué) 2018
[2]基于數(shù)據(jù)挖掘技術(shù)的信用評(píng)分卡模型[D]. 倪顯情.蘇州大學(xué) 2017
[3]基于證據(jù)權(quán)重邏輯回歸模型的P2P公司信用風(fēng)險(xiǎn)評(píng)估[D]. 王金珠.南京航空航天大學(xué) 2016
本文編號(hào):3418618
【文章來源】:華中科技大學(xué)湖北省 211工程院校 985工程院校 教育部直屬院校
【文章頁數(shù)】:51 頁
【學(xué)位級(jí)別】:碩士
【部分圖文】:
age年齡箱形圖
12圖 3-2 percentage(可用額度比值)及 DebtRatio(負(fù)債率)箱形圖于 percentage(可用額度比值)及 DebtRatio(負(fù)債率)而言,這兩是百分比,因此刪除大于 1 的值。
圖 3-3 30-59、60-89、90-三個(gè)變量箱形圖三個(gè)變量都有離群值,查看各個(gè)特征離群值的數(shù)量,它們離群值的數(shù)量都比則把這些離群值都刪除。其他變量離群值不是很明顯,暫時(shí)不做處理。 數(shù)據(jù)探索單變量分析(年齡)變量
【參考文獻(xiàn)】:
期刊論文
[1]信用評(píng)分模型比較綜述——基于傳統(tǒng)方法與數(shù)據(jù)挖掘的對(duì)比[J]. 何珊,劉振東,馬小林. 征信. 2019(02)
[2]基于XGBOOST的用戶信用評(píng)分建模[J]. 韓修龍. 電腦知識(shí)與技術(shù). 2018(05)
[3]數(shù)據(jù)挖掘技術(shù)綜述[J]. 鄒祎. 信息通信. 2016(12)
[4]信用評(píng)分卡體系的發(fā)展及應(yīng)用[J]. 李延?xùn)|,鄭小娟. 青海金融. 2016(06)
[5]數(shù)據(jù)挖掘技術(shù)的綜述[J]. 王雅軒,頊聰. 電子技術(shù)與軟件工程. 2015(08)
[6]信用評(píng)分卡綜述[J]. 黎玉華. 黑龍江科技信息. 2010(17)
[7]基于GP+BP的信用評(píng)估模型研究[J]. 徐娟,胡學(xué)鋼. 合肥工業(yè)大學(xué)學(xué)報(bào)(自然科學(xué)版). 2010(04)
[8]個(gè)人信用卡信用風(fēng)險(xiǎn)評(píng)價(jià)體系與模型研究[J]. 遲國泰,許文,孫秀峰. 同濟(jì)大學(xué)學(xué)報(bào)(自然科學(xué)版). 2006(04)
[9]我國上市公司財(cái)務(wù)風(fēng)險(xiǎn)預(yù)警模型的構(gòu)建及實(shí)證分析[J]. 鄭茂. 金融論壇. 2003(10)
[10]組合預(yù)測在商業(yè)銀行信用風(fēng)險(xiǎn)評(píng)估中的應(yīng)用[J]. 王春峰,萬海暉,張維. 管理工程學(xué)報(bào). 1999(01)
碩士論文
[1]信用評(píng)分卡的建立與應(yīng)用[D]. 楊靜.天津商業(yè)大學(xué) 2018
[2]基于數(shù)據(jù)挖掘技術(shù)的信用評(píng)分卡模型[D]. 倪顯情.蘇州大學(xué) 2017
[3]基于證據(jù)權(quán)重邏輯回歸模型的P2P公司信用風(fēng)險(xiǎn)評(píng)估[D]. 王金珠.南京航空航天大學(xué) 2016
本文編號(hào):3418618
本文鏈接:http://sikaile.net/jingjilunwen/huobiyinxinglunwen/3418618.html
最近更新
教材專著