天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

基于機(jī)器學(xué)習(xí)的P2P個(gè)人網(wǎng)貸信用評估方法研究

發(fā)布時(shí)間:2022-12-11 00:40
  本文采用某信貸公司的真實(shí)數(shù)據(jù),該數(shù)據(jù)一共有31個(gè)變量,其中客戶類型是因變量,其余變量是自變量,對該數(shù)據(jù)建立了Logistic回歸模型、隨機(jī)森林模型、支持向量機(jī)模型,分析對比了這三個(gè)模型識別壞客戶的能力,并基于Logistic回歸模型對SMOTE算法進(jìn)行了改進(jìn),最后通過10折交叉驗(yàn)證的方法對模型進(jìn)行驗(yàn)證。由于本文采用的數(shù)據(jù)中好客戶有6664個(gè),壞客戶有330個(gè),數(shù)據(jù)是不平衡數(shù)據(jù),因此本文引入專門處理不平衡數(shù)據(jù)的算法——SMOTE算法,對原始數(shù)據(jù)中的少數(shù)類樣本(壞客戶)進(jìn)行欠采樣,多數(shù)類樣本(好客戶)進(jìn)行過采樣得到新數(shù)據(jù),在原始數(shù)據(jù)集和新數(shù)據(jù)集兩個(gè)數(shù)據(jù)集上分別分析對比上述三個(gè)模型的識別壞客戶的能力。10折交叉驗(yàn)證的結(jié)果表明:(1)在原始數(shù)據(jù)集上,隨機(jī)森林模型的誤差率最小為0.042,隨機(jī)森林和支持向量機(jī)的真負(fù)率最大,都達(dá)到了1.000,Logistic回歸的真正率最大為0.56,這表明在識別壞客戶方面,Logistic回歸比其他兩個(gè)模型有更好的識別能力;(2)在新數(shù)據(jù)集上,隨機(jī)森林在誤差率、真正率、真負(fù)率這三個(gè)指標(biāo)上都達(dá)到最優(yōu),分別是0.057、0.870、0.987。這表明經(jīng)過SMOTE... 

【文章頁數(shù)】:48 頁

【學(xué)位級別】:碩士

【文章目錄】:
中文摘要
英文摘要
1 緒論
    1.1 課題意義
    1.2 國內(nèi)外研究現(xiàn)狀
        1.2.1 國外研究綜述
        1.2.2 國內(nèi)研究綜述
2 數(shù)據(jù)處理
    2.1 數(shù)據(jù)說明與探索
    2.2 缺失值處理
    2.3 異常值處理
    2.4 數(shù)據(jù)規(guī)范化處理
    2.5 不平衡數(shù)據(jù)的處理
        2.5.1 SMOTE算法簡介
        2.5.2 SMOTE算法的實(shí)施
3 基于機(jī)器學(xué)習(xí)的信用評估模型的建立
    3.1 模型的評價(jià)標(biāo)準(zhǔn)——AUC值
    3.2 構(gòu)建Logistic回歸模型
        3.2.1 Logistic回歸模型簡介
        3.2.2 基于IV值的變量選擇
        3.2.3 Logistic回歸模型的建立
    3.3 構(gòu)建隨機(jī)森林模型
        3.3.1 隨機(jī)森林模型簡介
        3.3.2 隨機(jī)森林模型的建立
    3.4 構(gòu)建支持向量機(jī)模型
        3.4.1 支持向量機(jī)原理簡介
        3.4.2 支持向量機(jī)模型的建立
4 模型的驗(yàn)證
    4.1 k折交叉驗(yàn)證簡介
    4.2 驗(yàn)證結(jié)果對比分析與小結(jié)
5 基于Logistic回歸模型的SMOTE算法的改進(jìn)
    5.1 SMOTE算法的不足
    5.2 改進(jìn)思路
    5.3 改進(jìn)實(shí)施
    5.4 交叉驗(yàn)證
6 總結(jié)
致謝
參考文獻(xiàn)


【參考文獻(xiàn)】:
期刊論文
[1]基于互聯(lián)網(wǎng)行為信息的P2P個(gè)人信用評價(jià)模型[J]. 鄧逸,徐曉敏.  北京信息科技大學(xué)學(xué)報(bào)(自然科學(xué)版). 2017(02)
[2]大數(shù)據(jù)背景下網(wǎng)絡(luò)借貸的信用風(fēng)險(xiǎn)評估——以人人貸為例[J]. 柳向東,李鳳.  統(tǒng)計(jì)與信息論壇. 2016(05)
[3]P2P網(wǎng)貸個(gè)人信用評估國內(nèi)外研究綜述[J]. 葉菁菁,吳斌,董敏.  商業(yè)經(jīng)濟(jì)研究. 2015(31)
[4]互聯(lián)網(wǎng)金融數(shù)據(jù)抓取方法研究[J]. 蘭秋軍.  計(jì)算機(jī)工程與設(shè)計(jì). 2011(05)
[5]我國個(gè)人信用評估體系研究綜述[J]. 秦麗麗,楊曉紅,劉昕晰,謝巧燕.  區(qū)域金融研究. 2010(06)
[6]個(gè)人信用卡信用風(fēng)險(xiǎn)評價(jià)體系與模型研究[J]. 遲國泰,許文,孫秀峰.  同濟(jì)大學(xué)學(xué)報(bào)(自然科學(xué)版). 2006(04)
[7]多種個(gè)人信用評分模型在中國應(yīng)用的比較研究[J]. 石慶焱,靳云匯.  統(tǒng)計(jì)研究. 2004(06)



本文編號:3717819

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/jingjilunwen/guojimaoyilunwen/3717819.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶fba13***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請E-mail郵箱bigeng88@qq.com