天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

基于集成學(xué)習(xí)Stacking融合模型下個(gè)人信用風(fēng)險(xiǎn)的研究

發(fā)布時(shí)間:2023-12-28 19:42
  信用風(fēng)險(xiǎn)管理的科學(xué)化是現(xiàn)代風(fēng)險(xiǎn)管理重要特征,其核心問題之一就是風(fēng)險(xiǎn)特征識(shí)別。信用風(fēng)險(xiǎn)管理的困難之處就在于信用風(fēng)險(xiǎn)管理難于量化。傳統(tǒng)的信用風(fēng)險(xiǎn)管理手段多以定性分析為主,難以適應(yīng)市場(chǎng)發(fā)展的要求。中國(guó)人民銀行的征信系統(tǒng)借助于先進(jìn)的技術(shù)對(duì)個(gè)人的信用進(jìn)行了評(píng)估,但是由于其在數(shù)據(jù)挖掘等技術(shù)層面做的不夠完善,使得該系統(tǒng)并不是很成熟。本文通過實(shí)證對(duì)比驗(yàn)證,對(duì)現(xiàn)有的機(jī)器學(xué)習(xí)算法進(jìn)行了分析,并運(yùn)用集成學(xué)習(xí)對(duì)個(gè)人信用風(fēng)險(xiǎn)進(jìn)行了研究。集成學(xué)習(xí)指的是將若干基學(xué)習(xí)器進(jìn)行融合構(gòu)成一個(gè)性能更佳的強(qiáng)學(xué)習(xí)器,這樣的好處是即使個(gè)別的弱學(xué)習(xí)器得到的結(jié)果有偏差,其他的弱學(xué)習(xí)器也可以將偏差補(bǔ)回來。本文模型的構(gòu)建思路:首先,對(duì)信貸數(shù)據(jù)進(jìn)行預(yù)處理,包括構(gòu)建異常值及明顯錯(cuò)誤處理函數(shù)、去共線性函數(shù)、缺失值處理函數(shù)以及重采樣函數(shù)。通過對(duì)比相關(guān)性分析結(jié)合相關(guān)系數(shù)和最大信息系數(shù)以及各變量的IV值,經(jīng)過一系列的數(shù)據(jù)清洗后確定了7個(gè)對(duì)標(biāo)簽值有影響并且相關(guān)性不大的變量。然后,將數(shù)據(jù)預(yù)處理后的信貸數(shù)據(jù)分別用隨機(jī)森林(Random Forest)、分類型支持向量機(jī)(SVC)、XGBoost這三個(gè)基學(xué)習(xí)器進(jìn)行建模,并得到每個(gè)模型的性能評(píng)估值,由于這三個(gè)基...

【文章頁數(shù)】:51 頁

【學(xué)位級(jí)別】:碩士

【文章目錄】:
摘要
Abstract
1 緒論
    1.1 研究背景及意義
    1.2 國(guó)內(nèi)外研究現(xiàn)狀
        1.2.1 國(guó)外研究現(xiàn)狀
        1.2.2 國(guó)內(nèi)研究現(xiàn)狀
    1.3 本文研究?jī)?nèi)容與結(jié)構(gòu)安排
    1.4 本文創(chuàng)新點(diǎn)
        1.4.1 特征變量的選取
        1.4.2 基模型的選取
2 數(shù)據(jù)挖掘算法原理
    2.1 隨機(jī)森林算法
        2.1.1 決策樹
        2.1.2 隨機(jī)森林
    2.2 支持向量機(jī)算法
    2.3 XGBoost算法
    2.4 遺傳算法
        2.4.1 遺傳算法的原理
        2.4.2 遺傳算法的優(yōu)缺點(diǎn)
    2.5 邏輯回歸算法
        2.5.1 邏輯回歸算法原理
        2.5.2 邏輯回歸算法優(yōu)缺點(diǎn)
    2.6 Stacking集成學(xué)習(xí)算法
        2.6.1 Stacking算法原理
        2.6.2 Stacking算法優(yōu)缺點(diǎn)
3 數(shù)據(jù)預(yù)處理及描述性分析
    3.1 數(shù)據(jù)變量可視化
        3.1.1 數(shù)據(jù)變量含義
        3.1.2 查看數(shù)據(jù)分布情況
    3.2 數(shù)據(jù)預(yù)處理
    3.3 探索性分析
        3.3.1 數(shù)據(jù)重采樣
        3.3.2 客戶類別整體情況
        3.3.3 相關(guān)性分析
        3.3.4 WOE分箱技術(shù)
        3.3.5 利用IV值篩選變量
    3.4 模型性能評(píng)估方式及指標(biāo)
        3.4.1 混淆矩陣
        3.4.2 ROC曲線和AUC值
4 實(shí)證分析
    4.1 Random Forest構(gòu)建模型進(jìn)行實(shí)證分析
    4.2 SVC構(gòu)建模型進(jìn)行實(shí)證分析
    4.3 XGBoost構(gòu)建模型進(jìn)行實(shí)證分析
    4.4 GA-SVC構(gòu)建模型進(jìn)行實(shí)證分析
    4.5 GA-XGBoost構(gòu)建模型進(jìn)行實(shí)證分析
    4.6 Stacking集成學(xué)習(xí)構(gòu)建模型進(jìn)行實(shí)證分析
5 研究結(jié)論與總結(jié)
    5.1 全文總結(jié)
    5.2 不足與展望
參考文獻(xiàn)
攻讀學(xué)位期間的研究成果
致謝



本文編號(hào):3876064

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/jingjifazhanlunwen/3876064.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶3f2f4***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com