天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

集成變量選擇在個人信用評分中的應用研究

發(fā)布時間:2020-10-27 16:48
   信貸決策是消費金融機構(gòu)里面一項既基礎又復雜的任務。信用評分是完成這一任務的重要工具。信用評分通過分析大量的歷史數(shù)據(jù)來幫助信貸專家評價客戶的違約風險。信用評分的數(shù)據(jù)庫中通常包含大量的冗余和無關(guān)變量,使用所有這些變量來建立信用評分模型不僅耗時而且會引起“維度的詛咒”。這些問題可以通過變量選擇來解決。信貸專家主要依靠變量選擇方法來提升模型的預測能力,對于變量選擇方法的結(jié)果的穩(wěn)定性缺乏足夠的重視。變量選擇方法的不穩(wěn)定指的是數(shù)據(jù)一個小的擾動也會導致大的偏差。變量選擇的不穩(wěn)定會使得篩選出來的風險指標不可靠,從而造成大的經(jīng)濟損失。因此一個穩(wěn)定的變量選擇方法對于正確評估風險具有重要意義。集成學習通過組合多個弱分類器得到一個強分類器解決了模型預測的不穩(wěn)定性問題,借鑒集成學習的這一思想,通過對多個變量選擇方法的結(jié)果進行集成,能夠有效解決穩(wěn)定性問題。文章首先對變量選擇不穩(wěn)定的原因進行了解釋,然后.對集成變量選擇這一方法的理論框架和要素進行了詳盡地介紹,但是現(xiàn)有的集成變量選擇方法主要是同一類型變量選擇方法的集成,而同一類型的變量選擇方法有相同的缺點,基于此文章設計了一種新的基于兩種類型變量選擇方法的集成變量選擇方法,其中過濾式方法中選擇了皮爾森相關(guān)系數(shù),spearman相關(guān)系數(shù)和中值變量選擇;嵌入式方法中選擇了邏輯斯蒂回歸和基于隨機森林的四種變量選擇方法,通過把它運用在一個互聯(lián)網(wǎng)金融公司的信用數(shù)據(jù)集上,在穩(wěn)定性上方差接近于0且相似性值接近于1,這說明集成變量選擇能夠顯著提高穩(wěn)定性;在預測結(jié)果上,通過把集成變量選擇的結(jié)果帶入邏輯斯蒂回歸中,發(fā)現(xiàn)它優(yōu)于基于全變量邏輯斯蒂回歸和彈性網(wǎng)懲罰的邏輯斯蒂回歸,證明了提高變量選擇的穩(wěn)定性并沒有犧牲模型的預測能力,同時基于預測結(jié)果的置換檢驗是顯著的,證明基于集成變量選擇的預測具有魯棒性。
【學位單位】:天津財經(jīng)大學
【學位級別】:碩士
【學位年份】:2018
【中圖分類】:F832.4
【文章目錄】:
內(nèi)容摘要
Abstract
第1章 導論
    1.1 研究背景和研究意義
    1.2 國內(nèi)外現(xiàn)狀
        1.2.1 信用評分現(xiàn)狀
        1.2.2 變量選擇在信用評分中的應用
    1.3 論文結(jié)構(gòu)和創(chuàng)新
        1.3.1 論文結(jié)構(gòu)
        1.3.2 創(chuàng)新和不足之處
第2章 個人信用評分
    2.1 個人信用評分的商業(yè)背景
    2.2 個人信用評分的類型
    2.3 個人信用評分的原理
    2.4 信貸數(shù)據(jù)的特點
第3章 變量選擇方法及其穩(wěn)定性
    3.1 變量選擇的目的
    3.2 變量選擇的基本分類
        3.2.1 過濾式類型
        3.2.2 包裹式類型
        3.2.3 嵌入式類型
    3.3 變量選擇不穩(wěn)定的來源及其度量
        3.3.1 變量選擇不穩(wěn)定的來源
        3.3.2 變量選擇穩(wěn)定性的度量
第4章 集成變量選擇
    4.1 集成變量選擇的基本模式
        4.1.1 同質(zhì)并行集成變量選擇
        4.1.2 異質(zhì)并行集成變量選擇
        4.1.3 混合的集成變量選擇
    4.2 集成變量選擇的基本要素
        4.2.1 變量集的集成
        4.2.2 穩(wěn)定性評價
        4.2.3 穩(wěn)定性和預測性的權(quán)衡
    4.3 新的模式—基于兩種類型變量選擇方法的集成
        4.3.1 選擇的過濾式和嵌入式變量選擇方法
        4.3.2 變量選擇結(jié)果的集成
        4.3.3 穩(wěn)定性評價
        4.3.4 預測能力評價
第5章 集成變量選擇在個人信用評分中的應用
    5.1 數(shù)據(jù)介紹和預處理
    5.2 集成變量選擇
    5.3 穩(wěn)定性評價
    5.4 預測能力評價
    5.5 小結(jié)
第6章 結(jié)論和展望
    6.1 結(jié)論
    6.2 展望
附錄
參考文獻
后記

【相似文獻】

相關(guān)期刊論文 前10條

1 牟建波;劉赪;;基于懲罰方法的貝葉斯群組變量選擇[J];綿陽師范學院學報;2017年02期

2 戴伯新;;回歸變量選擇中的數(shù)據(jù)診斷[J];應用概率統(tǒng)計;1992年04期

3 王銀輝;徐文科;;基于風險函數(shù)評價自變量選擇對預測的影響[J];哈爾濱師范大學自然科學學報;2012年01期

4 張春霞;李俊麗;;變量選擇集成方法[J];工程數(shù)學學報;2019年01期

5 李太福;易軍;蘇盈盈;胡文金;余春嬌;;基于特征子空間虛假鄰點判別的軟傳感器模型變量選擇[J];機械工程學報;2011年12期

6 張慶;李云霞;;函數(shù)型變量選擇法用于空氣質(zhì)量影響因素實證分析[J];安慶師范大學學報(自然科學版);2017年04期

7 李揚;許文甫;馬雙鴿;;污染數(shù)據(jù)的穩(wěn)健稀疏成組變量選擇方法研究[J];統(tǒng)計與信息論壇;2018年06期

8 徐安察;王瑋明;;應用統(tǒng)計類專業(yè)探究性教學模式探索與實踐——以變量選擇準則為例[J];赤峰學院學報(自然科學版);2014年19期

9 楊紅;陳德棉;;個人住房抵押貸款違約相關(guān)變量選擇[J];現(xiàn)代管理科學;2009年04期

10 鐘先樂;樊亞莉;張?zhí)教?;基于t函數(shù)的穩(wěn)健變量選擇方法[J];上海理工大學學報;2017年06期


相關(guān)博士學位論文 前10條

1 初一;若干模型下的變量選擇和特征篩選[D];山東大學;2018年

2 王延新;高維模型的變量選擇與稀疏正則化[D];武漢大學;2013年

3 李子林;高維基因數(shù)據(jù)中的統(tǒng)計方法[D];清華大學;2016年

4 唐凱臨;變量選擇和變換的新方法研究[D];同濟大學;2008年

5 秦志敏;我國上市公司財務預警變量選擇研究[D];東北財經(jīng)大學;2012年

6 袁晶;貝葉斯方法在變量選擇問題中的應用[D];山東大學;2013年

7 姬永剛;分位數(shù)回歸中的貝葉斯變量選擇[D];東北師范大學;2012年

8 趙軍;Expectile回歸和最優(yōu)資產(chǎn)組合中的變量選擇問題[D];浙江大學;2017年

9 蘇盈盈;基于核方法的非線性系統(tǒng)變量選擇及其應用[D];重慶大學;2014年

10 王歆旸;幾類整值時間序列模型的擬似然推斷和變量選擇問題[D];吉林大學;2017年


相關(guān)碩士學位論文 前10條

1 楊小輝;集成變量選擇在個人信用評分中的應用研究[D];天津財經(jīng)大學;2018年

2 何琪琪;帶測量誤差的可加模型的變量選擇[D];廈門大學;2018年

3 胡蓉;基于隨機Lasso的Meta分析[D];北京建筑大學;2019年

4 楊陽;SGL-SVM方法及其應用研究[D];廈門大學;2017年

5 武杰;Logistic回歸中的隨機Lasso方法[D];北京建筑大學;2018年

6 耿瑩;Random Lasso在Logistic模型中的應用研究[D];暨南大學;2018年

7 郝寬;Lasso及其改進方法在變量選擇中的優(yōu)劣性研究[D];哈爾濱工業(yè)大學;2018年

8 褚福常;基于互信息變量選擇的熱工過程數(shù)據(jù)建模[D];華北電力大學;2018年

9 曾翠英;高維數(shù)據(jù)下變量選擇問題的研究[D];長沙理工大學;2017年

10 宋雨宸;基于模型集群分析的近紅外光譜變量選擇方法研究[D];長春理工大學;2018年



本文編號:2858784

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/jingjilunwen/huobiyinxinglunwen/2858784.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶8484a***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com