天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁 > 經(jīng)濟(jì)論文 > 銀行論文 >

個(gè)人征信數(shù)據(jù)不平衡結(jié)構(gòu)處理及特征選擇

發(fā)布時(shí)間:2020-06-19 14:25
【摘要】:本文數(shù)據(jù)來源為“東證期貨杯”全國(guó)大學(xué)生統(tǒng)計(jì)建模大賽中選題二提供的貸款機(jī)構(gòu)歷史業(yè)務(wù)數(shù)據(jù)~([1])。首先,針對(duì)數(shù)據(jù)缺失,對(duì)連續(xù)變量根據(jù)數(shù)據(jù)缺失率分別采用刪除法和多重填補(bǔ)法處理,名義變量采用特殊類別法處理;在信用數(shù)據(jù)不平衡問題上,結(jié)合K均值算法欠抽樣與SMOTE過抽樣組合抽樣方法在處理數(shù)據(jù)不平衡問題上有較好的預(yù)測(cè)效果。其次,在變量體系指標(biāo)選擇方面,改進(jìn)了logistic回歸的Lasso估計(jì),采用四種信用評(píng)分模型對(duì)變量選擇方法進(jìn)行比較:針對(duì)不同模型特點(diǎn),該變量選擇方法對(duì)預(yù)測(cè)結(jié)果有不同程度提升。最后,經(jīng)過實(shí)驗(yàn)比較可得,隨機(jī)森林分類精度高;logistic回歸總體分類精度略低于其他模型,但對(duì)于數(shù)據(jù)中少類樣本的識(shí)別要高于一般模型;決策樹模型分類精度略低于隨機(jī)森林,但對(duì)數(shù)據(jù)中少類樣本識(shí)別率不高。
【學(xué)位授予單位】:暨南大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2018
【分類號(hào)】:F832.4
【圖文】:

變量系數(shù),參數(shù)變化


圖 3.1 變量系數(shù)隨懲罰參數(shù)變化圖特殊 Lambda 值錯(cuò)誤分類率置信度圖 3.2 基于模型分類錯(cuò)誤率的 變化過程進(jìn)一步,為避免造成過擬合情況,通過交叉驗(yàn)證對(duì)模型擬合,此時(shí)關(guān)于懲罰參數(shù) 值選擇過程如圖 3.2 所示。圖 3.2 中,下橫坐標(biāo)為 log ,上橫坐標(biāo)為對(duì)應(yīng) 時(shí)的非零系數(shù)

過程圖,分類錯(cuò)誤,過程,自適應(yīng)


20圖 3.2 基于模型分類錯(cuò)誤率的 變化過程進(jìn)一步,為避免造成過擬合情況,通過交叉驗(yàn)證對(duì)模型擬合,此時(shí)關(guān)于懲罰參數(shù) 值選擇過程如圖 3.2 所示。圖 3.2 中,下橫坐標(biāo)為 log ,上橫坐標(biāo)為對(duì)應(yīng) 時(shí)的非零系數(shù)個(gè)數(shù),縱坐標(biāo)為模型分類錯(cuò)誤率。圖中兩條虛線分別代表了兩個(gè)特殊的 值,一個(gè)指在方差范圍內(nèi)得到最簡(jiǎn)單模型的 值,另一個(gè)指在所有 中得到最小目標(biāo)參量均值;谀P蛪嚎s變量考慮,模型選擇變量為 19 個(gè)。3.3logistic 回歸的 Lasso 估計(jì)方法改進(jìn)3.3.1 自適應(yīng) Lasso 估計(jì)由于在進(jìn)行高維數(shù)據(jù)分析時(shí) Lasso 傾向于篩選出較多的變量,即存在過度估計(jì)問題,Zou(2006)提出了自適應(yīng) Lasso(adaptive Lasso)方法,目的是在1l 懲罰下使用自適應(yīng)

【參考文獻(xiàn)】

相關(guān)期刊論文 前5條

1 宋麗平;張利坤;徐瑋;;P2P網(wǎng)絡(luò)借貸個(gè)人信用風(fēng)險(xiǎn)評(píng)估[J];財(cái)會(huì)月刊;2015年35期

2 張發(fā)明;;一種融合SOM與K-means算法的動(dòng)態(tài)信用評(píng)價(jià)方法及應(yīng)用[J];運(yùn)籌與管理;2014年06期

3 張秀秀;王慧;田雙雙;喬楠;閆麗娜;王彤;;高維數(shù)據(jù)回歸分析中基于LASSO的自變量選擇[J];中國(guó)衛(wèi)生統(tǒng)計(jì);2013年06期

4 劉揚(yáng);劉偉江;;特征選擇方法在信用評(píng)估指標(biāo)選取中的應(yīng)用[J];數(shù)理統(tǒng)計(jì)與管理;2006年06期

5 石慶焱;一個(gè)基于神經(jīng)網(wǎng)絡(luò)——Logistic回歸的混合兩階段個(gè)人信用評(píng)分模型研究[J];統(tǒng)計(jì)研究;2005年05期

相關(guān)博士學(xué)位論文 前4條

1 向暉;個(gè)人信用評(píng)分組合模型研究與應(yīng)用[D];湖南大學(xué);2011年

2 陳為民;基于支持向量機(jī)的信用卡信用風(fēng)險(xiǎn)管理模型與技術(shù)研究[D];湖南大學(xué);2009年

3 孫德山;支持向量機(jī)分類與回歸方法研究[D];中南大學(xué);2004年

4 吳濤;核函數(shù)的性質(zhì)、方法及其在障礙檢測(cè)中的應(yīng)用[D];中國(guó)人民解放軍國(guó)防科學(xué)技術(shù)大學(xué);2003年

相關(guān)碩士學(xué)位論文 前2條

1 樊鵬;基于優(yōu)化的xgboost-LMT模型的供應(yīng)商信用評(píng)價(jià)研究[D];廣東工業(yè)大學(xué);2016年

2 王冠;基于用戶互聯(lián)網(wǎng)行為數(shù)據(jù)的個(gè)人征信評(píng)估體系建設(shè)分析[D];北京交通大學(xué);2015年



本文編號(hào):2720912

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/jingjilunwen/huobiyinxinglunwen/2720912.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶2f0d3***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com
国产又粗又长又大的视频| 午夜日韩在线观看视频| av在线免费播放一区二区| 久久国产精品热爱视频| 99精品国产一区二区青青| 亚洲中文字幕三区四区| 国产亚洲不卡一区二区| 国产av精品一区二区| 中国日韩一级黄色大片| 风间中文字幕亚洲一区| 国产精品一区二区三区激情| 亚洲中文字幕亲近伦片| 国产精品一区二区日韩新区| 99香蕉精品视频国产版| 青草草在线视频免费视频| 精品偷拍一区二区三区| 蜜桃臀欧美日韩国产精品| 国产又粗又深又猛又爽又黄| 熟妇久久人妻中文字幕| 色婷婷视频在线精品免费观看| 亚洲永久一区二区三区在线| 91精品国产综合久久精品| 亚洲第一区欧美日韩在线| 亚洲天堂男人在线观看| 欧美激情一区二区亚洲专区| 中文字幕亚洲人妻在线视频| 亚洲中文字幕综合网在线| 欧美日韩综合免费视频| 欧美美女视频在线免费看| 国产欧美一区二区三区精品视 | 五月婷婷缴情七月丁香| 国产精品日韩欧美第一页| 欧美一级黄片欧美精品| 国产精品一区二区三区欧美| 中文精品人妻一区二区| 欧美午夜色视频国产精品| 黄色国产一区二区三区| 欧美性猛交内射老熟妇| 日韩精品一级片免费看| 国产欧美日本在线播放| 国产一级二级三级观看|