個(gè)人征信數(shù)據(jù)不平衡結(jié)構(gòu)處理及特征選擇
【學(xué)位授予單位】:暨南大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2018
【分類號(hào)】:F832.4
【圖文】:
圖 3.1 變量系數(shù)隨懲罰參數(shù)變化圖特殊 Lambda 值錯(cuò)誤分類率置信度圖 3.2 基于模型分類錯(cuò)誤率的 變化過程進(jìn)一步,為避免造成過擬合情況,通過交叉驗(yàn)證對(duì)模型擬合,此時(shí)關(guān)于懲罰參數(shù) 值選擇過程如圖 3.2 所示。圖 3.2 中,下橫坐標(biāo)為 log ,上橫坐標(biāo)為對(duì)應(yīng) 時(shí)的非零系數(shù)
20圖 3.2 基于模型分類錯(cuò)誤率的 變化過程進(jìn)一步,為避免造成過擬合情況,通過交叉驗(yàn)證對(duì)模型擬合,此時(shí)關(guān)于懲罰參數(shù) 值選擇過程如圖 3.2 所示。圖 3.2 中,下橫坐標(biāo)為 log ,上橫坐標(biāo)為對(duì)應(yīng) 時(shí)的非零系數(shù)個(gè)數(shù),縱坐標(biāo)為模型分類錯(cuò)誤率。圖中兩條虛線分別代表了兩個(gè)特殊的 值,一個(gè)指在方差范圍內(nèi)得到最簡(jiǎn)單模型的 值,另一個(gè)指在所有 中得到最小目標(biāo)參量均值;谀P蛪嚎s變量考慮,模型選擇變量為 19 個(gè)。3.3logistic 回歸的 Lasso 估計(jì)方法改進(jìn)3.3.1 自適應(yīng) Lasso 估計(jì)由于在進(jìn)行高維數(shù)據(jù)分析時(shí) Lasso 傾向于篩選出較多的變量,即存在過度估計(jì)問題,Zou(2006)提出了自適應(yīng) Lasso(adaptive Lasso)方法,目的是在1l 懲罰下使用自適應(yīng)
【參考文獻(xiàn)】
相關(guān)期刊論文 前5條
1 宋麗平;張利坤;徐瑋;;P2P網(wǎng)絡(luò)借貸個(gè)人信用風(fēng)險(xiǎn)評(píng)估[J];財(cái)會(huì)月刊;2015年35期
2 張發(fā)明;;一種融合SOM與K-means算法的動(dòng)態(tài)信用評(píng)價(jià)方法及應(yīng)用[J];運(yùn)籌與管理;2014年06期
3 張秀秀;王慧;田雙雙;喬楠;閆麗娜;王彤;;高維數(shù)據(jù)回歸分析中基于LASSO的自變量選擇[J];中國(guó)衛(wèi)生統(tǒng)計(jì);2013年06期
4 劉揚(yáng);劉偉江;;特征選擇方法在信用評(píng)估指標(biāo)選取中的應(yīng)用[J];數(shù)理統(tǒng)計(jì)與管理;2006年06期
5 石慶焱;一個(gè)基于神經(jīng)網(wǎng)絡(luò)——Logistic回歸的混合兩階段個(gè)人信用評(píng)分模型研究[J];統(tǒng)計(jì)研究;2005年05期
相關(guān)博士學(xué)位論文 前4條
1 向暉;個(gè)人信用評(píng)分組合模型研究與應(yīng)用[D];湖南大學(xué);2011年
2 陳為民;基于支持向量機(jī)的信用卡信用風(fēng)險(xiǎn)管理模型與技術(shù)研究[D];湖南大學(xué);2009年
3 孫德山;支持向量機(jī)分類與回歸方法研究[D];中南大學(xué);2004年
4 吳濤;核函數(shù)的性質(zhì)、方法及其在障礙檢測(cè)中的應(yīng)用[D];中國(guó)人民解放軍國(guó)防科學(xué)技術(shù)大學(xué);2003年
相關(guān)碩士學(xué)位論文 前2條
1 樊鵬;基于優(yōu)化的xgboost-LMT模型的供應(yīng)商信用評(píng)價(jià)研究[D];廣東工業(yè)大學(xué);2016年
2 王冠;基于用戶互聯(lián)網(wǎng)行為數(shù)據(jù)的個(gè)人征信評(píng)估體系建設(shè)分析[D];北京交通大學(xué);2015年
本文編號(hào):2720912
本文鏈接:http://sikaile.net/jingjilunwen/huobiyinxinglunwen/2720912.html