基于自適應(yīng)LASSO變量選擇的Logistic信用評分模型研究
[Abstract]:In this paper, the problem of variable selection in credit scoring model is mainly studied. Variable selection is not only a problem to be considered in the modeling process, but also one of the most important problems in statistical research. In modeling, it is necessary not only to ensure that the selected set of variables can reflect the characteristics of the object to be studied, but also to ensure that the obtained results have good fitting and predictability. The main work of this paper is as follows: firstly, the methods of variable selection, subset selection and coefficient compression are introduced systematically. Subset selection includes AIC and stepwise regression, coefficient compression includes ridge regression and adaptive LASSO.. This paper analyzes the development of credit scoring model, the key role of variable selection in the establishment of credit scoring model, and the current research situation at home and abroad. Secondly, the adaptive LASSO variable selection and parameter estimation of Logistic model are studied. The key is to consider the information value of the variable as the weight of the penalty term of adaptive LASSO, and to prove that the parameter estimator has Oracle property. Based on this, the Logistic credit scoring model based on information weight is constructed. Thirdly, through the empirical analysis, this paper establishes the Logistic credit scoring model by selecting the adaptive LASSO variables with the weight of information value as punishment item, mainly through 148 SMEs and 30 credit index system variables of Shenzhen Stock Exchange. Using the ratio of occurrence to explain the meaning of the estimator and to test the economic significance of the selected variables, it can be seen that the variables contained in the model basically cover the various capability indicators of the enterprise. Finally, by comparing the logistic credit rating model established by stepwise regression method and LASSO variable selection method, using ROC curve KS value and CIER index to compare and verify the risk differentiation ability and estimation accuracy of the three models. The Logistic model established by adaptive LASSO is better than that obtained by the other two methods. It also shows that the adaptive LASSO variable selection method with information value has a good performance in the empirical test.
【學(xué)位授予單位】:東南大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2016
【分類號】:F832.4
【相似文獻(xiàn)】
相關(guān)期刊論文 前10條
1 高仁祥,張世英,劉豹;基于神經(jīng)網(wǎng)絡(luò)的變量選擇方法[J];系統(tǒng)工程學(xué)報;1998年02期
2 楊璐,高自友;用神經(jīng)網(wǎng)絡(luò)進(jìn)行變量選擇[J];北方交通大學(xué)學(xué)報;1999年03期
3 趙進(jìn)文;模型構(gòu)建中變量選擇的影響分析[J];東北財經(jīng)大學(xué)學(xué)報;2002年06期
4 李揚;朱建鋒;謝邦昌;;變量選擇方法及其在健康食品市場研究中的應(yīng)用探究[J];統(tǒng)計與信息論壇;2013年10期
5 周偉,王建軍,李繼銳;基于人工神經(jīng)網(wǎng)絡(luò)的影響高速公路社會效益量化的變量選擇方法[J];西安公路交通大學(xué)學(xué)報;2000年03期
6 齊曉麗;梁慧超;馮彥妍;;回歸模型構(gòu)建中變量選擇的研究[J];河北工業(yè)大學(xué)學(xué)報;2009年06期
7 鄧金蘭;王彬寰;樊仕利;;變系數(shù)模型的變量選擇及在股票數(shù)據(jù)中的應(yīng)用[J];四川大學(xué)學(xué)報(自然科學(xué)版);2009年06期
8 胡心瀚;葉五一;繆柏其;;上市公司信用風(fēng)險分析模型中的變量選擇[J];數(shù)理統(tǒng)計與管理;2012年06期
9 楊金英;;變系數(shù)模型的快速變量選擇方法[J];統(tǒng)計與決策;2012年05期
10 汪建均;馬義中;;結(jié)合GLM與因子效應(yīng)原則的貝葉斯變量選擇方法[J];系統(tǒng)工程理論與實踐;2013年08期
相關(guān)會議論文 前6條
1 張俊華;方偉武;;調(diào)查表分析中變量選擇的一些方法(英文)[A];中國運籌學(xué)會第六屆學(xué)術(shù)交流會論文集(下卷)[C];2000年
2 李洪東;梁逸曾;;高維數(shù)據(jù)變量選擇新方法研究[A];中國化學(xué)會第27屆學(xué)術(shù)年會第15分會場摘要集[C];2010年
3 李慷;席裕庚;;復(fù)雜過程系統(tǒng)中操作變量選擇與定位的方法研究[A];1993年控制理論及其應(yīng)用年會論文集[C];1993年
4 云永歡;王為婷;梁逸曾;;迭代的保留有信息變量來篩選最佳變量子集的一種多元校正變量選擇方法[A];中國化學(xué)會第29屆學(xué)術(shù)年會摘要集——第19分會:化學(xué)信息學(xué)與化學(xué)計量學(xué)[C];2014年
5 徐登;范偉;梁逸曾;;紫外光譜結(jié)合變量選擇和偏最小二乘回歸同時測定水中重金屬鎘、鋅、鈷[A];中國化學(xué)會第29屆學(xué)術(shù)年會摘要集——第19分會:化學(xué)信息學(xué)與化學(xué)計量學(xué)[C];2014年
6 梁逸曾;李洪東;許青松;曹東升;張志敏;;灰色化學(xué)建模與模型集群分析——兼論過擬合、穩(wěn)健估計、變量選擇與模型評價[A];中國化學(xué)會第27屆學(xué)術(shù)年會第15分會場摘要集[C];2010年
相關(guān)博士學(xué)位論文 前10條
1 呂晶;幾類半?yún)?shù)回歸模型的穩(wěn)健估計與變量選擇[D];重慶大學(xué);2015年
2 王康寧;幾類高維復(fù)雜數(shù)據(jù)半?yún)?shù)模型的結(jié)構(gòu)識別、變量選擇及穩(wěn)健估計[D];山東大學(xué);2016年
3 王大榮;分散度量模型中的變量選擇[D];北京工業(yè)大學(xué);2009年
4 王明秋;高維數(shù)據(jù)下若干回歸模型的變量選擇問題研究[D];大連理工大學(xué);2012年
5 劉吉彩;生存數(shù)據(jù)統(tǒng)計模型的變量選擇方法[D];華東師范大學(xué);2014年
6 樊亞莉;穩(wěn)健變量選擇方法的若干問題研究[D];復(fù)旦大學(xué);2013年
7 唐凱臨;變量選擇和變換的新方法研究[D];同濟大學(xué);2008年
8 董瑩;高維共線性統(tǒng)計模型的參數(shù)估計與變量選擇[D];大連理工大學(xué);2014年
9 葉飛;相對誤差準(zhǔn)則下的估計理論和變量選擇方法的研究[D];清華大學(xué);2013年
10 袁晶;貝葉斯方法在變量選擇問題中的應(yīng)用[D];山東大學(xué);2013年
相關(guān)碩士學(xué)位論文 前10條
1 潘玉婷;含多元非線性結(jié)構(gòu)的高維Logistic模型的同時變量選擇及半?yún)?shù)估計[D];中國科學(xué)技術(shù)大學(xué);2016年
2 劉丹;Cox模型及變系數(shù)Cox模型中的變量選擇問題研究[D];暨南大學(xué);2016年
3 羅昊;基于自適應(yīng)LASSO變量選擇的Logistic信用評分模型研究[D];東南大學(xué);2016年
4 王雙寶;基于變量選擇偏差的變量選擇過程[D];電子科技大學(xué);2016年
5 溫征;縱向和生存數(shù)據(jù)聯(lián)合模型的一個變量選擇問題[D];云南師范大學(xué);2016年
6 閆闖;多元回歸模型中變量選擇問題研究[D];黑龍江大學(xué);2011年
7 康贊亮;計量經(jīng)濟學(xué)模型變量選擇與設(shè)定的理論方法研究[D];清華大學(xué);2009年
8 張丹;乘積模型的變量選擇[D];河南大學(xué);2014年
9 郝亞楠;基于L_2-Fused Lasso變量選擇方法的性質(zhì)及應(yīng)用研究[D];北京交通大學(xué);2014年
10 滿敬鑾;生存數(shù)據(jù)模型的變量選擇[D];中南大學(xué);2009年
,本文編號:2232123
本文鏈接:http://sikaile.net/jingjilunwen/huobiyinxinglunwen/2232123.html