天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

基于自適應(yīng)LASSO變量選擇的Logistic信用評(píng)分模型研究

發(fā)布時(shí)間:2018-09-09 10:28
【摘要】:本文主要研究的是信用評(píng)分模型中的變量選擇問題,變量選擇不僅是建模過程中需要考慮的問題,也是統(tǒng)計(jì)學(xué)研究中很重要的問題之一。在建模中不僅要確保選擇的變量集合能反映所要研究的對(duì)象特性,還要保證得到的結(jié)果具有較好的擬合性和預(yù)測(cè)性。本文主要工作如下:一系統(tǒng)介紹了變量選擇的方法:子集選擇法和系數(shù)壓縮法。子集選擇法包括AIC值、BIC值和逐步回歸法,系數(shù)壓縮法包括嶺回歸、LASSO以及自適應(yīng)LASSO.分析了信用評(píng)分模型的發(fā)展,變量選擇在信用評(píng)分模型建立中的關(guān)鍵作用,以及國(guó)內(nèi)外研究現(xiàn)狀。二研究了Logistic模型的自適應(yīng)LASSO變量選擇和參數(shù)估計(jì),核心是討論將變量的信息價(jià)值作為自適應(yīng)LASSO的懲罰項(xiàng)權(quán)重,以及證明其得到的參數(shù)估計(jì)量具有Oracle性質(zhì)。由此構(gòu)建了基于信息權(quán)重的Logistic信用評(píng)分模型。三進(jìn)行了實(shí)證分析,主要通過對(duì)深交所148家中小企業(yè)以及30個(gè)信用指標(biāo)體系變量進(jìn)行以信息價(jià)值為懲罰項(xiàng)權(quán)重的自適應(yīng)LASSO變量選擇,建立Logistic信用評(píng)分模型,并利用發(fā)生比率來解釋估計(jì)量的含義,并對(duì)選擇的變量進(jìn)行經(jīng)濟(jì)意義檢驗(yàn),可知模型包含的變量基本涵蓋了企業(yè)的各項(xiàng)能力指標(biāo)。最后并通過對(duì)比逐步回歸法和LASSO兩種變量選擇法建立的logistic信用評(píng)分模型,利用ROC曲線、KS值、WGRP和CIER指標(biāo)來比較驗(yàn)證三種模型的風(fēng)險(xiǎn)區(qū)分能力和估計(jì)準(zhǔn)確性,得到自適應(yīng)LASSO建立的Logistic模型要好于其他兩種方法得到的模型,也表明了包含信息價(jià)值的自適應(yīng)LASSO變量選擇方法在實(shí)證檢驗(yàn)中具有很好的表現(xiàn)。
[Abstract]:In this paper, the problem of variable selection in credit scoring model is mainly studied. Variable selection is not only a problem to be considered in the modeling process, but also one of the most important problems in statistical research. In modeling, it is necessary not only to ensure that the selected set of variables can reflect the characteristics of the object to be studied, but also to ensure that the obtained results have good fitting and predictability. The main work of this paper is as follows: firstly, the methods of variable selection, subset selection and coefficient compression are introduced systematically. Subset selection includes AIC and stepwise regression, coefficient compression includes ridge regression and adaptive LASSO.. This paper analyzes the development of credit scoring model, the key role of variable selection in the establishment of credit scoring model, and the current research situation at home and abroad. Secondly, the adaptive LASSO variable selection and parameter estimation of Logistic model are studied. The key is to consider the information value of the variable as the weight of the penalty term of adaptive LASSO, and to prove that the parameter estimator has Oracle property. Based on this, the Logistic credit scoring model based on information weight is constructed. Thirdly, through the empirical analysis, this paper establishes the Logistic credit scoring model by selecting the adaptive LASSO variables with the weight of information value as punishment item, mainly through 148 SMEs and 30 credit index system variables of Shenzhen Stock Exchange. Using the ratio of occurrence to explain the meaning of the estimator and to test the economic significance of the selected variables, it can be seen that the variables contained in the model basically cover the various capability indicators of the enterprise. Finally, by comparing the logistic credit rating model established by stepwise regression method and LASSO variable selection method, using ROC curve KS value and CIER index to compare and verify the risk differentiation ability and estimation accuracy of the three models. The Logistic model established by adaptive LASSO is better than that obtained by the other two methods. It also shows that the adaptive LASSO variable selection method with information value has a good performance in the empirical test.
【學(xué)位授予單位】:東南大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2016
【分類號(hào)】:F832.4

【相似文獻(xiàn)】

相關(guān)期刊論文 前10條

1 高仁祥,張世英,劉豹;基于神經(jīng)網(wǎng)絡(luò)的變量選擇方法[J];系統(tǒng)工程學(xué)報(bào);1998年02期

2 楊璐,高自友;用神經(jīng)網(wǎng)絡(luò)進(jìn)行變量選擇[J];北方交通大學(xué)學(xué)報(bào);1999年03期

3 趙進(jìn)文;模型構(gòu)建中變量選擇的影響分析[J];東北財(cái)經(jīng)大學(xué)學(xué)報(bào);2002年06期

4 李揚(yáng);朱建鋒;謝邦昌;;變量選擇方法及其在健康食品市場(chǎng)研究中的應(yīng)用探究[J];統(tǒng)計(jì)與信息論壇;2013年10期

5 周偉,王建軍,李繼銳;基于人工神經(jīng)網(wǎng)絡(luò)的影響高速公路社會(huì)效益量化的變量選擇方法[J];西安公路交通大學(xué)學(xué)報(bào);2000年03期

6 齊曉麗;梁慧超;馮彥妍;;回歸模型構(gòu)建中變量選擇的研究[J];河北工業(yè)大學(xué)學(xué)報(bào);2009年06期

7 鄧金蘭;王彬寰;樊仕利;;變系數(shù)模型的變量選擇及在股票數(shù)據(jù)中的應(yīng)用[J];四川大學(xué)學(xué)報(bào)(自然科學(xué)版);2009年06期

8 胡心瀚;葉五一;繆柏其;;上市公司信用風(fēng)險(xiǎn)分析模型中的變量選擇[J];數(shù)理統(tǒng)計(jì)與管理;2012年06期

9 楊金英;;變系數(shù)模型的快速變量選擇方法[J];統(tǒng)計(jì)與決策;2012年05期

10 汪建均;馬義中;;結(jié)合GLM與因子效應(yīng)原則的貝葉斯變量選擇方法[J];系統(tǒng)工程理論與實(shí)踐;2013年08期

相關(guān)會(huì)議論文 前6條

1 張俊華;方偉武;;調(diào)查表分析中變量選擇的一些方法(英文)[A];中國(guó)運(yùn)籌學(xué)會(huì)第六屆學(xué)術(shù)交流會(huì)論文集(下卷)[C];2000年

2 李洪東;梁逸曾;;高維數(shù)據(jù)變量選擇新方法研究[A];中國(guó)化學(xué)會(huì)第27屆學(xué)術(shù)年會(huì)第15分會(huì)場(chǎng)摘要集[C];2010年

3 李慷;席裕庚;;復(fù)雜過程系統(tǒng)中操作變量選擇與定位的方法研究[A];1993年控制理論及其應(yīng)用年會(huì)論文集[C];1993年

4 云永歡;王為婷;梁逸曾;;迭代的保留有信息變量來篩選最佳變量子集的一種多元校正變量選擇方法[A];中國(guó)化學(xué)會(huì)第29屆學(xué)術(shù)年會(huì)摘要集——第19分會(huì):化學(xué)信息學(xué)與化學(xué)計(jì)量學(xué)[C];2014年

5 徐登;范偉;梁逸曾;;紫外光譜結(jié)合變量選擇和偏最小二乘回歸同時(shí)測(cè)定水中重金屬鎘、鋅、鈷[A];中國(guó)化學(xué)會(huì)第29屆學(xué)術(shù)年會(huì)摘要集——第19分會(huì):化學(xué)信息學(xué)與化學(xué)計(jì)量學(xué)[C];2014年

6 梁逸曾;李洪東;許青松;曹東升;張志敏;;灰色化學(xué)建模與模型集群分析——兼論過擬合、穩(wěn)健估計(jì)、變量選擇與模型評(píng)價(jià)[A];中國(guó)化學(xué)會(huì)第27屆學(xué)術(shù)年會(huì)第15分會(huì)場(chǎng)摘要集[C];2010年

相關(guān)博士學(xué)位論文 前10條

1 呂晶;幾類半?yún)?shù)回歸模型的穩(wěn)健估計(jì)與變量選擇[D];重慶大學(xué);2015年

2 王康寧;幾類高維復(fù)雜數(shù)據(jù)半?yún)?shù)模型的結(jié)構(gòu)識(shí)別、變量選擇及穩(wěn)健估計(jì)[D];山東大學(xué);2016年

3 王大榮;分散度量模型中的變量選擇[D];北京工業(yè)大學(xué);2009年

4 王明秋;高維數(shù)據(jù)下若干回歸模型的變量選擇問題研究[D];大連理工大學(xué);2012年

5 劉吉彩;生存數(shù)據(jù)統(tǒng)計(jì)模型的變量選擇方法[D];華東師范大學(xué);2014年

6 樊亞莉;穩(wěn)健變量選擇方法的若干問題研究[D];復(fù)旦大學(xué);2013年

7 唐凱臨;變量選擇和變換的新方法研究[D];同濟(jì)大學(xué);2008年

8 董瑩;高維共線性統(tǒng)計(jì)模型的參數(shù)估計(jì)與變量選擇[D];大連理工大學(xué);2014年

9 葉飛;相對(duì)誤差準(zhǔn)則下的估計(jì)理論和變量選擇方法的研究[D];清華大學(xué);2013年

10 袁晶;貝葉斯方法在變量選擇問題中的應(yīng)用[D];山東大學(xué);2013年

相關(guān)碩士學(xué)位論文 前10條

1 潘玉婷;含多元非線性結(jié)構(gòu)的高維Logistic模型的同時(shí)變量選擇及半?yún)?shù)估計(jì)[D];中國(guó)科學(xué)技術(shù)大學(xué);2016年

2 劉丹;Cox模型及變系數(shù)Cox模型中的變量選擇問題研究[D];暨南大學(xué);2016年

3 羅昊;基于自適應(yīng)LASSO變量選擇的Logistic信用評(píng)分模型研究[D];東南大學(xué);2016年

4 王雙寶;基于變量選擇偏差的變量選擇過程[D];電子科技大學(xué);2016年

5 溫征;縱向和生存數(shù)據(jù)聯(lián)合模型的一個(gè)變量選擇問題[D];云南師范大學(xué);2016年

6 閆闖;多元回歸模型中變量選擇問題研究[D];黑龍江大學(xué);2011年

7 康贊亮;計(jì)量經(jīng)濟(jì)學(xué)模型變量選擇與設(shè)定的理論方法研究[D];清華大學(xué);2009年

8 張丹;乘積模型的變量選擇[D];河南大學(xué);2014年

9 郝亞楠;基于L_2-Fused Lasso變量選擇方法的性質(zhì)及應(yīng)用研究[D];北京交通大學(xué);2014年

10 滿敬鑾;生存數(shù)據(jù)模型的變量選擇[D];中南大學(xué);2009年

,

本文編號(hào):2232123

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/jingjilunwen/huobiyinxinglunwen/2232123.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶344f6***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com