Lasso及其改進(jìn)方法在變量選擇中的優(yōu)劣性研究
發(fā)布時(shí)間:2021-04-05 13:39
在對(duì)多元的數(shù)據(jù)進(jìn)行分析建模的時(shí)候,如果缺少了某一個(gè)重要的影響因素,那么建立的模型偏差會(huì)比較大,所以我們希望引入更多變量。但是引入的變量有可能會(huì)增加設(shè)計(jì)矩陣的共線性進(jìn)而影響建模效果,而且如果引入的變量無(wú)顯著影響則模型的可解釋性也會(huì)受到影響。Lasso及其改進(jìn)的方法SCAD,自適應(yīng)Lasso和彈性網(wǎng)都可以通過(guò)收縮估計(jì)值來(lái)進(jìn)行變量選擇和參數(shù)估計(jì)。但是在不同的應(yīng)用背景下,這四種方法進(jìn)行建模的效果也會(huì)有所差異。本文對(duì)Lasso及其改進(jìn)方法之間的優(yōu)劣性進(jìn)行了探討,具體研究分以下四個(gè)部分:第一,本文對(duì)Lasso回歸相關(guān)理論進(jìn)行闡述,并且介紹了Lasso參數(shù)的估計(jì)方法和實(shí)現(xiàn)Lasso回歸的算法。第二,對(duì)SCAD,自適應(yīng)Lasso,彈性網(wǎng)的相關(guān)理論進(jìn)行闡述,通過(guò)比較它們的懲罰項(xiàng)來(lái)分析它們與Lasso之間的關(guān)系。第三,在一種線性模型的背景下進(jìn)行模擬,比較Lasso及其改進(jìn)方法在建模過(guò)程中選擇變量的能力。第四,在一種非線性模型的背景下進(jìn)行模擬,比較Lasso及其改進(jìn)方法建模的效果,并且引入糖尿病數(shù)據(jù)進(jìn)行實(shí)例分析來(lái)驗(yàn)證模擬的結(jié)論。本文通過(guò)研究這四種方法在變量選擇中的特點(diǎn),給出了不同應(yīng)用背景下它們的優(yōu)劣性比較。...
【文章來(lái)源】:哈爾濱工業(yè)大學(xué)黑龍江省 211工程院校 985工程院校
【文章頁(yè)數(shù)】:50 頁(yè)
【學(xué)位級(jí)別】:碩士
【部分圖文】:
向前選擇算法圖
圖 3-2 向前梯度算法圖當(dāng) p 2的時(shí)候,如圖 3-2,1X 是與Y 最相近的向量,在1X 的方向上前進(jìn)將eY 作為目標(biāo),通過(guò)比較可以看出還是1X 與eY 最相近,所以繼續(xù)在1X 的進(jìn) , 這樣沿著1X 一直前進(jìn)直到eY 與2X 最相近的時(shí)候改變方向沿著X
圖 3-3 最小角回歸算法圖 p 2的時(shí)候,如圖 3-3,1X 是與Y 最相近的向量,所以沿著1X 的方向前進(jìn)1X 和2X 的接近程度相同,也就是eY 處于1X 與2X 的角分線上時(shí)改變方向這個(gè)角分線前進(jìn),當(dāng)eY 縮小到我們給定的值的時(shí)候算法結(jié)束,綜合前面
【參考文獻(xiàn)】:
期刊論文
[1]基于增量學(xué)習(xí)和Lasso融合的數(shù)據(jù)可視化模式識(shí)別方法[J]. 梁懷新,郝連旺,宋佳霖,鄭存芳,洪文學(xué). 高技術(shù)通訊. 2018(01)
[2]基于Lasso特征選擇的自閉癥預(yù)測(cè)[J]. 常春云. 北京生物醫(yī)學(xué)工程. 2017(06)
[3]多因子量化模型在投資組合中的應(yīng)用——基于LASSO與Elastic Net的比較研究[J]. 謝合亮,胡迪. 統(tǒng)計(jì)與信息論壇. 2017(10)
[4]一種利用Screening加速技巧的Lasso算法[J]. 邱俊洋,潘志松,易磊,陶蔚,張梁梁. 計(jì)算機(jī)工程與應(yīng)用. 2018(04)
本文編號(hào):3119741
【文章來(lái)源】:哈爾濱工業(yè)大學(xué)黑龍江省 211工程院校 985工程院校
【文章頁(yè)數(shù)】:50 頁(yè)
【學(xué)位級(jí)別】:碩士
【部分圖文】:
向前選擇算法圖
圖 3-2 向前梯度算法圖當(dāng) p 2的時(shí)候,如圖 3-2,1X 是與Y 最相近的向量,在1X 的方向上前進(jìn)將eY 作為目標(biāo),通過(guò)比較可以看出還是1X 與eY 最相近,所以繼續(xù)在1X 的進(jìn) , 這樣沿著1X 一直前進(jìn)直到eY 與2X 最相近的時(shí)候改變方向沿著X
圖 3-3 最小角回歸算法圖 p 2的時(shí)候,如圖 3-3,1X 是與Y 最相近的向量,所以沿著1X 的方向前進(jìn)1X 和2X 的接近程度相同,也就是eY 處于1X 與2X 的角分線上時(shí)改變方向這個(gè)角分線前進(jìn),當(dāng)eY 縮小到我們給定的值的時(shí)候算法結(jié)束,綜合前面
【參考文獻(xiàn)】:
期刊論文
[1]基于增量學(xué)習(xí)和Lasso融合的數(shù)據(jù)可視化模式識(shí)別方法[J]. 梁懷新,郝連旺,宋佳霖,鄭存芳,洪文學(xué). 高技術(shù)通訊. 2018(01)
[2]基于Lasso特征選擇的自閉癥預(yù)測(cè)[J]. 常春云. 北京生物醫(yī)學(xué)工程. 2017(06)
[3]多因子量化模型在投資組合中的應(yīng)用——基于LASSO與Elastic Net的比較研究[J]. 謝合亮,胡迪. 統(tǒng)計(jì)與信息論壇. 2017(10)
[4]一種利用Screening加速技巧的Lasso算法[J]. 邱俊洋,潘志松,易磊,陶蔚,張梁梁. 計(jì)算機(jī)工程與應(yīng)用. 2018(04)
本文編號(hào):3119741
本文鏈接:http://sikaile.net/kejilunwen/yysx/3119741.html
最近更新
教材專(zhuān)著