經(jīng)典統(tǒng)計(jì)學(xué)與機(jī)器學(xué)習(xí)中變量選擇方法的比較分析
【圖文】:
逡逑其中7邋>邋0。圖1.1顯示了在P邋=邋2不同7取值時(shí),橋估計(jì)懲罰函數(shù)的可行域。逡逑我們可以看到只有當(dāng)7邋>1時(shí)可行域才是凸的。另一方面,只有當(dāng)7邋<1時(shí)橋估逡逑計(jì)才會(huì)產(chǎn)生稀疏解。逡逑7=4邐7=3邐7=2逡逑:,r邐^。.:r邋1廣邋1逡逑#0邐-T邋0邐rT邋of逡逑-0.5邋\邐-0.5邋\邐)\邐-0.5邋\邐/逡逑^邋-1邋^^.逡逑-1邐-0.5邐0邐0.5邐1邐-1邐-0.5邐0邐0.5邐1邐-1邐-0.5邐0邐0.5邐1逡逑?51邐4逡逑1邐7=1邐1邐7=0-5邐1邐*7=0.3逡逑05邐0.5邐y\邐0.5邐I逡逑#邐^邋0— ̄|邋#邋0■邐邐逡逑-0.5邋^邐-0.5邐\邐-0.5邐I逡逑1-1邐-0.5邐0邐0.5邐1邐%邐-0.5邐0邐0.5邐1邐-1邐-0.5邐0邐0.5邐1逡逑i3i邐.31邐盧邋1逡逑圖1.1:邋p邋=邋2時(shí)不同7的橋估計(jì)可行域逡逑Fan和Li指出懲罰函數(shù)的選取要遵循下面三個(gè)原則丨1卟逡逑?連續(xù)性:對(duì)于數(shù)據(jù)集來說,估計(jì)出的參數(shù)需是連續(xù)的,這樣才能模型更加逡逑的穩(wěn)健。逡逑?無偏性:當(dāng)真實(shí)的參數(shù)維數(shù)很大時(shí),我們估計(jì)出的參數(shù)要差不多能保證無逡逑偏。逡逑?稀疏性:估計(jì)出的參數(shù)應(yīng)該能自動(dòng)的將較小的值估計(jì)為0。逡逑對(duì)于估計(jì)式(1.6)的懲罰項(xiàng)X^=1丨巧丨'邋當(dāng)0邋<邋7邋<邋1時(shí),;^=1丨r2丨7為一個(gè)凹逡逑函數(shù),不滿足上面的連續(xù)性;A懲罰不滿足上面的無偏性;當(dāng)7邋>邋1時(shí),Eb邋W逡逑是一個(gè)凸函數(shù),不滿足上面的稀疏性丨17j。逡逑所以除了匕壓縮方法外
區(qū)域與橢圓的第一次相交的點(diǎn)決定的。Lasso的條件區(qū)域在坐標(biāo)軸上有拐角,所逡逑以圖中的橢圓經(jīng)常在坐標(biāo)軸上與Lasso的條件區(qū)域相交。在這樣的情形下,其中逡逑的一些系數(shù)就會(huì)變?yōu)椋啊T趫D2.1中,相交的點(diǎn)出現(xiàn)在了邋A邋=邋0處,所以這個(gè)模逡逑型將只有一個(gè)變量系數(shù)灸。當(dāng)P邋>邋2時(shí),菱形就變成了菱形體,會(huì)有許多的角,逡逑線和面,所以將會(huì)有更多的系數(shù)估計(jì)為0。逡逑將Lasso對(duì)比嶺回歸逡逑V邐V逡逑^Ridge邋=邋axgmin邋||y邋-^2^\\22邋si.二丨r2|2邋<邋s,邐(2.3)逡逑13邐j=i邐j=i邐?逡逑嶺回歸的限制區(qū)域是圖1.1中7邋=邋2的情況,這個(gè)限制區(qū)域?yàn)橐粋(gè)圓形,這個(gè)圓逡逑形區(qū)域沒有類似于Lasso邊界的那些在坐標(biāo)軸上的棱角,橢圓也就不會(huì)和嶺回逡逑歸的限制區(qū)域相交于坐標(biāo)軸上,所以嶺回歸不會(huì)產(chǎn)生系數(shù)為0的估計(jì),也就不能逡逑進(jìn)行變量選擇。逡逑:----f邋-逡逑?2邋?逡逑-3邋邋邐—邐邐J——……—…—— ̄邋邐1邋邐邐—邐-逡逑-3-2-10123逡逑圖2.1:邋RSS等高線和Lasso的限制條件區(qū)域圖逡逑2.1.2邋正交情況下的Lasso逡逑為了更好地理解Lasso的原理,,我們考慮正交設(shè)計(jì),即XTX邋=邋Ipxp,且逡逑n邋=邋p的情況。在上述假定之下
【學(xué)位授予單位】:山東大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2019
【分類號(hào)】:C8
【相似文獻(xiàn)】
相關(guān)期刊論文 前10條
1 余鵬;經(jīng)典統(tǒng)計(jì)學(xué)的缺陷[J];統(tǒng)計(jì)研究;1993年06期
2 張高魁,姚晨,徐勇勇;兩種假設(shè)檢驗(yàn)思想的比較[J];中國衛(wèi)生統(tǒng)計(jì);1999年02期
3 W.H.Klein ,張愛華;不同時(shí)間尺度的統(tǒng)計(jì)天氣預(yù)報(bào)[J];廣西氣象;1983年03期
4 陳軍科;;假設(shè)檢驗(yàn)中的P值應(yīng)用研究[J];價(jià)值工程;2011年25期
5 童光榮;盧鐵莊;;在爭論中不斷發(fā)展與完善的統(tǒng)計(jì)學(xué)[J];統(tǒng)計(jì)研究;2010年01期
6 夏云;;淺談貝葉斯統(tǒng)計(jì)學(xué)與經(jīng)典統(tǒng)計(jì)學(xué)的差異性[J];學(xué)園;2017年17期
7 韓明旭;;有關(guān)統(tǒng)計(jì)學(xué)的發(fā)展探討[J];金田;2013年02期
8 姜麗琴;;多元統(tǒng)計(jì)分析方法在宏觀經(jīng)濟(jì)分析中的應(yīng)用探討[J];現(xiàn)代商業(yè);2016年06期
9 高君亮;吳波;高永;羅鳳敏;黨曉宏;蒙仲舉;;基于數(shù)字圖像的風(fēng)蝕地表顆粒粒度特征及空間異質(zhì)性[J];干旱區(qū)資源與環(huán)境;2017年01期
10 劉君一;;多元統(tǒng)計(jì)分析方法在宏觀經(jīng)濟(jì)分析中的運(yùn)用[J];時(shí)代金融;2015年20期
相關(guān)博士學(xué)位論文 前2條
1 雷剛;電磁逆問題的統(tǒng)計(jì)分析方法[D];華中科技大學(xué);2009年
2 劉剛;支持精細(xì)農(nóng)業(yè)實(shí)踐的農(nóng)田空間分布信息處理的方法與試驗(yàn)研究[D];中國農(nóng)業(yè)大學(xué);2001年
相關(guān)碩士學(xué)位論文 前10條
1 田冰;經(jīng)典統(tǒng)計(jì)學(xué)與機(jī)器學(xué)習(xí)中變量選擇方法的比較分析[D];山東大學(xué);2019年
2 谷恒明;經(jīng)典統(tǒng)計(jì)學(xué)與貝葉斯統(tǒng)計(jì)學(xué)在回歸模型中的比較研究[D];軍事科學(xué)院;2018年
3 吳s
本文編號(hào):2672983
本文鏈接:http://sikaile.net/guanlilunwen/tongjijuecelunwen/2672983.html