高維線性回歸算法比較研究
發(fā)布時間:2021-12-11 22:58
在大數(shù)據(jù)時代,高維數(shù)據(jù)廣泛呈現(xiàn)在生物信息,金融經(jīng)濟和圖像處理等領域,其共同特征之一是預測變量具有稀疏性.選擇最相關的預測變量是高維數(shù)據(jù)分析的主要研究內(nèi)容之一,具有極其重要的應用價值.為此,針對壓縮感知和變量選擇問題的高維線性回歸算法成為學者們研究的焦點,許多快速、有效的算法被相繼提出,為解決壓縮感知和變量選擇問題提供了諸多幫助,值得我們深入探討和仔細研究.本文從解決壓縮感知,變量選擇問題中的不同模型角度,對目前流行的高維線性回歸算法進行比較研究.在對現(xiàn)存算法特點進行總結(jié)的前提下,深入地研究算法的精度和效率等重要特性.依托現(xiàn)存的牛頓算法,在此基礎上細化了牛頓算法的框架和參數(shù)選取,使其達到更好的數(shù)值效果,同時提出了未知稀疏度下的自適應牛頓算法,并比較了基于解的差異原則,殘量差異原則和HBIC對稀疏度選取的效果.大量的數(shù)值實驗表明,本文細化的牛頓算法在精度和速度上均優(yōu)于目前在壓縮感知和變量選擇領域公認的算法,同時,本文提出的自適應牛頓算法在精度上也超過了該領域公認的算法.在此基礎上,我們開發(fā)了一個MATLAB軟件包.
【文章來源】:北京交通大學北京市 211工程院校 教育部直屬院校
【文章頁數(shù)】:51 頁
【學位級別】:碩士
【部分圖文】:
四種非凸懲罰函數(shù)圖像(左)和其對應的閱值函數(shù)(右)
圖4.1?展示了?稀疏度S對snafix,?snaarm,?SDAR,?MCP,?FoBa,?SP,?HTP,?GrLARS完全準確恢復支撐集Y概率的影響.數(shù)據(jù)集設置為:(n?=?51000,S?=?10?:?50?:?360,cr?=?l,p?=?0.7,尺=10).其中?10?:?50?:?360?表S以50為間隔從10增加到360.我們可以看到隨著稀疏度S的增加,所有現(xiàn)都在變差.然而,snafix和SDAR隨著稀疏度的增加普遍比其他方,當S?=?260時,這兩種算法的表現(xiàn)遠好于其它算法.從圖4.2中可以看出,言,snafix和SDAR大多數(shù)時候都是最快的.??31??
圖4.1?展示了?稀疏度S對snafix,?snaarm,?SDAR,?MCP,?FoBa,?SP,?HTP,?GrLARS完全準確恢復支撐集Y概率的影響.數(shù)據(jù)集設置為:(n?=?51000,S?=?10?:?50?:?360,cr?=?l,p?=?0.7,尺=10).其中?10?:?50?:?360?表S以50為間隔從10增加到360.我們可以看到隨著稀疏度S的增加,所有現(xiàn)都在變差.然而,snafix和SDAR隨著稀疏度的增加普遍比其他方,當S?=?260時,這兩種算法的表現(xiàn)遠好于其它算法.從圖4.2中可以看出,言,snafix和SDAR大多數(shù)時候都是最快的.??31??
【參考文獻】:
期刊論文
[1]高維模型選擇方法綜述[J]. 李根,鄒國華,張新雨. 數(shù)理統(tǒng)計與管理. 2012(04)
本文編號:3535550
【文章來源】:北京交通大學北京市 211工程院校 教育部直屬院校
【文章頁數(shù)】:51 頁
【學位級別】:碩士
【部分圖文】:
四種非凸懲罰函數(shù)圖像(左)和其對應的閱值函數(shù)(右)
圖4.1?展示了?稀疏度S對snafix,?snaarm,?SDAR,?MCP,?FoBa,?SP,?HTP,?GrLARS完全準確恢復支撐集Y概率的影響.數(shù)據(jù)集設置為:(n?=?51000,S?=?10?:?50?:?360,cr?=?l,p?=?0.7,尺=10).其中?10?:?50?:?360?表S以50為間隔從10增加到360.我們可以看到隨著稀疏度S的增加,所有現(xiàn)都在變差.然而,snafix和SDAR隨著稀疏度的增加普遍比其他方,當S?=?260時,這兩種算法的表現(xiàn)遠好于其它算法.從圖4.2中可以看出,言,snafix和SDAR大多數(shù)時候都是最快的.??31??
圖4.1?展示了?稀疏度S對snafix,?snaarm,?SDAR,?MCP,?FoBa,?SP,?HTP,?GrLARS完全準確恢復支撐集Y概率的影響.數(shù)據(jù)集設置為:(n?=?51000,S?=?10?:?50?:?360,cr?=?l,p?=?0.7,尺=10).其中?10?:?50?:?360?表S以50為間隔從10增加到360.我們可以看到隨著稀疏度S的增加,所有現(xiàn)都在變差.然而,snafix和SDAR隨著稀疏度的增加普遍比其他方,當S?=?260時,這兩種算法的表現(xiàn)遠好于其它算法.從圖4.2中可以看出,言,snafix和SDAR大多數(shù)時候都是最快的.??31??
【參考文獻】:
期刊論文
[1]高維模型選擇方法綜述[J]. 李根,鄒國華,張新雨. 數(shù)理統(tǒng)計與管理. 2012(04)
本文編號:3535550
本文鏈接:http://sikaile.net/kejilunwen/yysx/3535550.html
最近更新
教材專著