組Lasso罰回歸模型和算法的應(yīng)用研究
發(fā)布時(shí)間:2021-11-09 09:15
全球范圍內(nèi),運(yùn)用大數(shù)據(jù)推動(dòng)經(jīng)濟(jì)發(fā)展使得數(shù)據(jù)特征維數(shù)呈幾何式增加,眾多領(lǐng)域數(shù)據(jù)的特性促使特征選擇成為解決維數(shù)災(zāi)難、提高算法泛化能力的有效手段之一。同時(shí)多種類別數(shù)據(jù)的特征以組結(jié)構(gòu)形式存在,基于傳統(tǒng)方法對(duì)系數(shù)添加組結(jié)構(gòu)懲罰項(xiàng)來實(shí)現(xiàn)特征選擇的方法日益成熟。該文針對(duì)組Lasso(Least Absolute Shrinkage and Selection Operator)回歸模型一組內(nèi)所有變量同時(shí)選擇或舍棄的局限性,對(duì)重疊組Lasso與分層組Lasso進(jìn)行研究。首先,考慮到特征間相互重疊的問題,引入了重疊組Lasso邏輯回歸模型,根據(jù)重疊系數(shù)分解機(jī)制,將組內(nèi)重疊變量分解為潛在變量,以形成新的特征向量,采用組坐標(biāo)下降法求解模型參數(shù),通過仿真實(shí)驗(yàn)與疾病特征基因選擇實(shí)驗(yàn),驗(yàn)證重疊組Lasso較組Lasso的優(yōu)越性。其次,針對(duì)組Lasso罰向量自回歸模型中特征共用時(shí)滯的缺陷,引入分層組Lasso滑動(dòng)平均向量自回歸模型,以達(dá)到實(shí)現(xiàn)系數(shù)分層稀疏的同時(shí),捕捉時(shí)間序列特征誤差項(xiàng)在不同時(shí)期的依存關(guān)系。并通過兩段式估計(jì)以及鄰近梯度下降法求解參數(shù),通過對(duì)流層散射通信傳輸電平預(yù)測與腦電信號(hào)特征分類實(shí)驗(yàn),證明該模型在預(yù)...
【文章來源】:燕山大學(xué)河北省
【文章頁數(shù)】:72 頁
【學(xué)位級(jí)別】:碩士
【部分圖文】:
內(nèi)外生變量系數(shù)矩陣稀疏圖
本文編號(hào):3485050
【文章來源】:燕山大學(xué)河北省
【文章頁數(shù)】:72 頁
【學(xué)位級(jí)別】:碩士
【部分圖文】:
內(nèi)外生變量系數(shù)矩陣稀疏圖
本文編號(hào):3485050
本文鏈接:http://sikaile.net/kejilunwen/ruanjiangongchenglunwen/3485050.html
最近更新
教材專著