組Lasso模型及坐標(biāo)下降算法研究
發(fā)布時(shí)間:2017-03-23 11:18
本文關(guān)鍵詞:組Lasso模型及坐標(biāo)下降算法研究,由筆耕文化傳播整理發(fā)布。
【摘要】:隨著對(duì)數(shù)據(jù)挖掘問(wèn)題的深入探索,其研究對(duì)象的特征維數(shù)急劇增加,從而涌現(xiàn)出了大量的高維數(shù)據(jù)。而這些高維數(shù)據(jù)之間大都是存在冗余的,影響模型分類準(zhǔn)確性的同時(shí)還降低了計(jì)算速度。為了從大量高維數(shù)據(jù)中挖掘出有用信息,特征選擇已成為眾多專家學(xué)者的首選。本文介紹了一種使模型具有稀疏性的特征選擇方法——Lasso,并對(duì)其進(jìn)行了簡(jiǎn)單闡述。針對(duì)其局限性,重點(diǎn)介紹了組Lasso和稀疏組Lasso方法,并在已有的研究基礎(chǔ)上做了如下工作。首先,介紹了線性模型下的組Lasso基本原理,并基于坐標(biāo)下降算法給出了適合組Lasso參數(shù)求解的塊坐標(biāo)下降算法;通過(guò)分析嶺回歸,Lasso和組Lasso三種方法罰函數(shù)的幾何性質(zhì)以及對(duì)其進(jìn)行的仿真實(shí)驗(yàn),說(shuō)明組Lasso方法能夠保證組間稀疏的特性。其次,將組Lasso方法由線性模型推廣到logistic模型進(jìn)行識(shí)別分類,并將其應(yīng)用于對(duì)紅斑鱗狀皮膚病的疾病診斷。皮膚病數(shù)據(jù)是名詞性數(shù)據(jù),這里給出了虛擬編碼的定義,并對(duì)已編碼的變量進(jìn)行不同分組實(shí)驗(yàn)。實(shí)驗(yàn)結(jié)果表明,該方法有效的解決了紅斑鱗狀皮膚病的分類診斷問(wèn)題。最后,本文結(jié)合Lasso方法的單變量稀疏性和組Lasso方法的組變量稀疏性給出了稀疏組Lasso方法的基本原理,通過(guò)仿真實(shí)驗(yàn)驗(yàn)證了稀疏組Lasso方法較Lasso和組Lasso方法的優(yōu)越性。隨后采用BCI競(jìng)賽IV的腦電數(shù)據(jù)進(jìn)行實(shí)驗(yàn),結(jié)果證明,該方法可以獲得較低的錯(cuò)誤率并實(shí)現(xiàn)同時(shí)通道選擇和特征選擇。
【關(guān)鍵詞】:特征選擇 Lasso 組Lasso 稀疏組Lasso 坐標(biāo)下降 通道選擇
【學(xué)位授予單位】:燕山大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2015
【分類號(hào)】:TP311.13
【目錄】:
- 摘要5-6
- Abstract6-9
- 第1章 緒論9-15
- 1.1 特征選擇及研究現(xiàn)狀9-11
- 1.2 正則化特征選擇方法研究現(xiàn)狀11-13
- 1.3 本文主要研究?jī)?nèi)容及章節(jié)安排13-15
- 第2章 組Lasso罰回歸模型15-27
- 2.1 引言15
- 2.2 基本原理15-19
- 2.2.1 嶺回歸15-16
- 2.2.2 Lasso16-17
- 2.2.3 組Lasso17
- 2.2.4 塊坐標(biāo)下降算法17-19
- 2.3 罰函數(shù)幾何性質(zhì)分析19-20
- 2.4 實(shí)驗(yàn)仿真20-26
- 2.4.1 仿真數(shù)據(jù)21
- 2.4.2 稀疏性分析21-25
- 2.4.3 不同參數(shù)下組Lasso方法性能分析25-26
- 2.5 本章小結(jié)26-27
- 第3章 組Lasso罰多值logistic回歸模型27-37
- 3.1 引言27
- 3.2 組Lasso罰多值logistic模型27-31
- 3.2.1 模型定義27-29
- 3.2.2 塊坐標(biāo)下降算法29-31
- 3.3 應(yīng)用背景31-32
- 3.4 實(shí)驗(yàn)步驟32-34
- 3.5 實(shí)驗(yàn)結(jié)果與分析34-36
- 3.6 本章小結(jié)36-37
- 第4章 稀疏組Lasso模型37-59
- 4.1 引言37
- 4.2 稀疏組Lasso罰高斯回歸模型37-42
- 4.2.1 模型定義和塊坐標(biāo)下降算法37-39
- 4.2.2 組內(nèi)選擇和組間選擇39-42
- 4.3 稀疏組Lasso罰logistic回歸模型42-45
- 4.4 實(shí)驗(yàn)結(jié)果與分析45-58
- 4.4.1 實(shí)驗(yàn)數(shù)據(jù)45-48
- 4.4.2 實(shí)驗(yàn)設(shè)計(jì)48-50
- 4.4.3 實(shí)驗(yàn)結(jié)果50-58
- 4.5 本章小結(jié)58-59
- 結(jié)論59-61
- 參考文獻(xiàn)61-67
- 攻讀碩士學(xué)位期間承擔(dān)的科研任務(wù)與主要成果67-68
- 致謝68-69
- 作者簡(jiǎn)介69
【相似文獻(xiàn)】
中國(guó)碩士學(xué)位論文全文數(shù)據(jù)庫(kù) 前6條
1 薛芳;組Lasso模型及坐標(biāo)下降算法研究[D];燕山大學(xué);2015年
2 謝儀;基于Lasso類方法的指數(shù)跟蹤問(wèn)題研究[D];太原理工大學(xué);2015年
3 柯鄭林;Lasso及其相關(guān)方法在多元線性回歸模型中的應(yīng)用[D];北京交通大學(xué);2011年
4 李紅旺;基于LASSO算法的多性狀QTL條件定位方法[D];上海交通大學(xué);2014年
5 劉叢瑜;基于Lasso的股指期貨統(tǒng)計(jì)套利研究[D];西南財(cái)經(jīng)大學(xué);2011年
6 郭夢(mèng);MQ-RBF和Lasso模型在一類熱傳導(dǎo)反問(wèn)題中的應(yīng)用[D];大連理工大學(xué);2013年
本文關(guān)鍵詞:組Lasso模型及坐標(biāo)下降算法研究,由筆耕文化傳播整理發(fā)布。
,本文編號(hào):263611
本文鏈接:http://sikaile.net/shoufeilunwen/xixikjs/263611.html
最近更新
教材專著