基于復(fù)合分位數(shù)回歸的超高維稀疏數(shù)據(jù)的特征選擇研究
發(fā)布時(shí)間:2021-10-29 11:43
隨著計(jì)算機(jī)技術(shù)和人工智能的發(fā)展,數(shù)據(jù)爆炸是當(dāng)代最熱門的問(wèn)題之一。在超高維數(shù)據(jù)中,數(shù)據(jù)的樣本量大幅增長(zhǎng),此時(shí)只有少數(shù)的協(xié)變量與響應(yīng)變量有關(guān)聯(lián),模型呈現(xiàn)稀疏性特征且模型參數(shù)的解釋性較差。統(tǒng)計(jì)人員面臨著識(shí)別最重要特征的任務(wù),并構(gòu)建最優(yōu)解釋模型,將這些重要特征與響應(yīng)變量聯(lián)系起來(lái)。從超高維數(shù)據(jù)中提取有用的特征是對(duì)超高維數(shù)據(jù)建模的基礎(chǔ)。因?yàn)榇藭r(shí)模型呈現(xiàn)稀疏性,所以對(duì)超高維數(shù)據(jù)進(jìn)行任何精確分析之前,重要的是刪除最明顯的非影響特性特征。由于維數(shù)過(guò)高,許多傳統(tǒng)的建模方法和高維數(shù)據(jù)變量選擇方法不適用于超高維數(shù)據(jù)分析。近年來(lái),為了這個(gè)目標(biāo),數(shù)學(xué)家已經(jīng)開發(fā)了一些算法。比較可行的策略是建立一個(gè)兩階段特征選擇過(guò)程,第一階段使用快捷高效變量篩選過(guò)程將特征維度降低到樣本量之下的合適規(guī)模,并且能夠保留所有的重要特征,在此基礎(chǔ)上再使用一些有效的方法對(duì)降維后的高維數(shù)據(jù)進(jìn)行重要變量選擇。論文中提出了一種超高維數(shù)據(jù)特征選擇方法,基于復(fù)合分位數(shù)模型提出了稀疏性限制的復(fù)合分位數(shù)估計(jì)模型來(lái)實(shí)現(xiàn)超高維數(shù)據(jù)特征選擇第一階段過(guò)程,將特征維度降低到樣本量之下的合適規(guī)模。與此同時(shí)引入MM算法和IHT迭代硬閥值算法對(duì)稀疏性限制復(fù)合分位數(shù)估計(jì)模型...
【文章來(lái)源】:上海師范大學(xué)上海市
【文章頁(yè)數(shù)】:46 頁(yè)
【學(xué)位級(jí)別】:碩士
【文章目錄】:
摘要
abstract
第1章 引言
1.1 研究背景
1.2 研究?jī)?nèi)容
1.3 論文創(chuàng)新點(diǎn)
1.4 論文的結(jié)構(gòu)安排
第2章 建立模型與特征選擇
2.1 復(fù)合分位數(shù)回歸模型
2.2 模型的建立
2.3 特征選擇
第3章 模型求解
3.1 模型優(yōu)化
3.2 模型求解
第4章 基于SRCE-PLM的選擇過(guò)程
第5章 數(shù)值模擬
5.1 參數(shù)值設(shè)置
5.2 模擬過(guò)程
5.3 模型評(píng)價(jià)指標(biāo)
5.4 模擬結(jié)果分析
5.4.1 特征不相關(guān)模擬過(guò)程
5.4.2 特征自相關(guān)模擬
5.4.3 特征全相關(guān)模擬
5.5 真實(shí)模擬例子
第6章 總結(jié)與展望
6.1 結(jié)論
6.2 論文進(jìn)一步研究方向
參考文獻(xiàn)
附錄
致謝
【參考文獻(xiàn)】:
期刊論文
[1]部分線性單指標(biāo)模型的復(fù)合分位數(shù)回歸及變量選擇[J]. 呂亞召,張日權(quán),趙為華,劉吉彩. 中國(guó)科學(xué):數(shù)學(xué). 2014(12)
[2]基于MM算法的LAD回歸的影響分析[J]. 徐亮,周影輝,韋博成. 高校應(yīng)用數(shù)學(xué)學(xué)報(bào)A輯. 2007(01)
碩士論文
[1]超高維稀疏線性變換模型的獨(dú)立性篩選[D]. 王靖迪.江蘇師范大學(xué) 2017
本文編號(hào):3464589
【文章來(lái)源】:上海師范大學(xué)上海市
【文章頁(yè)數(shù)】:46 頁(yè)
【學(xué)位級(jí)別】:碩士
【文章目錄】:
摘要
abstract
第1章 引言
1.1 研究背景
1.2 研究?jī)?nèi)容
1.3 論文創(chuàng)新點(diǎn)
1.4 論文的結(jié)構(gòu)安排
第2章 建立模型與特征選擇
2.1 復(fù)合分位數(shù)回歸模型
2.2 模型的建立
2.3 特征選擇
第3章 模型求解
3.1 模型優(yōu)化
3.2 模型求解
第4章 基于SRCE-PLM的選擇過(guò)程
第5章 數(shù)值模擬
5.1 參數(shù)值設(shè)置
5.2 模擬過(guò)程
5.3 模型評(píng)價(jià)指標(biāo)
5.4 模擬結(jié)果分析
5.4.1 特征不相關(guān)模擬過(guò)程
5.4.2 特征自相關(guān)模擬
5.4.3 特征全相關(guān)模擬
5.5 真實(shí)模擬例子
第6章 總結(jié)與展望
6.1 結(jié)論
6.2 論文進(jìn)一步研究方向
參考文獻(xiàn)
附錄
致謝
【參考文獻(xiàn)】:
期刊論文
[1]部分線性單指標(biāo)模型的復(fù)合分位數(shù)回歸及變量選擇[J]. 呂亞召,張日權(quán),趙為華,劉吉彩. 中國(guó)科學(xué):數(shù)學(xué). 2014(12)
[2]基于MM算法的LAD回歸的影響分析[J]. 徐亮,周影輝,韋博成. 高校應(yīng)用數(shù)學(xué)學(xué)報(bào)A輯. 2007(01)
碩士論文
[1]超高維稀疏線性變換模型的獨(dú)立性篩選[D]. 王靖迪.江蘇師范大學(xué) 2017
本文編號(hào):3464589
本文鏈接:http://sikaile.net/kejilunwen/yysx/3464589.html
最近更新
教材專著