高維多重共線性數(shù)據(jù)特征篩選
發(fā)布時(shí)間:2021-04-16 23:58
隨著信息技術(shù)的不斷發(fā)展,在金融、氣象預(yù)測(cè)、基因研究等一些領(lǐng)域中,統(tǒng)計(jì)學(xué)家常能夠收集到高維數(shù)據(jù)。但由于維數(shù)過高,傳統(tǒng)的統(tǒng)計(jì)分析方法和變量選擇方法變得不再穩(wěn)健和難以適用。并且還有其他的難題需要去克服,例如當(dāng)誤差分布為厚尾分布時(shí),它們的效率都普遍較低甚至它們會(huì)變得無法適用;還有當(dāng)自變量間存在嚴(yán)重的多重共線性時(shí),這也會(huì)嚴(yán)重干擾到變量選擇方法的篩選效果。為了克服多重共線性,本文突破性地提出能夠應(yīng)對(duì)存在多重共線性高維線性數(shù)據(jù)的穩(wěn)健的高維特征篩選法。本文的主要工作如下:第一章闡述了在面臨高維數(shù)據(jù)時(shí)變量篩選的研究現(xiàn)狀與歷史,并且對(duì)一些常用特征篩選方法進(jìn)行了回顧和學(xué)習(xí),最后對(duì)本文的內(nèi)容安排和創(chuàng)新點(diǎn)進(jìn)行了說明。第二章中提出一種針對(duì)多重共線性的高維特征篩選法,可處理存在多重共線性這類型的高維數(shù)據(jù)。當(dāng)下很多針對(duì)高維線性模型的研究都是基于單一的邊際效應(yīng)下進(jìn)行的,變量的篩選依賴于變量之間相互獨(dú)立,這使得當(dāng)存在變量間存在多重共線性時(shí)可能導(dǎo)致變量篩選的不穩(wěn)定性,本文通過引入凈效應(yīng)的這一概念,讓自變量的凈效應(yīng)替代其邊際效應(yīng),提出一種基于全局影響的特征篩選方法,這使得其篩選方法的適用范圍更廣,并進(jìn)一步通過證明得到了確定篩...
【文章來源】:江西師范大學(xué)江西省
【文章頁(yè)數(shù)】:33 頁(yè)
【學(xué)位級(jí)別】:碩士
【文章目錄】:
摘要
Abstract
1 緒論
1.1 研究背景及現(xiàn)狀
1.1.1 超高維特征篩選
1.1.2 多重共線性
1.2 常用特征篩選方法概述
1.2.1 SIS方法
1.2.2 DC-SIS方法
1.3 本文主要內(nèi)容及創(chuàng)新點(diǎn)
2 高維多重共線性型數(shù)據(jù)的變量篩選研究
2.1 引言
2.2 篩選方法與理論研究
2.2.1 篩選方法
2.2.2 理論性質(zhì)
2.3 定理證明
3 數(shù)值模擬與實(shí)例分析
3.1 數(shù)值模擬
3.2 實(shí)例分析
4 總結(jié)與展望
4.1 研究總結(jié)
4.2 研究展望
參考文獻(xiàn)
致謝
本文編號(hào):3142411
【文章來源】:江西師范大學(xué)江西省
【文章頁(yè)數(shù)】:33 頁(yè)
【學(xué)位級(jí)別】:碩士
【文章目錄】:
摘要
Abstract
1 緒論
1.1 研究背景及現(xiàn)狀
1.1.1 超高維特征篩選
1.1.2 多重共線性
1.2 常用特征篩選方法概述
1.2.1 SIS方法
1.2.2 DC-SIS方法
1.3 本文主要內(nèi)容及創(chuàng)新點(diǎn)
2 高維多重共線性型數(shù)據(jù)的變量篩選研究
2.1 引言
2.2 篩選方法與理論研究
2.2.1 篩選方法
2.2.2 理論性質(zhì)
2.3 定理證明
3 數(shù)值模擬與實(shí)例分析
3.1 數(shù)值模擬
3.2 實(shí)例分析
4 總結(jié)與展望
4.1 研究總結(jié)
4.2 研究展望
參考文獻(xiàn)
致謝
本文編號(hào):3142411
本文鏈接:http://sikaile.net/shoufeilunwen/benkebiyelunwen/3142411.html
最近更新
教材專著