天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當前位置:主頁 > 科技論文 > 數(shù)學論文 >

帶有替代數(shù)據(jù)的超高維特征篩選研究

發(fā)布時間:2020-05-20 14:36
【摘要】:隨著大數(shù)據(jù)的日益發(fā)展,數(shù)據(jù)分析被廣泛應用到各個科學領域,如生物醫(yī)學成像,基因描述和蛋白組學研究,腫瘤分類等。協(xié)變量的維數(shù)p隨著樣本量呈指數(shù)級增長,響應變量和協(xié)變量之間滿足稀疏性,這意味著只有少部分的協(xié)變量與響應變量相關,使得傳統(tǒng)的數(shù)據(jù)分析方法不再準確,得出的結果可能存在偏差甚至是錯誤的。為了對超高維數(shù)據(jù)進行更精確的分析,從數(shù)據(jù)集中獲取有效信息,我們需要對超高維數(shù)據(jù)進行降維處理。由于超高維降維可以有效解決該問題,故其應用前景十分廣泛。近年來,許多學者提出了多種高效的超高維特征篩選方法,一般分為兩步,先是將超高維數(shù)據(jù)的維數(shù)降低到樣本規(guī)模以下,特征篩選將所有的重要變量保留下來,在這個基礎上再對降維后數(shù)據(jù)進行變量選擇。在研究響應變量與預測變量的關系時,由于變量獲取難度大或者所需花費成本太高,協(xié)變量中經(jīng)常出現(xiàn)數(shù)據(jù)缺失的情況。一般來說,簡單的舍棄不完全數(shù)據(jù)的觀測值,基于完整數(shù)據(jù)分析的推論結果可能是有偏的甚至是無效的。所以探討研究處理缺失數(shù)據(jù)問題的方法顯得尤為重要。目前,對于該問題許多統(tǒng)計學研究者不斷深入探討,理論研究成果日漸豐富。本文旨在研究當協(xié)變量隨機缺失時帶有替代數(shù)據(jù)的超高維數(shù)據(jù)特征篩選問題。首先從最簡單的線性模型出發(fā),采用非參數(shù)插補的方法來構建精確觀測數(shù)據(jù)與對應的替代數(shù)據(jù)之間的聯(lián)系。我們驗證了所提出帶有替代數(shù)據(jù)的超高維數(shù)據(jù)下基于非參數(shù)插補的特征篩選過程滿足2008年Fan等所給出的確定性篩選性質。然后本文擴展研究無模型假設時,在擴展逆概率加權方法的基礎上提出了雙穩(wěn)健特征篩選指標。當替代變量維數(shù)不高的時候,逆概率權函數(shù)和擴展的條件期望函數(shù)都可以用非參數(shù)擬合的方式來估計,保證了篩選指標的相合性。當替代變量為高維的時候,可以對逆概率權函數(shù)和條件期望函數(shù)給定參數(shù)模型假設,只要兩個參數(shù)模型假設至少有一個是正確的,那么就能保證篩選指標的估計相合性。在理論性質的證明之外,又利用蒙特卡羅模擬研究了其有限樣本性質,并通過行實例分析,驗證評估其實用價值。
【學位授予單位】:南京信息工程大學
【學位級別】:碩士
【學位授予年份】:2018
【分類號】:O212

【相似文獻】

相關期刊論文 前10條

1 李書磊;劉安中;李友榮;肖涵;;基于替代數(shù)據(jù)法的齒輪信號的混沌識別[J];武漢科技大學學報(自然科學版);2007年03期

2 盧宇,賀國光;基于改進型替代數(shù)據(jù)法的實測交通流的混沌判別[J];系統(tǒng)工程;2005年06期

3 王桓;水玲玲;孟慶元;李笑然;Nicolass Frans DE ROOIJ;周國富;;一種基于改進替代數(shù)據(jù)法的圖形化混沌判據(jù)[J];華南師范大學學報(自然科學版);2018年04期

4 石鑫;周勇;甘新年;姬生科;;機載多源飛行數(shù)據(jù)資料的非線性檢驗[J];計算機與數(shù)字工程;2013年05期

5 相潔;曹銳;李聰改;陳俊杰;;基于模糊熵的時間序列非線性檢測方法[J];太原理工大學學報;2014年03期

6 盧宇;;基于改進型替代數(shù)據(jù)法的仿真交通流混沌判定[J];武漢理工大學學報(交通科學與工程版);2011年03期

7 雷強;;國內外煤炭價格的非線性特征研究[J];資源科學;2013年10期

8 盧宇;賀國光;;一種新的交通流混沌實時判定方法[J];系統(tǒng)工程理論方法應用;2006年05期

9 趙家春;;用星號替代數(shù)據(jù)我有簡便方法[J];電腦愛好者;2012年03期

10 尹雯雯;;波士頓住房數(shù)據(jù)變系數(shù)誤差模型的核實方法研究[J];重慶工商大學學報(自然科學版);2018年03期

相關重要報紙文章 前1條

1 遲誠;替代國和替代數(shù)據(jù)成爭議焦點[N];中國綠色時報;2011年

相關博士學位論文 前4條

1 侯威;極端事件檢測、評價方法及中國近40年極端溫度和降水事件時空變化研究[D];蘭州大學;2009年

2 程靜;基本情感生理信號的非線性特征提取研究[D];西南大學;2015年

3 許小可;基于非線性分析的海雜波處理與目標檢測[D];大連海事大學;2008年

4 謝中凱;信息熵理論在混凝土結構損傷動力識別中的應用研究[D];浙江大學;2013年

相關碩士學位論文 前8條

1 張潔;帶有替代數(shù)據(jù)的超高維特征篩選研究[D];南京信息工程大學;2018年

2 俞菲;基于動力特征的替代數(shù)據(jù)算法的研究[D];哈爾濱工業(yè)大學;2013年

3 眭燁;替代數(shù)據(jù)及其應用[D];華東師范大學;2011年

4 劉昊;基于雙譜的時間序列正態(tài)性及線性的檢驗[D];南京大學;2013年

5 張明明;中國證券市場的多重分形及有效性研究[D];山西大學;2012年

6 王祖力;基于圖論的小世界統(tǒng)計策略研究及其在醫(yī)學影像中的應用[D];中國計量學院;2016年

7 孫彬彬;混沌時序的特征量分析及相空間重構研究[D];東北大學;2008年

8 王曉婧;不完全數(shù)據(jù)半?yún)?shù)變系數(shù)部分線性模型的統(tǒng)計分析[D];中國科學院研究生院(數(shù)學與系統(tǒng)科學研究院);2008年

,

本文編號:2672771

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/yysx/2672771.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權申明:資料由用戶111ae***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com