天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

超高維縱向數(shù)據(jù)的特征篩選研究

發(fā)布時(shí)間:2020-04-30 03:38
【摘要】:實(shí)際問(wèn)題研究中常常面臨復(fù)雜數(shù)據(jù),其中超高維數(shù)據(jù)和縱向數(shù)據(jù)被廣泛應(yīng)用于醫(yī)學(xué)、經(jīng)濟(jì)學(xué)、氣象等大數(shù)據(jù)領(lǐng)域。超高維數(shù)據(jù)的特點(diǎn)是維數(shù)P遠(yuǎn)大于樣本量n,這使得超高維數(shù)據(jù)的計(jì)算成本大大增加,統(tǒng)計(jì)精度和模型算法的穩(wěn)定性大大降低。這導(dǎo)致傳統(tǒng)的一些降維分析方法,如:主成分法、最優(yōu)子集法、變量選擇方法等,無(wú)法準(zhǔn)確有效的解決超高維數(shù)據(jù)問(wèn)題。而超高維問(wèn)題一般具有稀疏性特征,即只有少數(shù)協(xié)變量與響應(yīng)變量有相關(guān)性,這使得對(duì)其的快速降維可以實(shí)現(xiàn)�?v向數(shù)據(jù)反應(yīng)了數(shù)據(jù)個(gè)體間獨(dú)立,個(gè)體內(nèi)相關(guān)的特點(diǎn),當(dāng)其與超高維問(wèn)題結(jié)合時(shí),對(duì)研究工作者提出了新的挑戰(zhàn)。本文基于超高維縱向數(shù)據(jù)的結(jié)構(gòu)特征,在稀疏性假設(shè)下,研究了超高維線性模型和可加模型下在縱向數(shù)據(jù)背景下的特征篩選問(wèn)題。在超高維線性模型中,推廣確定獨(dú)立篩選SIS(Sure Independence Screening)方法,利用縱向數(shù)據(jù)的組內(nèi)相關(guān)結(jié)構(gòu)矩陣,構(gòu)造了帶有工作相關(guān)矩陣的MSIS方法,并證明了該篩選過(guò)程滿足確定性篩選性質(zhì),能夠以概率1篩選出真實(shí)變量集合。在縱向數(shù)據(jù)超高維可加模型下,推廣非參數(shù)獨(dú)立篩選NIS(Nonparametric independence screening)方法,引入工作相關(guān)矩陣,借助二次推斷函數(shù)QIF(quadratic inference function),避免未知工作相關(guān)矩陣的直接估計(jì),構(gòu)造重要變量的非參數(shù)邊際相關(guān)度量指標(biāo),建立QIF-NIS篩選過(guò)程。理論證明表明所提出的方法具有確定篩選性質(zhì)。本文創(chuàng)新性的基于縱向數(shù)據(jù)組內(nèi)相關(guān)結(jié)構(gòu)構(gòu)造了超高維問(wèn)題下的邊際特征篩選方法,理論證明所提出降維篩選過(guò)程滿足確定性篩選性質(zhì)之外,還從數(shù)值模擬上研究了其有限樣本性質(zhì),結(jié)果表明從理論和數(shù)值模擬上,所提出方法都具有優(yōu)良表現(xiàn)。
【學(xué)位授予單位】:南京信息工程大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2018
【分類號(hào)】:O212.1

【參考文獻(xiàn)】

相關(guān)碩士學(xué)位論文 前2條

1 李海斌;復(fù)雜數(shù)據(jù)下部分線性模型的QIF估計(jì)[D];北京工業(yè)大學(xué);2014年

2 柏楊;基于二次推斷函數(shù)的縱向數(shù)據(jù)半?yún)?shù)模型的估計(jì)[D];華東師范大學(xué);2005年

,

本文編號(hào):2645348

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/yysx/2645348.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶18ed9***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com