超高維生存數(shù)據(jù)的變量篩選和異常值點識別的研究
發(fā)布時間:2021-11-23 06:32
本文討論了兩個問題:超高維生存數(shù)據(jù)的變量篩選和指數(shù)回歸模型中生存數(shù)據(jù)的異常值點識別.在超高維數(shù)據(jù)中,確定獨立篩選法能以很高概率在保留所有重要變量的前提下快速有效地降低數(shù)據(jù)的維數(shù).現(xiàn)有的變量篩選方法大多數(shù)是針對完全數(shù)據(jù)提出的,無法處理存在刪失的生存數(shù)據(jù).本文提出了三種不依賴于模型的變量篩選法來處理超高維生存數(shù)據(jù),它們分別是基于刪失累積殘差、相關(guān)性秩排序和Kolmogorov-Smirnov檢驗統(tǒng)計量.這三種方法在比較弱的正則化條件下?lián)碛写_定篩選性(sure screening property)和秩相合性(ranking consistency).模擬實驗結(jié)果說明這三種方法的表現(xiàn)優(yōu)于已有的方法.最后我們把它們應用到套細胞淋巴瘤的實例分析中.現(xiàn)實生活中的大部分數(shù)據(jù)集會存在異常值點,異常值點的存在會對參數(shù)估計、統(tǒng)計推斷和模型選擇帶來不利影響.目前對完全觀測數(shù)據(jù)中異常值點的研究已經(jīng)碩果累累,卻很少有人研究帶刪失的生存數(shù)據(jù)中的異常值點識別.本文提出懲罰似然的方法來檢測指數(shù)回歸模型中的異常值點,它可以處理帶有刪失的生存數(shù)據(jù).我們把異常值點識別問題轉(zhuǎn)換成高維正則化回歸中的參數(shù)估計問題,并采用坐標下降...
【文章來源】:武漢大學湖北省 211工程院校 985工程院校 教育部直屬院校
【文章頁數(shù)】:138 頁
【學位級別】:博士
【部分圖文】:
圖2.1:?2.4.1節(jié)的Cox比例風險模型中,重要變量石和非重要變量a
圖5.1:在四種不同的異常值點生成機制下,naive方法和本章提出的方法所得到的??Kaplan-Meier估計的曲線.??
圖5.2:德國乳腺癌研宄中接受激素治療和化學治療病人的Kaplan-Meier生存曲??線.??
本文編號:3513321
【文章來源】:武漢大學湖北省 211工程院校 985工程院校 教育部直屬院校
【文章頁數(shù)】:138 頁
【學位級別】:博士
【部分圖文】:
圖2.1:?2.4.1節(jié)的Cox比例風險模型中,重要變量石和非重要變量a
圖5.1:在四種不同的異常值點生成機制下,naive方法和本章提出的方法所得到的??Kaplan-Meier估計的曲線.??
圖5.2:德國乳腺癌研宄中接受激素治療和化學治療病人的Kaplan-Meier生存曲??線.??
本文編號:3513321
本文鏈接:http://sikaile.net/shoufeilunwen/sklbs/3513321.html
最近更新
教材專著