幾種填補(bǔ)方法的比較及在縱向數(shù)據(jù)缺失中的應(yīng)用
本文關(guān)鍵詞:幾種填補(bǔ)方法的比較及在縱向數(shù)據(jù)缺失中的應(yīng)用
更多相關(guān)文章: 填補(bǔ)方法 數(shù)據(jù)缺失 數(shù)據(jù)模擬 縱向數(shù)據(jù) 阿爾茨海默病
【摘要】:目的:利用數(shù)據(jù)模擬技術(shù)模擬不同缺失模式和不同缺失率的數(shù)據(jù)集,比較幾種填補(bǔ)方法的優(yōu)劣,,并探討其適用性。根據(jù)其適用性找出適合課題數(shù)據(jù)的填補(bǔ)方法,為進(jìn)一步的課題數(shù)據(jù)分析做準(zhǔn)備。 方法:單調(diào)缺失模式中橫斷面連續(xù)性變量缺失:采用Ad hoc法、回歸法(regression method)和趨勢得分法(propensity score method)三種方法進(jìn)行比較。單調(diào)缺失模式橫斷面分類變量缺失:采用Ad hoc法和Logistic回歸方法進(jìn)行比較。任意缺失模式橫斷面連續(xù)性變量缺失:采用期望最大化法(expectation-maximization,EM)、基于鏈?zhǔn)椒匠痰奶钛a(bǔ)(multiple imputation bychained equations,MICE)和馬爾可夫鏈蒙特卡羅(Markov Chain Monte Carlo,MCMC)三種方法進(jìn)行比較。縱向數(shù)據(jù)缺失:采用LOCF(1ast observation carriedforward)法、基于鏈?zhǔn)椒匠痰奶钛a(bǔ)(MICE)和馬爾可夫鏈蒙特卡羅(MCMC)三種方法進(jìn)行比較。 結(jié)果:單調(diào)缺失模式中橫斷面連續(xù)性變量缺失:當(dāng)缺失率較低(10%)時,Ad hoc法無偏性和有效性較好;當(dāng)缺失率較大時,回歸法具有優(yōu)勢。單調(diào)缺失模式分類變量缺失:當(dāng)缺失率為10%~30%時,logistic回歸法填補(bǔ)無偏性和有效性較好;當(dāng)缺失率30%時,填補(bǔ)結(jié)果不理想。任意缺失模式連續(xù)性變量缺失:EM法在不同缺失率時均有較好的填補(bǔ)結(jié)果�?v向數(shù)據(jù)缺失:當(dāng)數(shù)據(jù)缺失率較低時采用多重填補(bǔ)中的MCMC模型填補(bǔ)方法,缺失率50%時,三種方法填補(bǔ)結(jié)果均不理想。 結(jié)論:數(shù)據(jù)填補(bǔ)時需要根據(jù)不同的數(shù)據(jù)缺失率、不同的數(shù)據(jù)缺失模式和不同的數(shù)據(jù)變量缺失類型,選擇不同的填補(bǔ)方法。
【關(guān)鍵詞】:填補(bǔ)方法 數(shù)據(jù)缺失 數(shù)據(jù)模擬 縱向數(shù)據(jù) 阿爾茨海默病
【學(xué)位授予單位】:山西醫(yī)科大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2014
【分類號】:R749.16
【目錄】:
- 中文摘要6-7
- Abstract7-8
- 第一章 前言8-14
- 1.1 引言8
- 1.2 缺失機(jī)制8-10
- 1.3 缺失機(jī)制的國內(nèi)外研究現(xiàn)狀及發(fā)展趨勢10-13
- 1.4 研究目的13-14
- 第二章 缺失值處理方法的模擬研究14-34
- 2.1 模擬研究思路與內(nèi)容14
- 2.2 評價標(biāo)準(zhǔn)14
- 2.3 連續(xù)變量--單調(diào)缺失模式--橫斷面資料14-22
- 2.4 分類變量--單調(diào)缺失模式--橫斷面資料22-25
- 2.5 連續(xù)變量--任意缺失模式--橫斷面資料25-30
- 2.6 連續(xù)變量--單調(diào)缺失模式--縱向資料30-34
- 第三章 MCMC 填補(bǔ)方法在阿爾茨海默病隨訪資料中的應(yīng)用34-39
- 3.1 數(shù)據(jù)來源34
- 3.2 調(diào)查工具34
- 3.3 隨訪資料的缺失狀況34
- 3.4 MCMC 模型的推斷指標(biāo)及意義34-35
- 3.5 MCMC 法填補(bǔ)隨訪數(shù)據(jù)及分析35-37
- 3.6 MCMC 法部分填補(bǔ)結(jié)果37-38
- 3.7 小結(jié)與討論38-39
- 第四章 小結(jié)39-41
- 4.1 填補(bǔ)方法比較39
- 4.2 本研究不足39-40
- 4.3 進(jìn)一步研究計劃40-41
- 參考文獻(xiàn)41-44
- 附錄 144-46
- 附錄 246-50
- 發(fā)表學(xué)術(shù)論文50
- 個人簡介50
- 參加課題50-51
- 致謝51
【相似文獻(xiàn)】
中國期刊全文數(shù)據(jù)庫 前10條
1 李容花;;正常頜與錯頜患者第三磨牙先天缺失的比較[J];中國社區(qū)醫(yī)師(醫(yī)學(xué)專業(yè)半月刊);2009年12期
2 蔡俊;;p16蛋白的表達(dá)與結(jié)直腸癌生物學(xué)行為關(guān)系的研究[J];中國城鄉(xiāng)企業(yè)衛(wèi)生;2011年04期
3 張彬;楊麗華;果利;王鐵瑛;;大慶市錯頜畸形青少年第三磨牙牙胚發(fā)生發(fā)育情況調(diào)查[J];齊齊哈爾醫(yī)學(xué)院學(xué)報;2009年15期
4 孫衍慶,朱大雷,吳兆榮;正常青年人足背和脛后動脈搏動缺失的調(diào)查[J];北京醫(yī)學(xué);1984年03期
5 馬國建;卵巢癌中P53基因等位基因缺失率及突變頻譜[J];國外醫(yī)學(xué).分子生物學(xué)分冊;1994年03期
6 杜愛民;吳國祥;夏景林;;胰腺癌P16基因缺失狀態(tài)研究[J];東南國防醫(yī)藥;2006年06期
7 張幼芳;;人骨骼肌線粒體DNA 4977片段缺失與年齡的相關(guān)性調(diào)查[J];法醫(yī)學(xué)雜志;2007年06期
8 努爾江·沙布開;余永強(qiáng);蔣冬貴;朱舒兵;郭雪;;可疑醫(yī)療器械不良事件報告表完整性分析[J];中國藥物警戒;2010年09期
9 馮家駿;;成人下頜第三磨牙先天性缺失的調(diào)查與分析[J];解剖學(xué)研究;1987年01期
10 蔡志明;;Y染色體及其微缺失與男性不育:過去、現(xiàn)在與將來[J];中華男科學(xué)雜志;2010年05期
中國重要會議論文全文數(shù)據(jù)庫 前10條
1 吳裕中;石一復(fù);朱雪瓊;;脆性組胺酸三體FHIT蛋白在上皮性卵巢腫瘤中表達(dá)的研究[A];中國抗癌協(xié)會婦科腫瘤專業(yè)委員會第七次全國學(xué)術(shù)會議論文匯編[C];2003年
2 李娜;陸春雪;張淑蘭;姜濤;;SEMA3B和SEMA3F基因在宮頸癌中的表達(dá)及其臨床意義[A];全國子宮頸癌暨湖北省婦科腫瘤專業(yè)委員會第五次婦科腫瘤學(xué)術(shù)會議論文匯編[C];2006年
3 徐炳森;周穎;吳丹丹;黃學(xué)鋒;葉碧綠;;男性不育患者Y染色體AZF區(qū)域微缺失的遺傳學(xué)分析[A];第二屆全國不育癥研討會論文匯編[C];2007年
4 王芹;李進(jìn);岳井銀;穆傳杰;;線粒體DNA4977bp缺失檢測腫瘤細(xì)胞輻射敏感性的初步研究[A];中國毒理學(xué)會放射毒理專業(yè)委員會第七次、中國毒理學(xué)會免疫毒理專業(yè)委員會第五次、中國環(huán)境誘變劑學(xué)會致突專業(yè)委員會第二次、中國環(huán)境誘變劑學(xué)會致畸專業(yè)委員會第二次、中國環(huán)境誘變劑學(xué)會致癌專業(yè)委員會第二次全國學(xué)術(shù)會議論文匯編[C];2008年
5 杜鴻;;抑癌基因RASSF1A在胃癌中的表達(dá)及意義[A];中華醫(yī)學(xué)會第八次全國檢驗醫(yī)學(xué)學(xué)術(shù)會議暨中華醫(yī)學(xué)會檢驗分會成立30周年慶典大會資料匯編[C];2009年
6 趙永平;王曉峰;白文俊;沈浣;陳曦;李國強(qiáng);;無精子癥、少精子癥患者Y染色體長臂AZF區(qū)域微缺失分析[A];中華醫(yī)學(xué)會第八次全國男科學(xué)學(xué)術(shù)會議論文集[C];2007年
7 費前進(jìn);黃學(xué)鋒;徐炳森;張李雅;李澄棣;;男性不育患者Y染色體AZF區(qū)域微缺失的遺傳學(xué)分析[A];第一屆中華醫(yī)學(xué)會生殖醫(yī)學(xué)分會、中國動物學(xué)會生殖生物學(xué)分會聯(lián)合年會論文匯編[C];2007年
8 韓霞;王傳新;鄭桂喜;張遠(yuǎn);李偉;張建;;HLA-I類分子及CK20mRNA檢測在大腸癌發(fā)生轉(zhuǎn)移中的應(yīng)用研究[A];中華醫(yī)學(xué)會第七次全國檢驗醫(yī)學(xué)學(xué)術(shù)會議資料匯編[C];2008年
9 王曉玫;成志強(qiáng);陶鳳華;蔡進(jìn)中;蘇學(xué)勁;王玲;;應(yīng)用FISH技術(shù)檢測原發(fā)性肺癌P53抑癌基因異常其臨床意義[A];中華醫(yī)學(xué)會病理學(xué)分會2005年學(xué)術(shù)年會論文匯編[C];2005年
10 王芹;李進(jìn);岳井銀;穆傳杰;;線粒體DNA4977bp缺失檢測腫瘤細(xì)胞輻射敏感性的初步研究[A];全國核與輻射設(shè)施退役學(xué)術(shù)研討會論文集[C];2007年
中國重要報紙全文數(shù)據(jù)庫 前10條
1 李 崢;保姆荒來了 北京人慌了[N];中國商報;2005年
2 尹雪梅;“保姆荒”來了京城家政業(yè)慌了[N];工人日報;2004年
3 本報記者 王凱山;中小煤礦安全人才匱乏已成最大隱患[N];中華合作時報;2008年
4 本報記者 祝振強(qiáng);“保姆荒”:根子在市場[N];中國勞動保障報;2005年
5 程少華;用制度和愛心留住保姆[N];人民日報;2005年
6 ;治療血癌有“鑰匙”[N];醫(yī)藥導(dǎo)報;2007年
7 林果;美科學(xué)家發(fā)現(xiàn)導(dǎo)致一常見遺傳病基因[N];大眾科技報;2001年
8 曹玲娟;白血病抑制基因找到了[N];人民日報;2007年
9 宓路平;90%杭州家裝企業(yè)身處“無資質(zhì)”窘境[N];杭州日報;2008年
10 記者 徐瑞哲;白血病抑制基因找到了[N];解放日報;2007年
中國博士學(xué)位論文全文數(shù)據(jù)庫 前10條
1 方宏亮;MLH1缺失的結(jié)直腸癌差異表達(dá)分子的篩選及其在化療抵抗中的作用[D];浙江大學(xué);2013年
2 付勇;重組腺病毒(Ad-GFP)感染胚胎大鼠神經(jīng)干細(xì)胞及耳蝸移植的實驗研究[D];華中科技大學(xué);2007年
3 王瑞雪;Y染色體異常對男性生育的影響[D];吉林大學(xué);2011年
4 郭妍;心肌老化與非酶糖基化的相關(guān)研究[D];南京醫(yī)科大學(xué);2007年
5 崔海宏;散發(fā)性結(jié)直腸癌線粒體基因組不穩(wěn)定的研究[D];中國人民解放軍軍醫(yī)進(jìn)修學(xué)院;2009年
6 王睿;胃食管反流病流行病學(xué)調(diào)查及其缺失數(shù)據(jù)的處理方法研究[D];第二軍醫(yī)大學(xué);2009年
7 李學(xué)彥;RASSF1抑癌基因在胃癌中的表達(dá)及其啟動子區(qū)甲基化的研究[D];中國醫(yī)科大學(xué);2007年
8 劉寶;人群自報健康的水平與分布研究[D];復(fù)旦大學(xué);2003年
9 左澤華;宮頸癌差異表達(dá)新基因抑癌功能及機(jī)制的研究[D];武漢大學(xué);2006年
10 劉禎;網(wǎng)絡(luò)處理器存儲子系統(tǒng)中Cache機(jī)制的研究[D];清華大學(xué);2006年
中國碩士學(xué)位論文全文數(shù)據(jù)庫 前10條
1 楊林;幾種填補(bǔ)方法的比較及在縱向數(shù)據(jù)缺失中的應(yīng)用[D];山西醫(yī)科大學(xué);2014年
2 楊德;Cache低功耗技術(shù)研究及SimpleScalar模擬器分析[D];內(nèi)蒙古大學(xué);2007年
3 花琳琳;不同缺失值處理技術(shù)的模擬比較[D];鄭州大學(xué);2012年
4 熊輝;宮頸疾病中HPV感染與E6TP1、Rap1GAP部分外顯子缺失關(guān)系的研究[D];大連醫(yī)科大學(xué);2008年
5 袁虎方;胃癌中hMSH2與PTEN表達(dá)相關(guān)性研究[D];河北醫(yī)科大學(xué);2008年
6 謝煜波;多線索環(huán)境下Cache替換及線索調(diào)度策略的研究[D];哈爾濱工業(yè)大學(xué);2006年
7 榮慶林;mtDNA4977bp缺失預(yù)測腫瘤細(xì)胞放射敏感性的體外研究[D];天津醫(yī)科大學(xué);2009年
8 王永勇;FHIT、PTEN基因在廣西壯族人群NSCLC中表達(dá)的研究[D];廣西醫(yī)科大學(xué);2009年
9 陳科;食管鱗癌中4.1B/DAL-1蛋白表達(dá)缺失研究[D];鄭州大學(xué);2007年
10 馬舒蘭;動態(tài)二進(jìn)制翻譯中的TCache的設(shè)計與實現(xiàn)[D];上海交通大學(xué);2008年
本文編號:988935
本文鏈接:http://sikaile.net/yixuelunwen/jsb/988935.html