幾種填補(bǔ)方法的比較及在縱向數(shù)據(jù)缺失中的應(yīng)用
本文關(guān)鍵詞:幾種填補(bǔ)方法的比較及在縱向數(shù)據(jù)缺失中的應(yīng)用
更多相關(guān)文章: 填補(bǔ)方法 數(shù)據(jù)缺失 數(shù)據(jù)模擬 縱向數(shù)據(jù) 阿爾茨海默病
【摘要】:目的:利用數(shù)據(jù)模擬技術(shù)模擬不同缺失模式和不同缺失率的數(shù)據(jù)集,比較幾種填補(bǔ)方法的優(yōu)劣,,并探討其適用性。根據(jù)其適用性找出適合課題數(shù)據(jù)的填補(bǔ)方法,為進(jìn)一步的課題數(shù)據(jù)分析做準(zhǔn)備。 方法:單調(diào)缺失模式中橫斷面連續(xù)性變量缺失:采用Ad hoc法、回歸法(regression method)和趨勢(shì)得分法(propensity score method)三種方法進(jìn)行比較。單調(diào)缺失模式橫斷面分類變量缺失:采用Ad hoc法和Logistic回歸方法進(jìn)行比較。任意缺失模式橫斷面連續(xù)性變量缺失:采用期望最大化法(expectation-maximization,EM)、基于鏈?zhǔn)椒匠痰奶钛a(bǔ)(multiple imputation bychained equations,MICE)和馬爾可夫鏈蒙特卡羅(Markov Chain Monte Carlo,MCMC)三種方法進(jìn)行比較?v向數(shù)據(jù)缺失:采用LOCF(1ast observation carriedforward)法、基于鏈?zhǔn)椒匠痰奶钛a(bǔ)(MICE)和馬爾可夫鏈蒙特卡羅(MCMC)三種方法進(jìn)行比較。 結(jié)果:單調(diào)缺失模式中橫斷面連續(xù)性變量缺失:當(dāng)缺失率較低(10%)時(shí),Ad hoc法無(wú)偏性和有效性較好;當(dāng)缺失率較大時(shí),回歸法具有優(yōu)勢(shì)。單調(diào)缺失模式分類變量缺失:當(dāng)缺失率為10%~30%時(shí),logistic回歸法填補(bǔ)無(wú)偏性和有效性較好;當(dāng)缺失率30%時(shí),填補(bǔ)結(jié)果不理想。任意缺失模式連續(xù)性變量缺失:EM法在不同缺失率時(shí)均有較好的填補(bǔ)結(jié)果。縱向數(shù)據(jù)缺失:當(dāng)數(shù)據(jù)缺失率較低時(shí)采用多重填補(bǔ)中的MCMC模型填補(bǔ)方法,缺失率50%時(shí),三種方法填補(bǔ)結(jié)果均不理想。 結(jié)論:數(shù)據(jù)填補(bǔ)時(shí)需要根據(jù)不同的數(shù)據(jù)缺失率、不同的數(shù)據(jù)缺失模式和不同的數(shù)據(jù)變量缺失類型,選擇不同的填補(bǔ)方法。
【關(guān)鍵詞】:填補(bǔ)方法 數(shù)據(jù)缺失 數(shù)據(jù)模擬 縱向數(shù)據(jù) 阿爾茨海默病
【學(xué)位授予單位】:山西醫(yī)科大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2014
【分類號(hào)】:R749.16
【目錄】:
- 中文摘要6-7
- Abstract7-8
- 第一章 前言8-14
- 1.1 引言8
- 1.2 缺失機(jī)制8-10
- 1.3 缺失機(jī)制的國(guó)內(nèi)外研究現(xiàn)狀及發(fā)展趨勢(shì)10-13
- 1.4 研究目的13-14
- 第二章 缺失值處理方法的模擬研究14-34
- 2.1 模擬研究思路與內(nèi)容14
- 2.2 評(píng)價(jià)標(biāo)準(zhǔn)14
- 2.3 連續(xù)變量--單調(diào)缺失模式--橫斷面資料14-22
- 2.4 分類變量--單調(diào)缺失模式--橫斷面資料22-25
- 2.5 連續(xù)變量--任意缺失模式--橫斷面資料25-30
- 2.6 連續(xù)變量--單調(diào)缺失模式--縱向資料30-34
- 第三章 MCMC 填補(bǔ)方法在阿爾茨海默病隨訪資料中的應(yīng)用34-39
- 3.1 數(shù)據(jù)來(lái)源34
- 3.2 調(diào)查工具34
- 3.3 隨訪資料的缺失狀況34
- 3.4 MCMC 模型的推斷指標(biāo)及意義34-35
- 3.5 MCMC 法填補(bǔ)隨訪數(shù)據(jù)及分析35-37
- 3.6 MCMC 法部分填補(bǔ)結(jié)果37-38
- 3.7 小結(jié)與討論38-39
- 第四章 小結(jié)39-41
- 4.1 填補(bǔ)方法比較39
- 4.2 本研究不足39-40
- 4.3 進(jìn)一步研究計(jì)劃40-41
- 參考文獻(xiàn)41-44
- 附錄 144-46
- 附錄 246-50
- 發(fā)表學(xué)術(shù)論文50
- 個(gè)人簡(jiǎn)介50
- 參加課題50-51
- 致謝51
【相似文獻(xiàn)】
中國(guó)期刊全文數(shù)據(jù)庫(kù) 前10條
1 李容花;;正常頜與錯(cuò)頜患者第三磨牙先天缺失的比較[J];中國(guó)社區(qū)醫(yī)師(醫(yī)學(xué)專業(yè)半月刊);2009年12期
2 蔡俊;;p16蛋白的表達(dá)與結(jié)直腸癌生物學(xué)行為關(guān)系的研究[J];中國(guó)城鄉(xiāng)企業(yè)衛(wèi)生;2011年04期
3 張彬;楊麗華;果利;王鐵瑛;;大慶市錯(cuò)頜畸形青少年第三磨牙牙胚發(fā)生發(fā)育情況調(diào)查[J];齊齊哈爾醫(yī)學(xué)院學(xué)報(bào);2009年15期
4 孫衍慶,朱大雷,吳兆榮;正常青年人足背和脛后動(dòng)脈搏動(dòng)缺失的調(diào)查[J];北京醫(yī)學(xué);1984年03期
5 馬國(guó)建;卵巢癌中P53基因等位基因缺失率及突變頻譜[J];國(guó)外醫(yī)學(xué).分子生物學(xué)分冊(cè);1994年03期
6 杜愛(ài)民;吳國(guó)祥;夏景林;;胰腺癌P16基因缺失狀態(tài)研究[J];東南國(guó)防醫(yī)藥;2006年06期
7 張幼芳;;人骨骼肌線粒體DNA 4977片段缺失與年齡的相關(guān)性調(diào)查[J];法醫(yī)學(xué)雜志;2007年06期
8 努爾江·沙布開(kāi);余永強(qiáng);蔣冬貴;朱舒兵;郭雪;;可疑醫(yī)療器械不良事件報(bào)告表完整性分析[J];中國(guó)藥物警戒;2010年09期
9 馮家駿;;成人下頜第三磨牙先天性缺失的調(diào)查與分析[J];解剖學(xué)研究;1987年01期
10 蔡志明;;Y染色體及其微缺失與男性不育:過(guò)去、現(xiàn)在與將來(lái)[J];中華男科學(xué)雜志;2010年05期
中國(guó)重要會(huì)議論文全文數(shù)據(jù)庫(kù) 前10條
1 吳裕中;石一復(fù);朱雪瓊;;脆性組胺酸三體FHIT蛋白在上皮性卵巢腫瘤中表達(dá)的研究[A];中國(guó)抗癌協(xié)會(huì)婦科腫瘤專業(yè)委員會(huì)第七次全國(guó)學(xué)術(shù)會(huì)議論文匯編[C];2003年
2 李娜;陸春雪;張淑蘭;姜濤;;SEMA3B和SEMA3F基因在宮頸癌中的表達(dá)及其臨床意義[A];全國(guó)子宮頸癌暨湖北省婦科腫瘤專業(yè)委員會(huì)第五次婦科腫瘤學(xué)術(shù)會(huì)議論文匯編[C];2006年
3 徐炳森;周穎;吳丹丹;黃學(xué)鋒;葉碧綠;;男性不育患者Y染色體AZF區(qū)域微缺失的遺傳學(xué)分析[A];第二屆全國(guó)不育癥研討會(huì)論文匯編[C];2007年
4 王芹;李進(jìn);岳井銀;穆傳杰;;線粒體DNA4977bp缺失檢測(cè)腫瘤細(xì)胞輻射敏感性的初步研究[A];中國(guó)毒理學(xué)會(huì)放射毒理專業(yè)委員會(huì)第七次、中國(guó)毒理學(xué)會(huì)免疫毒理專業(yè)委員會(huì)第五次、中國(guó)環(huán)境誘變劑學(xué)會(huì)致突專業(yè)委員會(huì)第二次、中國(guó)環(huán)境誘變劑學(xué)會(huì)致畸專業(yè)委員會(huì)第二次、中國(guó)環(huán)境誘變劑學(xué)會(huì)致癌專業(yè)委員會(huì)第二次全國(guó)學(xué)術(shù)會(huì)議論文匯編[C];2008年
5 杜鴻;;抑癌基因RASSF1A在胃癌中的表達(dá)及意義[A];中華醫(yī)學(xué)會(huì)第八次全國(guó)檢驗(yàn)醫(yī)學(xué)學(xué)術(shù)會(huì)議暨中華醫(yī)學(xué)會(huì)檢驗(yàn)分會(huì)成立30周年慶典大會(huì)資料匯編[C];2009年
6 趙永平;王曉峰;白文俊;沈浣;陳曦;李國(guó)強(qiáng);;無(wú)精子癥、少精子癥患者Y染色體長(zhǎng)臂AZF區(qū)域微缺失分析[A];中華醫(yī)學(xué)會(huì)第八次全國(guó)男科學(xué)學(xué)術(shù)會(huì)議論文集[C];2007年
7 費(fèi)前進(jìn);黃學(xué)鋒;徐炳森;張李雅;李澄棣;;男性不育患者Y染色體AZF區(qū)域微缺失的遺傳學(xué)分析[A];第一屆中華醫(yī)學(xué)會(huì)生殖醫(yī)學(xué)分會(huì)、中國(guó)動(dòng)物學(xué)會(huì)生殖生物學(xué)分會(huì)聯(lián)合年會(huì)論文匯編[C];2007年
8 韓霞;王傳新;鄭桂喜;張遠(yuǎn);李偉;張建;;HLA-I類分子及CK20mRNA檢測(cè)在大腸癌發(fā)生轉(zhuǎn)移中的應(yīng)用研究[A];中華醫(yī)學(xué)會(huì)第七次全國(guó)檢驗(yàn)醫(yī)學(xué)學(xué)術(shù)會(huì)議資料匯編[C];2008年
9 王曉玫;成志強(qiáng);陶鳳華;蔡進(jìn)中;蘇學(xué)勁;王玲;;應(yīng)用FISH技術(shù)檢測(cè)原發(fā)性肺癌P53抑癌基因異常其臨床意義[A];中華醫(yī)學(xué)會(huì)病理學(xué)分會(huì)2005年學(xué)術(shù)年會(huì)論文匯編[C];2005年
10 王芹;李進(jìn);岳井銀;穆傳杰;;線粒體DNA4977bp缺失檢測(cè)腫瘤細(xì)胞輻射敏感性的初步研究[A];全國(guó)核與輻射設(shè)施退役學(xué)術(shù)研討會(huì)論文集[C];2007年
中國(guó)重要報(bào)紙全文數(shù)據(jù)庫(kù) 前10條
1 李 崢;保姆荒來(lái)了 北京人慌了[N];中國(guó)商報(bào);2005年
2 尹雪梅;“保姆荒”來(lái)了京城家政業(yè)慌了[N];工人日?qǐng)?bào);2004年
3 本報(bào)記者 王凱山;中小煤礦安全人才匱乏已成最大隱患[N];中華合作時(shí)報(bào);2008年
4 本報(bào)記者 祝振強(qiáng);“保姆荒”:根子在市場(chǎng)[N];中國(guó)勞動(dòng)保障報(bào);2005年
5 程少華;用制度和愛(ài)心留住保姆[N];人民日?qǐng)?bào);2005年
6 ;治療血癌有“鑰匙”[N];醫(yī)藥導(dǎo)報(bào);2007年
7 林果;美科學(xué)家發(fā)現(xiàn)導(dǎo)致一常見(jiàn)遺傳病基因[N];大眾科技報(bào);2001年
8 曹玲娟;白血病抑制基因找到了[N];人民日?qǐng)?bào);2007年
9 宓路平;90%杭州家裝企業(yè)身處“無(wú)資質(zhì)”窘境[N];杭州日?qǐng)?bào);2008年
10 記者 徐瑞哲;白血病抑制基因找到了[N];解放日?qǐng)?bào);2007年
中國(guó)博士學(xué)位論文全文數(shù)據(jù)庫(kù) 前10條
1 方宏亮;MLH1缺失的結(jié)直腸癌差異表達(dá)分子的篩選及其在化療抵抗中的作用[D];浙江大學(xué);2013年
2 付勇;重組腺病毒(Ad-GFP)感染胚胎大鼠神經(jīng)干細(xì)胞及耳蝸移植的實(shí)驗(yàn)研究[D];華中科技大學(xué);2007年
3 王瑞雪;Y染色體異常對(duì)男性生育的影響[D];吉林大學(xué);2011年
4 郭妍;心肌老化與非酶糖基化的相關(guān)研究[D];南京醫(yī)科大學(xué);2007年
5 崔海宏;散發(fā)性結(jié)直腸癌線粒體基因組不穩(wěn)定的研究[D];中國(guó)人民解放軍軍醫(yī)進(jìn)修學(xué)院;2009年
6 王睿;胃食管反流病流行病學(xué)調(diào)查及其缺失數(shù)據(jù)的處理方法研究[D];第二軍醫(yī)大學(xué);2009年
7 李學(xué)彥;RASSF1抑癌基因在胃癌中的表達(dá)及其啟動(dòng)子區(qū)甲基化的研究[D];中國(guó)醫(yī)科大學(xué);2007年
8 劉寶;人群自報(bào)健康的水平與分布研究[D];復(fù)旦大學(xué);2003年
9 左澤華;宮頸癌差異表達(dá)新基因抑癌功能及機(jī)制的研究[D];武漢大學(xué);2006年
10 劉禎;網(wǎng)絡(luò)處理器存儲(chǔ)子系統(tǒng)中Cache機(jī)制的研究[D];清華大學(xué);2006年
中國(guó)碩士學(xué)位論文全文數(shù)據(jù)庫(kù) 前10條
1 楊林;幾種填補(bǔ)方法的比較及在縱向數(shù)據(jù)缺失中的應(yīng)用[D];山西醫(yī)科大學(xué);2014年
2 楊德;Cache低功耗技術(shù)研究及SimpleScalar模擬器分析[D];內(nèi)蒙古大學(xué);2007年
3 花琳琳;不同缺失值處理技術(shù)的模擬比較[D];鄭州大學(xué);2012年
4 熊輝;宮頸疾病中HPV感染與E6TP1、Rap1GAP部分外顯子缺失關(guān)系的研究[D];大連醫(yī)科大學(xué);2008年
5 袁虎方;胃癌中hMSH2與PTEN表達(dá)相關(guān)性研究[D];河北醫(yī)科大學(xué);2008年
6 謝煜波;多線索環(huán)境下Cache替換及線索調(diào)度策略的研究[D];哈爾濱工業(yè)大學(xué);2006年
7 榮慶林;mtDNA4977bp缺失預(yù)測(cè)腫瘤細(xì)胞放射敏感性的體外研究[D];天津醫(yī)科大學(xué);2009年
8 王永勇;FHIT、PTEN基因在廣西壯族人群NSCLC中表達(dá)的研究[D];廣西醫(yī)科大學(xué);2009年
9 陳科;食管鱗癌中4.1B/DAL-1蛋白表達(dá)缺失研究[D];鄭州大學(xué);2007年
10 馬舒蘭;動(dòng)態(tài)二進(jìn)制翻譯中的TCache的設(shè)計(jì)與實(shí)現(xiàn)[D];上海交通大學(xué);2008年
本文編號(hào):988935
本文鏈接:http://sikaile.net/yixuelunwen/jsb/988935.html