縱向數(shù)據(jù)缺失處理對分析模型影響的研究
本文關(guān)鍵詞:縱向數(shù)據(jù)缺失處理對分析模型影響的研究
更多相關(guān)文章: 數(shù)據(jù)缺失 縱向數(shù)據(jù) 重復(fù)測量方差分析 多重插補 混合回歸模型
【摘要】:縱向數(shù)據(jù)的提出將數(shù)據(jù)模型研究推到了一個新的領(lǐng)域,縱向數(shù)據(jù)模型成為統(tǒng)計學(xué)在理論研究和實際應(yīng)用中探究的重要課題。由于縱向數(shù)據(jù)結(jié)合了時間序列數(shù)據(jù)和橫截面數(shù)據(jù)的特性,不僅體現(xiàn)了樣本的時間變化趨勢,還將樣本的組內(nèi)差異和組間差異更充分地表示出來。在相關(guān)領(lǐng)域的研究中為獲得全面的分析需要變換時間和場合對同一對象進(jìn)行重復(fù)觀測來獲取縱向數(shù)據(jù)。但由于獲取資料所需的時間較長,實驗條件變化較多,數(shù)據(jù)缺失經(jīng)常發(fā)生。醫(yī)學(xué)統(tǒng)計和生物統(tǒng)計的縱向研究中就常會遇到由于被觀測個體的身體不適或不便、移居外地或?qū)ρ芯坎辉俑信d趣等原因,不能按照事先規(guī)定的時間接受調(diào)查;甚至有的會退出研究,造成數(shù)據(jù)缺失。 縱向數(shù)據(jù)中的數(shù)據(jù)缺失可能會發(fā)生在觀測時間內(nèi)的任一時間點,連續(xù)時間變化趨勢下的統(tǒng)計分析就會受到影響。數(shù)據(jù)缺失會破壞數(shù)據(jù)的完整性,影響數(shù)據(jù)的可用性,違背數(shù)據(jù)分析模型的假定,導(dǎo)致相應(yīng)的統(tǒng)計分析結(jié)果出現(xiàn)不同程度的偏差,降低結(jié)果的準(zhǔn)確性和精度,給研究問題的解釋帶來困惑,影響整個數(shù)據(jù)研究工作的質(zhì)量。 在含缺失縱向數(shù)據(jù)的實際分析中,為簡化問題的復(fù)雜性,往往采用刪除缺失的完整觀測數(shù)據(jù)。這在一定程度上減少了統(tǒng)計分析的樣本量,而且是許多統(tǒng)計分析軟件處理數(shù)據(jù)缺失的默認(rèn)方法。但是,這種方法只有在數(shù)據(jù)是完全隨機(jī)缺失,并且缺失單元與其他被觀測單元不存在顯著差異時才能給出合理的估計結(jié)果;否則,可能降低估計量的精度,甚至導(dǎo)致估計量與真值偏離較大,使得統(tǒng)計分析結(jié)果出現(xiàn)嚴(yán)重偏差。數(shù)據(jù)缺失的處理對模型分析具有重要的意義。 本文探討縱向數(shù)據(jù)缺失的處理方法對分析模型的影響。選取了健康相關(guān)生活質(zhì)量的實際數(shù)據(jù)(參見Gjeilo等,2008),對刪除缺失的完整觀測分析結(jié)果與數(shù)據(jù)缺失處理之后的統(tǒng)計分析結(jié)果進(jìn)行了比較。EM算法和鏈?zhǔn)椒匠潭嘀夭逖a法的實際結(jié)果顯示,鏈?zhǔn)椒匠潭嘀夭逖a法的效果優(yōu)于其它插補方法。針對鏈?zhǔn)椒匠潭嘀夭逖a的數(shù)據(jù)集合,給出了縱向數(shù)據(jù)的幾種常用模型的分析結(jié)果,并進(jìn)行了比較分析。結(jié)果顯示,在處理縱向數(shù)據(jù)缺失時,插補法可以更合理地利用數(shù)據(jù)信息。對含插補值數(shù)據(jù)集合的分析,要依據(jù)相應(yīng)選用的統(tǒng)計模型以得到更合理的統(tǒng)計分析結(jié)果。
【關(guān)鍵詞】:數(shù)據(jù)缺失 縱向數(shù)據(jù) 重復(fù)測量方差分析 多重插補 混合回歸模型
【學(xué)位授予單位】:天津財經(jīng)大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2013
【分類號】:C81
【目錄】:
- 內(nèi)容摘要4-5
- Abstract5-7
- 目錄7-8
- 第1章 導(dǎo)論8-13
- 1.1 本文研究背景及目的8-9
- 1.3 相關(guān)研究文獻(xiàn)綜述9-12
- 1.4 論文結(jié)構(gòu)和創(chuàng)新之處12-13
- 第2章 數(shù)據(jù)缺失處理13-25
- 2.1 數(shù)據(jù)缺失的產(chǎn)生原因13-14
- 2.2 數(shù)據(jù)缺失的分類14-17
- 2.3 數(shù)據(jù)缺失的處理方法17-25
- 第3章 常用縱向數(shù)據(jù)分析模型25-42
- 3.1 重復(fù)測量方差分析模型26-30
- 3.2 混合回歸模型30-36
- 3.3 協(xié)方差模式模型36-39
- 3.4 離散結(jié)果變量分析模型39-42
- 第4章 健康相關(guān)生活質(zhì)量縱向數(shù)據(jù)的實證分析42-67
- 4.1 健康相關(guān)生活質(zhì)量的縱向數(shù)據(jù)42-45
- 4.2 基于直接刪除法的統(tǒng)計分析45-52
- 4.3 基于插補集合的統(tǒng)計分析52-60
- 4.4 多重插補集合下混合回歸模型分析60-63
- 4.5 多重插補集合下常用分析模型比較63-67
- 第5章 總結(jié)67-69
- 參考文獻(xiàn)69-73
- 后記73
【參考文獻(xiàn)】
中國期刊全文數(shù)據(jù)庫 前10條
1 李薇;統(tǒng)計調(diào)查中的數(shù)據(jù)缺失及處理[J];商業(yè)研究;2003年06期
2 茅群霞,李曉松;多重填補法Markov Chain Monte Carlo模型在有缺失值的婦幼衛(wèi)生縱向數(shù)據(jù)中的應(yīng)用[J];四川大學(xué)學(xué)報(醫(yī)學(xué)版);2005年03期
3 薛留根;朱力行;;縱向數(shù)據(jù)下部分線性模型的經(jīng)驗似然推斷[J];中國科學(xué)(A輯:數(shù)學(xué));2007年01期
4 曹陽,謝萬軍,張羅漫;多重填補的方法及其統(tǒng)計推斷原理[J];中國醫(yī)院統(tǒng)計;2003年02期
5 金勇進(jìn);調(diào)查中的數(shù)據(jù)缺失及處理(Ⅰ)——缺失數(shù)據(jù)及其影響[J];數(shù)理統(tǒng)計與管理;2001年01期
6 金勇進(jìn);缺失數(shù)據(jù)的插補調(diào)整[J];數(shù)理統(tǒng)計與管理;2001年06期
7 楊軍;趙宇;丁文興;;抽樣調(diào)查中缺失數(shù)據(jù)的插補方法[J];數(shù)理統(tǒng)計與管理;2008年05期
8 王大榮;張忠占;;線性回歸模型中變量選擇方法綜述[J];數(shù)理統(tǒng)計與管理;2010年04期
9 龐新生;多重插補處理缺失數(shù)據(jù)方法的理論基礎(chǔ)探析[J];統(tǒng)計與決策;2005年04期
10 龐新生;;缺失數(shù)據(jù)處理方法的比較[J];統(tǒng)計與決策;2010年24期
,本文編號:974582
本文鏈接:http://sikaile.net/shekelunwen/shgj/974582.html