非正態(tài)及非線性重復(fù)測量資料分析模型及其醫(yī)學(xué)應(yīng)用
發(fā)布時間:2018-04-06 05:32
本文選題:重復(fù)測量資料 切入點:廣義估計方程 出處:《山西醫(yī)科大學(xué)》2007年博士論文
【摘要】: 重復(fù)測量資料是指對同一受試對象的某個或某些指標(biāo)進(jìn)行多次觀察或測量獲得的數(shù)據(jù),在醫(yī)學(xué)研究領(lǐng)域極為多見,觀測指標(biāo)的類型也多種多樣,表現(xiàn)為定量變量,分類變量及等級變量;例如,在Ⅱ期高血壓病的療效評價中,為患者定期檢測血壓(包括舒張壓/收縮壓等)值為定量變量資料;在乳腺增生患者的治療中,定期記錄患者治療期間的變化,檢測指標(biāo)為是否有改善的二分類變量;在介入治療冠心病患者出院隨訪研究中,分別檢查并記錄出院時、出院后3月、6月和9月的療效,不同時段結(jié)局可以是痊愈、好轉(zhuǎn)、有改善、變化較小或無改變等,表現(xiàn)為等級分類變量;在一些情況下,記錄的反應(yīng)變量為計數(shù)數(shù)據(jù),如單位時間(年或月)內(nèi)癲癇發(fā)作次數(shù)。 據(jù)反應(yīng)變量與自變量參數(shù)之間的關(guān)系,又可分為線性重復(fù)測量資料模型和非線性重復(fù)測量資料模型;如定期監(jiān)測高血壓病患者的血壓值,探討患者血壓與時間變量及其它解釋變量間關(guān)系,可以用線性模型來擬合,稱其為線性重復(fù)測量資料模型:在藥動學(xué)研究中,個體口服一定劑量藥物后連續(xù)采集檢測血樣中藥物濃度,描述藥物在體內(nèi)吸收、分布、排泄的藥動學(xué)過程,大多情況下表現(xiàn)為非線性特征,如Ⅱ室模型;在HⅣ病毒動力學(xué)研究中,血液里病毒粒濃度的定量分析是檢測HⅣ感染者“病毒”路徑,描述感染特征的一種常規(guī)手段,采用系列微分方程描述免疫細(xì)胞的繁殖、感染和凋亡以及病毒顆粒的繁殖和清除等特征的變化等,均可收集到非線性重復(fù)測量資料,要描述解釋變量與反應(yīng)變量參數(shù)間的非線性關(guān)系,可構(gòu)建非線性重復(fù)測量資料模型。復(fù)發(fā)事件數(shù)據(jù)指同一個體在一段時間里多次經(jīng)歷同一事件,例如一名冠心病患者在一段時間內(nèi)經(jīng)歷多次冠心病的發(fā)作,一名癌癥患者在化、放療后再一次次經(jīng)歷復(fù)發(fā)等,該資料具有重復(fù)測量和生存分析數(shù)據(jù)的特性。上面提及的資料均不滿足經(jīng)典線性模型分析要求的正態(tài)性和線性條件。 重復(fù)測量資料線性模型理論已經(jīng)成熟,應(yīng)用也較普及,線性混合效應(yīng)模型被視為最理想的方法。它可假定方差-協(xié)方差具有某特定結(jié)構(gòu)形式,用來說明異方差性和相關(guān)性,既不像單變量分析方法那樣嚴(yán)格,也不如多變量方差分析那樣對協(xié)方差完全無約束;分析觀察時點可相等或不等,能充分利用含有完全隨機(jī)缺失觀察值的資料,建模靈活。但對于非正態(tài)及非線性重復(fù)測量資料模型分析理論及應(yīng)用目前尚處于初級階段,有待于進(jìn)一步完善相關(guān)理論,在醫(yī)學(xué)研究領(lǐng)域推廣、普及和應(yīng)用。線性混合效應(yīng)模型允許反應(yīng)變量來自指數(shù)家族任一分布,包括離散分布(如二項分布,泊松分布等)和連續(xù)分布(正態(tài)分布,beta分布和卡方分布等),用連接函數(shù)將反應(yīng)變量的均數(shù)與個體的線性預(yù)測值聯(lián)系起來,構(gòu)建廣義線性混合效應(yīng)模型(當(dāng)隨機(jī)效應(yīng)不存在時退化為廣義線性模型)和非線性混合效應(yīng)模型,用來處理非正態(tài)、非獨立二分類,等級多分類及計數(shù)重復(fù)測量資料。脆弱模型是用以描述子組中個體“生存”情況與時間之間關(guān)聯(lián)性的一種模型,將隨機(jī)效應(yīng)、變量間的聯(lián)系及未觀測到的異質(zhì)性引入到生存分析模型中,為復(fù)發(fā)事件數(shù)據(jù)高效方便的分析提供了新思路。 重復(fù)測量資料類型廣泛,醫(yī)學(xué)應(yīng)用非常多見。本文深入全面地從反應(yīng)變量的類型(定性、定量、等級變量)來探討相應(yīng)的統(tǒng)計分析模型,并進(jìn)行比較分析;從反應(yīng)變量與解釋變量參數(shù)之間的關(guān)系,系統(tǒng)探索線性模型和非線性模型。其主要內(nèi)容分七部分: 第一部分介紹重復(fù)測量資料的特性及其方差協(xié)方差結(jié)構(gòu)。 第二部分介紹線性混合效應(yīng)模型重復(fù)測量資料統(tǒng)計分析基礎(chǔ)理論。 第三部分介紹廣義估計方程(GEE)理論及其在二分類、有序多分類變量和計數(shù)重復(fù)測量資料分析中的應(yīng)用。廣義估計方程是邊際模型估計方法的一種,是在廣義線性模型和縱向數(shù)據(jù)準(zhǔn)似然估計的基礎(chǔ)上發(fā)展起來的一種擬似然估計方法,可用于非獨立重復(fù)測量數(shù)據(jù)分析:它是在未完全指明個體觀測的聯(lián)合分布,僅根據(jù)(單變量)邊際分布似然和個體重復(fù)測量向量的“作業(yè)”相關(guān)矩陣進(jìn)行參數(shù)估計的,是一種半?yún)?shù)方法。即便在時間依賴協(xié)方差矩陣誤指時,GEE方法也可得出一致和漸近的正確估計,當(dāng)反應(yīng)變量表現(xiàn)為非連續(xù)型變量(如二分類、等級或計數(shù)資料)時,GEE方法是常用得最適方法之一。 第四部分闡述廣義線性混合效應(yīng)模型(GLMMs)理論及其在二分類、多分類等級變量及其計數(shù)重復(fù)測量資料分析中的應(yīng)用。廣義線性混合效應(yīng)模型是線性混合效應(yīng)模型的自然延伸,該類模型可用于解決連續(xù)型和分類變量的縱向研究問題,GLMMs是唯一具有隨機(jī)效應(yīng)指數(shù)分布族的回歸方法,采用一個連接函數(shù)將反應(yīng)變量的均數(shù)與個體的線性預(yù)測值聯(lián)系起來;它可以用隨機(jī)效應(yīng)擬合各類型相關(guān)數(shù)據(jù)結(jié)構(gòu)模型:當(dāng)隨機(jī)效應(yīng)不存在時,廣義線性混合效應(yīng)模型就退化為廣義線性模型。 第五部分介紹非線性混合效應(yīng)模型(NLMEs)理論及其在藥物代謝動力學(xué)、二分類、等級變量及其計數(shù)重復(fù)測量資料中的應(yīng)用。非線性混合效應(yīng)模型不僅能識別與估計個體間和個體內(nèi)的變異,而且也考慮了解釋變量與反應(yīng)變量參數(shù)的非線性關(guān)系,允許固定效應(yīng)和隨機(jī)效應(yīng)進(jìn)入模型的非線性部分:反應(yīng)變量可以服從正態(tài)分布、二項分布或泊松分布;常用于處理藥代動力學(xué)、非線性生長曲線研究,也可以直接擬合二分類、等級及計數(shù)重復(fù)測量資料的非線性模型;近年在工農(nóng)業(yè)、環(huán)境和醫(yī)學(xué)界備受關(guān)注。 第六部分介紹條件脆弱模型理論及其在醫(yī)學(xué)復(fù)發(fā)事件數(shù)據(jù)分析中的應(yīng)用。脆弱模型是Cox比例風(fēng)險模型的延伸,目的是解釋由不能被觀測的協(xié)變量引起的異質(zhì)性,脆弱對基線風(fēng)險函數(shù)有乘積效應(yīng),即以乘法算子對子組內(nèi)每一個體的危險率產(chǎn)生影響。脆弱值大的子組比脆弱值值小的子組要在更短的時間內(nèi)經(jīng)歷事件的發(fā)生。一般可認(rèn)為同一子組內(nèi)個體有相同的脆弱,因此也稱為共享脆弱模型,生存時間被認(rèn)為是在共享脆弱的條件下獨立:脆弱被認(rèn)為是服從某種分布的隨機(jī)效應(yīng),常認(rèn)為服從gamma分布。條件脆弱模型將解釋觀測異質(zhì)性的隨機(jī)效應(yīng)和反映事件相依性的基本事件分層(變化的基線風(fēng)險)聯(lián)系起來,把復(fù)發(fā)事件數(shù)據(jù)過程的關(guān)鍵特征都包含在模型中,是復(fù)發(fā)事件數(shù)據(jù)擬合的理想模型。 第七部分通過對非正態(tài)、非獨立和非線性資料分析方法的介紹,進(jìn)一步闡述了廣義估計方程、廣義線性混合效應(yīng)模型和非線性混合效應(yīng)模型在醫(yī)學(xué)研究二分類、有序多分類、計數(shù)變量以及非線性重復(fù)測量資料,脆弱模型對復(fù)發(fā)事件數(shù)據(jù)等方面的分析,探討了SAS軟件和R軟件分析方法與軟件實現(xiàn),提出了實際應(yīng)用中有關(guān)模型構(gòu)建、參數(shù)估計、軟件實現(xiàn)等方面的建議與評價,為非正態(tài)、非獨立和非線性資料分析應(yīng)用提供了新思路。 文中主要采用SAS9.1.3分析軟件GENMOD、GLIMMIX和NLMIXED過程對醫(yī)學(xué)分類及非線性重復(fù)測量資料進(jìn)行了對比分析,采用免費軟件R2.4.0實現(xiàn)了臨床研究中復(fù)發(fā)事件數(shù)據(jù)的分析:運用模型理論與實例分析相結(jié)合、方法研究與軟件實現(xiàn)相結(jié)合的思路,系統(tǒng)介紹了非正態(tài)、非線性重復(fù)測量資料在模型分析與軟件中的應(yīng)用,結(jié)合實例,摸索與總結(jié)出具體應(yīng)用的技能與經(jīng)驗,系統(tǒng)闡述了非正態(tài)、非線性資料分析模型及原理,為醫(yī)學(xué)資料的分析提供了方法學(xué)基礎(chǔ),也為理論模型與軟件應(yīng)用的結(jié)合提供了條件,尤其在淡化抽象的統(tǒng)計理論,以基于理論而又高于理論的思路,突出各種方法的實際應(yīng)用方面打開了新局面,為正確運用廣義估計方程、廣義線性混合效應(yīng)模型、非線性混合效應(yīng)模型和脆弱模型提供可靠性高、準(zhǔn)確性好、信息量大的、解決實際問題可行性強(qiáng)的多元統(tǒng)計方法提出了新觀點。
[Abstract]:......
【學(xué)位授予單位】:山西醫(yī)科大學(xué)
【學(xué)位級別】:博士
【學(xué)位授予年份】:2007
【分類號】:R181.3
【引證文獻(xiàn)】
相關(guān)期刊論文 前1條
1 安勝利;張燕虹;陳征;;應(yīng)用SPSS軟件實現(xiàn)二分類重復(fù)測量資料的GEE及GLMMs分析[J];南方醫(yī)科大學(xué)學(xué)報;2012年12期
相關(guān)碩士學(xué)位論文 前3條
1 孟素艷;共享聯(lián)合脆弱模型在含終點事件冠心病復(fù)發(fā)研究中的應(yīng)用[D];山西醫(yī)科大學(xué);2012年
2 徐彥杰;廣義估計方程與多目標(biāo)遺傳算法在緩控釋制劑處方優(yōu)化中的研究[D];山西醫(yī)科大學(xué);2012年
3 王晶晶;非獨立生存數(shù)據(jù)正則穩(wěn)態(tài)脆弱模型分析及應(yīng)用[D];山西醫(yī)科大學(xué);2012年
,本文編號:1718195
本文鏈接:http://sikaile.net/yixuelunwen/liuxingb/1718195.html
最近更新
教材專著