誤調(diào)整工具變量的后果及多個(gè)工具變量聯(lián)合應(yīng)用的研究
發(fā)布時(shí)間:2020-03-21 09:48
【摘要】:在流行病學(xué)研究中,混雜因素是導(dǎo)致因果效應(yīng)估計(jì)偏倚的重要原因。調(diào)整混雜因素時(shí),由于混雜因素與工具變量在統(tǒng)計(jì)學(xué)特征上難以區(qū)分,容易誤把工具變量當(dāng)作混雜因素進(jìn)行調(diào)整。已有研究認(rèn)為,誤調(diào)整工具變量會(huì)增大效應(yīng)估計(jì)的偏倚和方差,但這類研究大多僅限于理論框架研究或?qū)性模型的研究。為此,本文在設(shè)定所有變量均為二分類變量的情況下,基于logistic回歸分析模型統(tǒng)計(jì)模擬,探討回歸調(diào)整標(biāo)準(zhǔn)工具變量、近似工具變量(與暴露強(qiáng)相關(guān),且與結(jié)局通過(guò)混雜因素間接相關(guān),即與混雜因素相關(guān)的工具變量)、混雜因素(即與結(jié)局直接相關(guān)的工具變量)的不同后果,以及調(diào)整工具變量對(duì)選擇性偏倚的影響。對(duì)于角色十分清楚的工具變量,統(tǒng)計(jì)分析時(shí)采用工具變量法可準(zhǔn)確估計(jì)真實(shí)因果效應(yīng),比如孟德?tīng)栯S機(jī)化分析,就是以基因變異作為工具變量來(lái)估計(jì)因果效應(yīng)的。由于單個(gè)基因變異通常只能夠解釋暴露的少量信息,孟德?tīng)栯S機(jī)化分析通常需要大樣本來(lái)提高檢驗(yàn)效能。有報(bào)道指出,應(yīng)用多個(gè)基因變異作為工具變量能夠提高效應(yīng)估計(jì)的準(zhǔn)確度,但多個(gè)基因變異作為工具變量的聯(lián)合應(yīng)用方法仍不夠明確。本文設(shè)定暴露因素和結(jié)局均為連續(xù)型變量,且變量間均呈線性關(guān)系,采用兩階段最小二乘回歸模型模擬試驗(yàn),分析比較多個(gè)基因變異聯(lián)合應(yīng)用的不同策略對(duì)效應(yīng)估計(jì)偏倚和精確性的影響。在實(shí)際數(shù)據(jù)分析中,分別用調(diào)整工具變量和不調(diào)整工具變量的兩個(gè)logistic回歸模型分析BMI與高血壓的關(guān)系,據(jù)此評(píng)價(jià)誤調(diào)整工具變量對(duì)因果效應(yīng)估計(jì)的影響;分別使用不同策略聯(lián)合應(yīng)用多個(gè)基變異工具變量來(lái)分析BMI與收縮壓/舒張壓的關(guān)系,據(jù)此評(píng)價(jià)不同策略對(duì)因果效應(yīng)估計(jì)的差異。研究結(jié)果:1.(1)調(diào)整完全符合假設(shè)條件的標(biāo)準(zhǔn)工具變量會(huì)放大混雜偏倚,且使效應(yīng)估計(jì)的標(biāo)準(zhǔn)誤變大,但增大的程度通常較小。(2)調(diào)整近似工具變量對(duì)因果效應(yīng)估計(jì)值的影響,取決于其與混雜因素關(guān)聯(lián)性的強(qiáng)弱:若相關(guān)關(guān)系弱,則對(duì)其調(diào)整會(huì)增大效應(yīng)估計(jì)的偏倚;若相關(guān)性增強(qiáng),則對(duì)其調(diào)整會(huì)降低因果效應(yīng)估計(jì)的偏倚。(3)直接影響結(jié)局的工具變量,亦即混雜因素,對(duì)其調(diào)整會(huì)降低因果效應(yīng)估計(jì)的偏倚。(4)不存在混雜偏倚時(shí),調(diào)整工具變量不會(huì)影響選擇性偏倚。2.(1)當(dāng)SNP為強(qiáng)工具變量時(shí),使用單個(gè)工具變量即可獲得接近無(wú)偏的效應(yīng)估計(jì)值;增加SNP個(gè)數(shù),能使效應(yīng)估計(jì)的標(biāo)準(zhǔn)誤變小;SNPs間的連鎖不平衡(LD)狀態(tài)不會(huì)明顯地影響暴露對(duì)結(jié)局的因果效應(yīng)估計(jì)。(2)當(dāng)所選SNPs中存在弱工具變量時(shí),應(yīng)用單個(gè)弱工具變量會(huì)產(chǎn)生弱工具變量偏倚;且SNPs間的LD越強(qiáng),效應(yīng)估計(jì)的偏倚越小。應(yīng)用多個(gè)SNPs工具變量,或聯(lián)合應(yīng)用多個(gè)基因變異作為單一工具變量,能夠在一定程度上減小弱工具變量偏倚,提高效應(yīng)估計(jì)的精確性;诩訖(quán)等位基因得分的兩階段最小二乘模型,優(yōu)于基于等位基因得分和基于主成分分析的兩階段最小二乘模型,且以第一主成分作工具變量的方法不適用于LD較低的情境。3.在實(shí)際數(shù)據(jù)分析中,(1)相較于不調(diào)整工具變量所得BMI對(duì)高血壓的估計(jì)值,調(diào)整工具變量所得的效應(yīng)估計(jì)值略小,但相差很小。(2)應(yīng)用孟德?tīng)栯S機(jī)化分析所得的BMI對(duì)收縮壓/舒張壓的效應(yīng)估計(jì)值均大于普通線性回歸所得的效應(yīng)估計(jì)值;增加工具變量的個(gè)數(shù),可以降低效應(yīng)估計(jì)的標(biāo)準(zhǔn)誤;以多個(gè)SNPs的等位基因得分、加權(quán)等位基因得分和第一主成分作為工具變量進(jìn)行孟德?tīng)栯S機(jī)化分析的三種方法所得的效應(yīng)估計(jì)值相近,與本研究的模擬結(jié)果一致。研究結(jié)論:1.當(dāng)所調(diào)整的工具變量與暴露和結(jié)局的相關(guān)性強(qiáng)弱不同時(shí),調(diào)整工具變量對(duì)效應(yīng)估計(jì)偏倚的放大、減小是不一定的。在選擇協(xié)變量做回歸調(diào)整時(shí),應(yīng)依據(jù)其與結(jié)局之間關(guān)聯(lián)程度的強(qiáng)弱,而非僅依據(jù)其與暴露之間關(guān)聯(lián)程度的強(qiáng)弱選擇。首先,不應(yīng)調(diào)整符合標(biāo)準(zhǔn)工具變量條件的協(xié)變量,以避免增大效應(yīng)估計(jì)偏倚。其次,與結(jié)局有強(qiáng)相關(guān)關(guān)系的協(xié)變量更有可能是混雜因素而非工具變量,應(yīng)放在回歸方程中加以調(diào)整,以減少混雜偏倚。總體來(lái)說(shuō),誤調(diào)整工具變量所致的效應(yīng)估計(jì)偏倚增大幅度較小。所以當(dāng)所有變量均為二分類變量時(shí),如果研究者不能明確變量間的因果結(jié)構(gòu),在成本和誤差允許的范圍內(nèi),更推薦冒著誤調(diào)整工具變量的風(fēng)險(xiǎn)來(lái)控制可能的混雜偏倚。2.當(dāng)SNP為強(qiáng)工具變量時(shí),使用單個(gè)工具變量即可。當(dāng)所選SNPs中存在弱工具變量,建議使用多個(gè)SNPs工具變量或聯(lián)合應(yīng)用多個(gè)基因變異作為單一工具變量并使用加權(quán)等位基因得分法。效應(yīng)估計(jì)偏倚受SNPs間LD強(qiáng)度的影響,強(qiáng)度越強(qiáng),效應(yīng)估計(jì)的偏倚越小。3.實(shí)際數(shù)據(jù)分析結(jié)果與模擬結(jié)果一致,誤調(diào)整工具變量會(huì)使得因果效應(yīng)估計(jì)值產(chǎn)生偏差,但偏差較小;以多個(gè)SNPs的等位基因得分、加權(quán)等位基因得分和第一主成分作為工具變量進(jìn)行孟德?tīng)栯S機(jī)化分析的結(jié)果相近。
【圖文】:
圖4圖模型l中變化Z-X問(wèn)OR值、Z生成概率及樣本量時(shí)估計(jì)值的偏倚和標(biāo)準(zhǔn)誤逡逑3.1.1.2因果圖模型2逡逑此情境中,Z」:j混雜U之間有直接關(guān)聯(lián),稱Z為近似混雜,圖5、圖6展承逡逑
圖5圖模型2中變化Z-義間OR值、Z-f;間OR值時(shí)估計(jì)值的偏倚和標(biāo)準(zhǔn)誤逡逑(3)固定參數(shù)C0=ln2、C,=ln2、C2邋=邋ln2、C3邋=邋ln3、q邋=邋ln2,,變化邋Z=1邋的逡逑概率盡從0.1到0.5,圖6邋(a)和6邋(b)表明的變化不會(huì)影響效應(yīng)估計(jì)的偏逡逑倚和標(biāo)準(zhǔn)誤。圖6邋(c)、6邋(d)表明,調(diào)整Z對(duì)效應(yīng)估計(jì)偏倚的放大程度不會(huì)隨逡逑樣本量的變化而變化
【學(xué)位授予單位】:山東大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2018
【分類號(hào)】:R181
本文編號(hào):2593152
【圖文】:
圖4圖模型l中變化Z-X問(wèn)OR值、Z生成概率及樣本量時(shí)估計(jì)值的偏倚和標(biāo)準(zhǔn)誤逡逑3.1.1.2因果圖模型2逡逑此情境中,Z」:j混雜U之間有直接關(guān)聯(lián),稱Z為近似混雜,圖5、圖6展承逡逑
圖5圖模型2中變化Z-義間OR值、Z-f;間OR值時(shí)估計(jì)值的偏倚和標(biāo)準(zhǔn)誤逡逑(3)固定參數(shù)C0=ln2、C,=ln2、C2邋=邋ln2、C3邋=邋ln3、q邋=邋ln2,,變化邋Z=1邋的逡逑概率盡從0.1到0.5,圖6邋(a)和6邋(b)表明的變化不會(huì)影響效應(yīng)估計(jì)的偏逡逑倚和標(biāo)準(zhǔn)誤。圖6邋(c)、6邋(d)表明,調(diào)整Z對(duì)效應(yīng)估計(jì)偏倚的放大程度不會(huì)隨逡逑樣本量的變化而變化
【學(xué)位授予單位】:山東大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2018
【分類號(hào)】:R181
【參考文獻(xiàn)】
相關(guān)期刊論文 前1條
1 陳民志;程廣輝;馬龍;王慧;邱熔芳;薛付忠;劉奇跡;;TNFSF4基因與冠心病的關(guān)聯(lián)研究[J];遺傳;2011年03期
本文編號(hào):2593152
本文鏈接:http://sikaile.net/yixuelunwen/yufangyixuelunwen/2593152.html
最近更新
教材專著