天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

logistic回歸模型在流行病學(xué)病因分析中的偏性及其改進(jìn)策略研究

發(fā)布時(shí)間:2020-07-30 04:17
【摘要】:背景:探討疾病危險(xiǎn)因素進(jìn)而推斷疾病病因是流行病學(xué)的永恒主題,也是預(yù)防醫(yī)學(xué)實(shí)踐中的主要任務(wù)。然而,目前常用的大多數(shù)統(tǒng)計(jì)方法多是從關(guān)聯(lián)分析入手,通過(guò)相關(guān)關(guān)系逼近因果關(guān)系,在分析過(guò)程中常常忽略混雜因素的影響,從而導(dǎo)致因果效應(yīng)的錯(cuò)誤估計(jì)。雖然,流行病學(xué)家已經(jīng)提出了一系列控制混雜偏倚的策略方法,包括:限制、分層、調(diào)整。但如何正確應(yīng)用這些策略方法,借助常規(guī)的統(tǒng)計(jì)關(guān)聯(lián)分析有效地控制混雜偏倚,一直是困擾分析流行病學(xué)研究的難題。logistic回歸模型是流行病學(xué)病因分析中最為普遍的方法。事實(shí)上,logistic回歸模型的估計(jì)值在本質(zhì)上是關(guān)聯(lián)分析層面的條件概率,所得到的因果效應(yīng)估計(jì)值往往有偏。因此,如何正確使用logistic回歸模型以準(zhǔn)確估計(jì)暴露對(duì)結(jié)局的真實(shí)因果效應(yīng)是病因分析中需要解決的重要問(wèn)題。此外,由于納入回歸模型的變量集不同,得到的因果效應(yīng)估計(jì)值也會(huì)不同;隨著調(diào)整變量個(gè)數(shù)的增加,因果效應(yīng)估計(jì)的精確性也會(huì)受到影響。因此,如何選擇最優(yōu)調(diào)整變量集,以準(zhǔn)確估計(jì)暴露對(duì)結(jié)局的因果效應(yīng),也是logistic回歸分析中需解決的關(guān)鍵問(wèn)題。方法:本文針對(duì)傳統(tǒng)logistic回歸模型估計(jì)偏性和最優(yōu)調(diào)整混雜集的選擇問(wèn)題,采用了統(tǒng)計(jì)模擬研究、理論推導(dǎo)證明和實(shí)際數(shù)據(jù)分析相結(jié)合的方法,試圖系統(tǒng)地研究傳統(tǒng)logistic回歸模型的估計(jì)偏性,改進(jìn)分析策略,探索最優(yōu)調(diào)整混雜集的選擇及其納入準(zhǔn)則。針對(duì)傳統(tǒng)logistic回歸模型的估計(jì)偏性,探討使用逆概率加權(quán)法構(gòu)建logistic邊際結(jié)構(gòu)模型替代傳統(tǒng)logistic回歸模型,從而校正其估計(jì)偏性,獲得無(wú)偏的因果效應(yīng)估計(jì)。針對(duì)logistic回歸分析中最優(yōu)調(diào)整混雜集的選擇及其納入準(zhǔn)則,基于因果圖模型和等值混雜理論,比較傳統(tǒng)logistic回歸模型和基于逆概率加權(quán)的logistic邊際結(jié)構(gòu)模型表現(xiàn),分別提出納入調(diào)整混雜集的最優(yōu)策略和一般指導(dǎo)性原則。充分考慮到混雜變量之間的復(fù)雜性,本文由簡(jiǎn)單到復(fù)雜逐步構(gòu)建四種因果圖模型,并根據(jù)等值混雜的充分必要條件,得到每種因果圖模型下的等值混雜集;進(jìn)而,分別采用兩種logistic模型調(diào)整不同的混雜集,并分別比較估計(jì)值的偏倚和標(biāo)準(zhǔn)誤,據(jù)此評(píng)價(jià)因果效應(yīng)估計(jì)值的準(zhǔn)確性和精確性。在實(shí)際數(shù)據(jù)分析過(guò)程中,面對(duì)眾多混雜因素時(shí),往往難以獲得明確的因果圖模型,也難以明確真實(shí)因果效應(yīng)。本文采用逐步遞加的方式估計(jì)高甘油三酯對(duì)糖尿病前期的影響。通過(guò)比較logistic回歸模型和logistic邊際結(jié)構(gòu)模型的不同表現(xiàn),進(jìn)一步說(shuō)明兩種模型在病因分析中的差異。結(jié)果:1.通過(guò)理論證明和模擬研究,可得出以下結(jié)果:(1)在估計(jì)暴露對(duì)結(jié)局因果效應(yīng)時(shí),當(dāng)調(diào)整的混雜集滿足后門(mén)準(zhǔn)則時(shí),傳統(tǒng)logistic回歸模型的因果效應(yīng)估計(jì)值多為有偏估計(jì)。其中,調(diào)整所有混雜后的因果效應(yīng)估計(jì)值與調(diào)整結(jié)局所有父母節(jié)點(diǎn)后的因果效應(yīng)估計(jì)值相等;而調(diào)整暴露的所有父母節(jié)點(diǎn)后得到的因果效應(yīng)估計(jì)值與前兩者不相等,但是偏倚更小(即準(zhǔn)確性更高),且大部分情況下精確性也最高。(2)logistic邊際結(jié)構(gòu)模型調(diào)整滿足后門(mén)準(zhǔn)則的任一集合時(shí),均可得到因果效應(yīng)的無(wú)偏估計(jì)。其中,調(diào)整結(jié)局所有父母節(jié)點(diǎn)時(shí),因果效應(yīng)估計(jì)值的標(biāo)準(zhǔn)誤最小(精確性最高)。(3)在因果圖的結(jié)構(gòu)只有部分已知的情況下,傳統(tǒng)logistic回歸模型調(diào)整馬爾科夫邊界相等的混雜集時(shí),因果效應(yīng)的估計(jì)值均為有偏估計(jì),通常情況下,調(diào)整暴露的父母節(jié)點(diǎn)產(chǎn)生的偏倚較小。(4)logistic邊際結(jié)構(gòu)模型調(diào)整僅滿足馬爾科夫邊界相等的混雜集,得到的因果效應(yīng)估計(jì)值近似相等,但均為有偏估計(jì)。2.在實(shí)際數(shù)據(jù)分析時(shí),分別用傳統(tǒng)logistic回歸模型和logistic邊際結(jié)構(gòu)模型估計(jì)高甘油三酯對(duì)糖尿病前期的因果效應(yīng),均得到高甘油三酯是糖尿病前期的危險(xiǎn)因素。隨著傳統(tǒng)logistic回歸模型/logistic邊際結(jié)構(gòu)模型調(diào)整更多的生化指標(biāo)和體質(zhì)測(cè)量指標(biāo),高甘油三酯對(duì)糖尿病前期影響的效應(yīng)估計(jì)值逐漸減小。當(dāng)調(diào)整的混雜因素相同時(shí),相較于logistic邊際結(jié)構(gòu)模型,傳統(tǒng)logistic回歸模型得到高甘油三酯對(duì)糖尿病前期的效應(yīng)偏大。結(jié)論:1.充分考慮混雜變量之間的關(guān)系,分別就四種因果圖模型進(jìn)行統(tǒng)計(jì)模擬研究、理論推導(dǎo)證明。結(jié)論如下,(1)當(dāng)調(diào)整的混雜集合滿足后門(mén)準(zhǔn)則時(shí),傳統(tǒng)logistic回歸模型的因果效應(yīng)估計(jì)值多為有偏估計(jì),而logistic邊際結(jié)構(gòu)模型均為近似無(wú)偏估計(jì)且估計(jì)值的精確性更高。因此,建議使用logistic邊際結(jié)構(gòu)模型代替?zhèn)鹘y(tǒng)logistic回歸模型進(jìn)行病因分析。(2)當(dāng)調(diào)整的混雜集合僅滿足馬爾科夫邊界相等時(shí),兩種logistic模型的因果效應(yīng)估計(jì)值均為有偏估計(jì),但logistic邊際結(jié)構(gòu)模型相對(duì)穩(wěn)定。因此,仍推薦使用logistic邊際結(jié)構(gòu)模型。(3)選擇調(diào)整混雜集的準(zhǔn)則為:logistic邊際結(jié)構(gòu)模型為調(diào)整結(jié)局的所有父母節(jié)點(diǎn);傳統(tǒng)logistic回歸模型為調(diào)整暴露的所有父母節(jié)點(diǎn)。2.實(shí)際數(shù)據(jù)分析與模擬結(jié)果一致,與logistic邊際結(jié)構(gòu)模型相比,傳統(tǒng)logistic回歸模型估計(jì)暴露對(duì)結(jié)局的因果效應(yīng)值偏高。
【學(xué)位授予單位】:山東大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2018
【分類(lèi)號(hào)】:R181
【圖文】:

標(biāo)準(zhǔn)誤,偏倚,效應(yīng),模型調(diào)整


圖2不同z—r和r—y效應(yīng)時(shí)兩種logistic模型的估計(jì)偏倚及標(biāo)準(zhǔn)誤逡逑(2)不同和X—T效應(yīng)時(shí)兩種logistic模型的估計(jì)偏倚及標(biāo)準(zhǔn)誤逡逑設(shè)定和;效應(yīng)lnOR從0到2.303邋(Oi?從1到10),針對(duì)4={Z}、逡逑山={7}和山={Z,邋T}三組等值混雜集,分別采用兩種logistic模型進(jìn)行調(diào)整后的偏逡逑倚和標(biāo)準(zhǔn)誤變化趨勢(shì)如圖3所示。逡逑觀察圖3邋(a)和圖3邋(c),隨著Z對(duì)Z效應(yīng)X棿,(1)用传统e錚紓椋螅簦椋慊毓殄義夏P偷髡煸蛹截、^AP騈B3={Z,邋r}時(shí),得到估計(jì)結(jié)果仍然不同:1)調(diào)逡逑整▲(圖中LogitAi)時(shí),結(jié)果近似無(wú)偏,但其標(biāo)準(zhǔn)誤隨著Z對(duì);T效應(yīng)增大先降逡逑后升;2)調(diào)整混雜集A或d3,二者的估計(jì)均為有偏估計(jì)(圖中Logit邋A2和Logit逡逑A3)。由此可見(jiàn),使用傳統(tǒng)logistic模型調(diào)整暴露(Z)的父母節(jié)點(diǎn)(D時(shí),可逡逑獲得偏倚最小的估計(jì)。(2)當(dāng)用logistic邊際結(jié)構(gòu)模型調(diào)整混雜集4、山或沁逡逑時(shí)(圖中MSMAi、MSMA2和MSMA3),三者均為無(wú)偏估計(jì),且調(diào)整七時(shí),逡逑標(biāo)準(zhǔn)誤最小。因此,logistic邊際結(jié)構(gòu)模型調(diào)整三個(gè)變量集中任意一個(gè)均可獲得無(wú)逡逑

標(biāo)準(zhǔn)誤,偏倚,效應(yīng),模型調(diào)整


設(shè)定和;效應(yīng)lnOR從0到2.303邋(Oi?從1到10),針對(duì)4={Z}、逡逑山={7}和山={Z,邋T}三組等值混雜集,分別采用兩種logistic模型進(jìn)行調(diào)整后的偏逡逑倚和標(biāo)準(zhǔn)誤變化趨勢(shì)如圖3所示。逡逑觀察圖3邋(a)和圖3邋(c),隨著Z對(duì)Z效應(yīng)X棿,(1)用传统e錚紓椋螅簦椋慊毓殄義夏P偷髡煸蛹截、^AP騈B3={Z,邋r}時(shí),得到估計(jì)結(jié)果仍然不同:1)調(diào)逡逑整▲(圖中LogitAi)時(shí),結(jié)果近似無(wú)偏,但其標(biāo)準(zhǔn)誤隨著Z對(duì);T效應(yīng)增大先降逡逑后升;2)調(diào)整混雜集A或d3,二者的估計(jì)均為有偏估計(jì)(圖中Logit邋A2和Logit逡逑A3)。由此可見(jiàn),使用傳統(tǒng)logistic模型調(diào)整暴露(Z)的父母節(jié)點(diǎn)(D時(shí),可逡逑獲得偏倚最小的估計(jì)。(2)當(dāng)用logistic邊際結(jié)構(gòu)模型調(diào)整混雜集4、山或沁逡逑時(shí)(圖中MSMAi、MSMA2和MSMA3),三者均為無(wú)偏估計(jì),且調(diào)整七時(shí),逡逑標(biāo)準(zhǔn)誤最小。因此,logistic邊際結(jié)構(gòu)模型調(diào)整三個(gè)變量集中任意一個(gè)均可獲得無(wú)逡逑偏估計(jì)

偏倚,標(biāo)準(zhǔn)誤,效應(yīng),模型估計(jì)


使用logistic邊際結(jié)構(gòu)模型調(diào)整三個(gè)變量集中任意一個(gè)均可獲得無(wú)偏估計(jì),逡逑且調(diào)整結(jié)局(r)的父母節(jié)點(diǎn)(7:邋F)時(shí)估計(jì)精度最高。逡逑由圖4(b)和圖4(d)可見(jiàn),隨著效應(yīng)的逐漸X棿,(1)三条e錚紓椋螅簦椋沐義匣毓檳P偷墓蘭破芯噬仙魘菩,且为俞叓固m疲渲械髡紓ㄍ賈校

本文編號(hào):2775002

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/yixuelunwen/yufangyixuelunwen/2775002.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶b2e38***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com