天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

logistic回歸模型在流行病學病因分析中的偏性及其改進策略研究

發(fā)布時間:2020-07-30 04:17
【摘要】:背景:探討疾病危險因素進而推斷疾病病因是流行病學的永恒主題,也是預防醫(yī)學實踐中的主要任務。然而,目前常用的大多數統(tǒng)計方法多是從關聯(lián)分析入手,通過相關關系逼近因果關系,在分析過程中常常忽略混雜因素的影響,從而導致因果效應的錯誤估計。雖然,流行病學家已經提出了一系列控制混雜偏倚的策略方法,包括:限制、分層、調整。但如何正確應用這些策略方法,借助常規(guī)的統(tǒng)計關聯(lián)分析有效地控制混雜偏倚,一直是困擾分析流行病學研究的難題。logistic回歸模型是流行病學病因分析中最為普遍的方法。事實上,logistic回歸模型的估計值在本質上是關聯(lián)分析層面的條件概率,所得到的因果效應估計值往往有偏。因此,如何正確使用logistic回歸模型以準確估計暴露對結局的真實因果效應是病因分析中需要解決的重要問題。此外,由于納入回歸模型的變量集不同,得到的因果效應估計值也會不同;隨著調整變量個數的增加,因果效應估計的精確性也會受到影響。因此,如何選擇最優(yōu)調整變量集,以準確估計暴露對結局的因果效應,也是logistic回歸分析中需解決的關鍵問題。方法:本文針對傳統(tǒng)logistic回歸模型估計偏性和最優(yōu)調整混雜集的選擇問題,采用了統(tǒng)計模擬研究、理論推導證明和實際數據分析相結合的方法,試圖系統(tǒng)地研究傳統(tǒng)logistic回歸模型的估計偏性,改進分析策略,探索最優(yōu)調整混雜集的選擇及其納入準則。針對傳統(tǒng)logistic回歸模型的估計偏性,探討使用逆概率加權法構建logistic邊際結構模型替代傳統(tǒng)logistic回歸模型,從而校正其估計偏性,獲得無偏的因果效應估計。針對logistic回歸分析中最優(yōu)調整混雜集的選擇及其納入準則,基于因果圖模型和等值混雜理論,比較傳統(tǒng)logistic回歸模型和基于逆概率加權的logistic邊際結構模型表現(xiàn),分別提出納入調整混雜集的最優(yōu)策略和一般指導性原則。充分考慮到混雜變量之間的復雜性,本文由簡單到復雜逐步構建四種因果圖模型,并根據等值混雜的充分必要條件,得到每種因果圖模型下的等值混雜集;進而,分別采用兩種logistic模型調整不同的混雜集,并分別比較估計值的偏倚和標準誤,據此評價因果效應估計值的準確性和精確性。在實際數據分析過程中,面對眾多混雜因素時,往往難以獲得明確的因果圖模型,也難以明確真實因果效應。本文采用逐步遞加的方式估計高甘油三酯對糖尿病前期的影響。通過比較logistic回歸模型和logistic邊際結構模型的不同表現(xiàn),進一步說明兩種模型在病因分析中的差異。結果:1.通過理論證明和模擬研究,可得出以下結果:(1)在估計暴露對結局因果效應時,當調整的混雜集滿足后門準則時,傳統(tǒng)logistic回歸模型的因果效應估計值多為有偏估計。其中,調整所有混雜后的因果效應估計值與調整結局所有父母節(jié)點后的因果效應估計值相等;而調整暴露的所有父母節(jié)點后得到的因果效應估計值與前兩者不相等,但是偏倚更小(即準確性更高),且大部分情況下精確性也最高。(2)logistic邊際結構模型調整滿足后門準則的任一集合時,均可得到因果效應的無偏估計。其中,調整結局所有父母節(jié)點時,因果效應估計值的標準誤最小(精確性最高)。(3)在因果圖的結構只有部分已知的情況下,傳統(tǒng)logistic回歸模型調整馬爾科夫邊界相等的混雜集時,因果效應的估計值均為有偏估計,通常情況下,調整暴露的父母節(jié)點產生的偏倚較小。(4)logistic邊際結構模型調整僅滿足馬爾科夫邊界相等的混雜集,得到的因果效應估計值近似相等,但均為有偏估計。2.在實際數據分析時,分別用傳統(tǒng)logistic回歸模型和logistic邊際結構模型估計高甘油三酯對糖尿病前期的因果效應,均得到高甘油三酯是糖尿病前期的危險因素。隨著傳統(tǒng)logistic回歸模型/logistic邊際結構模型調整更多的生化指標和體質測量指標,高甘油三酯對糖尿病前期影響的效應估計值逐漸減小。當調整的混雜因素相同時,相較于logistic邊際結構模型,傳統(tǒng)logistic回歸模型得到高甘油三酯對糖尿病前期的效應偏大。結論:1.充分考慮混雜變量之間的關系,分別就四種因果圖模型進行統(tǒng)計模擬研究、理論推導證明。結論如下,(1)當調整的混雜集合滿足后門準則時,傳統(tǒng)logistic回歸模型的因果效應估計值多為有偏估計,而logistic邊際結構模型均為近似無偏估計且估計值的精確性更高。因此,建議使用logistic邊際結構模型代替?zhèn)鹘y(tǒng)logistic回歸模型進行病因分析。(2)當調整的混雜集合僅滿足馬爾科夫邊界相等時,兩種logistic模型的因果效應估計值均為有偏估計,但logistic邊際結構模型相對穩(wěn)定。因此,仍推薦使用logistic邊際結構模型。(3)選擇調整混雜集的準則為:logistic邊際結構模型為調整結局的所有父母節(jié)點;傳統(tǒng)logistic回歸模型為調整暴露的所有父母節(jié)點。2.實際數據分析與模擬結果一致,與logistic邊際結構模型相比,傳統(tǒng)logistic回歸模型估計暴露對結局的因果效應值偏高。
【學位授予單位】:山東大學
【學位級別】:碩士
【學位授予年份】:2018
【分類號】:R181
【圖文】:

標準誤,偏倚,效應,模型調整


圖2不同z—r和r—y效應時兩種logistic模型的估計偏倚及標準誤逡逑(2)不同和X—T效應時兩種logistic模型的估計偏倚及標準誤逡逑設定和;效應lnOR從0到2.303邋(Oi?從1到10),針對4={Z}、逡逑山={7}和山={Z,邋T}三組等值混雜集,分別采用兩種logistic模型進行調整后的偏逡逑倚和標準誤變化趨勢如圖3所示。逡逑觀察圖3邋(a)和圖3邋(c),隨著Z對Z效應X棿螅ǎ保┯么常歟錚紓椋螅簦椋慊毓殄義夏P偷髡煸蛹截、^AP騈B3={Z,邋r}時,得到估計結果仍然不同:1)調逡逑整▲(圖中LogitAi)時,結果近似無偏,但其標準誤隨著Z對;T效應增大先降逡逑后升;2)調整混雜集A或d3,二者的估計均為有偏估計(圖中Logit邋A2和Logit逡逑A3)。由此可見,使用傳統(tǒng)logistic模型調整暴露(Z)的父母節(jié)點(D時,可逡逑獲得偏倚最小的估計。(2)當用logistic邊際結構模型調整混雜集4、山或沁逡逑時(圖中MSMAi、MSMA2和MSMA3),三者均為無偏估計,且調整七時,逡逑標準誤最小。因此,logistic邊際結構模型調整三個變量集中任意一個均可獲得無逡逑

標準誤,偏倚,效應,模型調整


設定和;效應lnOR從0到2.303邋(Oi?從1到10),針對4={Z}、逡逑山={7}和山={Z,邋T}三組等值混雜集,分別采用兩種logistic模型進行調整后的偏逡逑倚和標準誤變化趨勢如圖3所示。逡逑觀察圖3邋(a)和圖3邋(c),隨著Z對Z效應X棿螅ǎ保┯么常歟錚紓椋螅簦椋慊毓殄義夏P偷髡煸蛹截、^AP騈B3={Z,邋r}時,得到估計結果仍然不同:1)調逡逑整▲(圖中LogitAi)時,結果近似無偏,但其標準誤隨著Z對;T效應增大先降逡逑后升;2)調整混雜集A或d3,二者的估計均為有偏估計(圖中Logit邋A2和Logit逡逑A3)。由此可見,使用傳統(tǒng)logistic模型調整暴露(Z)的父母節(jié)點(D時,可逡逑獲得偏倚最小的估計。(2)當用logistic邊際結構模型調整混雜集4、山或沁逡逑時(圖中MSMAi、MSMA2和MSMA3),三者均為無偏估計,且調整七時,逡逑標準誤最小。因此,logistic邊際結構模型調整三個變量集中任意一個均可獲得無逡逑偏估計

偏倚,標準誤,效應,模型估計


使用logistic邊際結構模型調整三個變量集中任意一個均可獲得無偏估計,逡逑且調整結局(r)的父母節(jié)點(7:邋F)時估計精度最高。逡逑由圖4(b)和圖4(d)可見,隨著效應的逐漸X棿,(1)三条e錚紓椋螅簦椋沐義匣毓檳P偷墓蘭破芯噬仙魘菩裕椅釁蘭,其中调整旒偍唾Z校

本文編號:2775002

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/yixuelunwen/yufangyixuelunwen/2775002.html


Copyright(c)文論論文網All Rights Reserved | 網站地圖 |

版權申明:資料由用戶b2e38***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com