多組比較資料貝葉斯傾向性評分模型的構(gòu)建及應(yīng)用
發(fā)布時(shí)間:2017-07-27 17:10
本文關(guān)鍵詞:多組比較資料貝葉斯傾向性評分模型的構(gòu)建及應(yīng)用
更多相關(guān)文章: 多組比較 貝葉斯 廣義傾向性評分法
【摘要】:研究背景: 傾向性評分法是目前控制觀察性研究資料中非隨機(jī)化分組組間的混雜偏倚的主要方法之一。該方法主要分兩步進(jìn)行:第一步,構(gòu)建處理因素模型,估計(jì)傾向性評分值;第二步,應(yīng)用傾向性評分值,構(gòu)建結(jié)局變量模型,即在不同的對比組間根據(jù)該傾向性評分值進(jìn)行分層、回歸、加權(quán)或者匹配以達(dá)到對比組間協(xié)變量分布的均衡,然后在已均衡了協(xié)變量分布的匹配組中或者層內(nèi)構(gòu)建結(jié)局變量模型,進(jìn)行處理效應(yīng)的估計(jì)。目前,傾向性評分法還存在著一些難以解決的問題:(1)沒有考慮傾向性評分值的不確定性對于估計(jì)處理效應(yīng)的影響;(2)估計(jì)處理效應(yīng)時(shí)沒有辦法利用先驗(yàn)信息。將貝葉斯統(tǒng)計(jì)的思想引入到傾向性評分法中可以很好的解決以上問題。然而,截至目前,有關(guān)貝葉斯傾向性評分的理論研究和實(shí)際應(yīng)用都僅僅適用于二分類分組變量。而在實(shí)踐中,我們常常會(huì)遇到處理因素為多個(gè)分組的情況。因而,應(yīng)用于處理因素為多個(gè)分組變量的貝葉斯傾向性評分法亟待研究。 研究目的: 本研究旨在探索當(dāng)處理因素為多個(gè)分組變量(包括無序多分類和有序多分類資料)時(shí)如何將貝葉斯方法引入傾向性評分法中以控制多組組間的混雜偏倚,并通過不同方法的比較探索均衡多組組間混雜因素的最優(yōu)方法,解決觀察性研究實(shí)踐中遇到的實(shí)際問題,并將所建立的模型應(yīng)用到一項(xiàng)流行病學(xué)調(diào)查的真實(shí)數(shù)據(jù)的分析中,推廣應(yīng)用。 研究方法: 1、模型的構(gòu)建:(1)提出中間貝葉斯廣義傾向性評分法,分為兩步:第一步為構(gòu)建貝葉斯處理因素模型,估計(jì)廣義傾向性評分值。當(dāng)處理因素為無序多分類變量時(shí)采用貝葉斯多分類logistic回歸模型,當(dāng)處理因素為有序多分類變量時(shí)采用貝葉斯有序logistic回歸模型。第二步為構(gòu)建一般結(jié)局變量模型,采用多元線性回歸模型估計(jì)處理效應(yīng)。若處理因素為無序多分類變量,則應(yīng)用回歸法;若為有序多分類變量時(shí),運(yùn)用回歸法、分層法和加權(quán)法。(2)提出兩步驟貝葉斯廣義傾向性評分法,第一步為構(gòu)建貝葉斯處理因素模型,第二步為構(gòu)建貝葉斯結(jié)局變量模型,采用貝葉斯回歸模型估計(jì)處理效應(yīng)。估計(jì)廣義傾向性評分值方法和應(yīng)用方法與中間貝葉斯廣義傾向性評分法相同。 2、數(shù)據(jù)的模擬:針對觀察性研究的基本數(shù)據(jù)結(jié)構(gòu)進(jìn)行原始數(shù)據(jù)的模擬,產(chǎn)生處理因素、協(xié)變量和結(jié)局變量等三種變量構(gòu)成模擬數(shù)據(jù)集,其中處理因素分別考慮有序四分類變量和無序三分類變量的情況;協(xié)變量分別考慮兩分類變量、多分類變量和連續(xù)型變量的情況;結(jié)局變量僅考慮連續(xù)型變量的情況。模擬了1000個(gè)數(shù)據(jù)集,并考慮N=100、250和500三種不同的樣本量。當(dāng)處理因素為無序三分類變量時(shí),考慮1=-0.4,2=0.3和1=-1.5,2=2.5兩種不同的處理效應(yīng)真實(shí)值和B t=0、1、10、100四種不同的處理因素模型的先驗(yàn)精度;當(dāng)處理因素為有序四分類變量時(shí),考慮=-0.4和=2.5兩種不同的處理效應(yīng)真實(shí)值,三種不同的處理因素模型的先驗(yàn)精度(B=1、10、100)和三種不同的廣義傾向性評分值應(yīng)用方法(回歸法、分層法或加權(quán)法)。對于兩步驟傾向性評分法,我們還考慮了0、1、10、100四種不同的結(jié)局變量模型的先驗(yàn)精度,并考慮了無先驗(yàn)信息和真實(shí)參數(shù)值作為先驗(yàn)信息兩種情況。 3、實(shí)例應(yīng)用:本研究將構(gòu)建的模型在一項(xiàng)實(shí)際的流行病學(xué)調(diào)查“中國人群胃腸疾病患病情況調(diào)查”中進(jìn)行應(yīng)用,分析自評工作壓力和婚姻狀況分別對與健康相關(guān)的生活質(zhì)量評分的八個(gè)維度的影響。采用一般和中間貝葉斯廣義傾向性評分法進(jìn)行分析,并與傳統(tǒng)的多元線性回歸法的結(jié)果進(jìn)行比較。 研究結(jié)果: 1、模擬研究結(jié)果:通過估計(jì)值與真實(shí)值的差值的絕對值(即偏倚)的大小來判斷處理效應(yīng)估計(jì)的準(zhǔn)確與否。偏倚越小,估計(jì)結(jié)果越準(zhǔn)確。通過MSE判斷模型的精度。通過相應(yīng)的95%置信區(qū)間來判斷處理效應(yīng)估計(jì)值是否有統(tǒng)計(jì)學(xué)意義。從處理效應(yīng)估計(jì)值的偏倚和MSE來看,一般廣義傾向性評分法重復(fù)1000次的結(jié)果比重復(fù)1次的結(jié)果更準(zhǔn)確; N=500時(shí),即樣本量足夠大時(shí),,貝葉斯廣義傾向性評分法和一般方法得到的估計(jì)值非常接近,兩種方法大部分的結(jié)果偏倚在0.01或0.02左右。兩種方法的MSE也很接近,差異也在0.01左右。從處理效應(yīng)估計(jì)值的標(biāo)準(zhǔn)誤差來看,貝葉斯方法的標(biāo)準(zhǔn)誤差略大于一般方法。 (1)中間貝葉斯廣義傾向性評分法的擬合結(jié)果: a)處理因素為無序多分類變量:當(dāng)1=-1.5,2=2.5且N=100時(shí),貝葉斯方法在B t=0時(shí)得到的處理效應(yīng)估計(jì)值比一般方法要準(zhǔn)確得多(貝葉斯方法1和2的偏倚為0.04和0.11,MSE為0.21和0.10;一般方法為0.21和0.25,MSE為0.17和0.18)。b)處理因素為有序多分類變量:當(dāng)=-0.4時(shí),應(yīng)用回歸法后,貝葉斯方法和一般方法在小樣本即N=100時(shí)的任意先驗(yàn)精度下得到的處理效應(yīng)估計(jì)值相似,與真實(shí)值的偏倚均小于0.01。而應(yīng)用加權(quán)法后,在小樣本N=100的情況下,貝葉斯方法在先驗(yàn)精度B t=100時(shí)得到了比其它先驗(yàn)精度更為精確的結(jié)果(B t=1時(shí)偏倚=0.06,B t=10時(shí)偏倚=0.05,B t=100時(shí)偏倚=0.01),并且該結(jié)果比一般方法更接近真實(shí)值(一般方法的偏倚=0.03)。通過計(jì)算MSE得到,貝葉斯方法在先驗(yàn)精度B t=100時(shí)的MSE為0.01,略小于一般方法(MSE=0.02)。根據(jù)各自相應(yīng)的95%置信區(qū)間,回歸法和加權(quán)法的處理效應(yīng)估計(jì)均有統(tǒng)計(jì)學(xué)意義。同樣在小樣本的情況下,應(yīng)用分層法后,貝葉斯方法在先驗(yàn)精度B t=10時(shí)估計(jì)效果較其它先驗(yàn)精度好,并且與一般方法相似,然而各自相應(yīng)的95%置信區(qū)間均包括了0,因此分層法得到的各估計(jì)值均沒有統(tǒng)計(jì)學(xué)意義。當(dāng)增加到2.5時(shí),應(yīng)用回歸法、加權(quán)法以及分層法的處理效應(yīng)的估計(jì)值的特點(diǎn)均與=-0.4時(shí)一致。 (2)兩步驟貝葉斯廣義傾向性評分法的擬合結(jié)果:本研究中,無先驗(yàn)信息和真實(shí)值為先驗(yàn)信息兩種設(shè)計(jì)得到的結(jié)果相似。a)處理因素為無序多分類變量:當(dāng)1=-1.5,2=2.5且N=100時(shí),貝葉斯方法在B t=0且B t=0時(shí)得到的處理效應(yīng)估計(jì)值比一般方法要準(zhǔn)確得多且有統(tǒng)計(jì)學(xué)意義(貝葉斯方法1和2的偏倚為0.04和0.11,MSE為0.21和0.10;一般方法為0.21和0.25,MSE為0.17和0.18);b)處理因素為有序多分類變量:從處理效應(yīng)估計(jì)值的偏倚來看,不論處理效應(yīng)的真實(shí)值多少,不論樣本量大小,不論處理因素模型的先驗(yàn)精度取值多少,應(yīng)用分層法和回歸法后,當(dāng)結(jié)局變量模型的先驗(yàn)精度為0時(shí),貝葉斯廣義傾向性評分法和一般方法得到的估計(jì)值非常接近,兩種方法大部分的結(jié)果偏倚在0.01左右。從MSE來看,貝葉斯方法上述情況下的MSE與一般方法的差異也在0.01左右。應(yīng)用加權(quán)法后,則貝葉斯方法在各種條件下得到的處理效應(yīng)估計(jì)值的準(zhǔn)確性遠(yuǎn)不如一般方法,并且隨著結(jié)局變量模型先驗(yàn)精度Bγ的增加,偏倚也越來越大。 2、實(shí)例研究結(jié)果:(1)自評工作壓力對健康相關(guān)的生活質(zhì)量的影響:三種方法結(jié)果相近。工作壓力會(huì)影響到VT(活力)和MH(心理健康),當(dāng)工作壓力每上升一個(gè)程度,活力評分就會(huì)下降1.32分,心理健康則會(huì)下降約2分。(2)婚姻狀況對健康相關(guān)的生活質(zhì)量的影響:多元線性回歸模型的結(jié)果中,婚姻狀況會(huì)影響到PF、VT、SF、RE和MH等五個(gè)維度,而經(jīng)過廣義傾向性評分法調(diào)整以后,所有協(xié)變量都達(dá)到均衡的情況下,婚姻狀況主要會(huì)影響到GH(健康總體自評)、VT(活力)、RE(情緒對角色功能的影響)、MH(心理健康)。與已婚的人群相比,離婚分居或喪偶的人群的健康總體自評分值下降了3分左右,活力評分則下降了約4分,而情緒影響分值更是下降了6分左右,心理健康評分下降了近5分。 研究結(jié)論: (1)貝葉斯方法在小樣本情況下略顯優(yōu)勢。(2)因考慮了估計(jì)的廣義傾向性評分值的不確定性,采用貝葉斯方法得到的處理效應(yīng)的標(biāo)準(zhǔn)差大于一般方法。(3)在處理因素為無序多分類變量的情況下,一方面,當(dāng)兩個(gè)處理效應(yīng)的真實(shí)值相差較大時(shí),貝葉斯方法在先驗(yàn)精度為0時(shí)能得到與一般方法相比更為接近處理效應(yīng)真實(shí)值的結(jié)果;另一方面,在一般方法得到的處理效應(yīng)估計(jì)的偏倚較大時(shí),采用貝葉斯方法估計(jì)可以大大的降低偏倚。(4)當(dāng)處理因素為有序多分類變量時(shí),我們推薦應(yīng)用回歸法或者在使用加權(quán)法時(shí)采用基于較高先驗(yàn)精度的中間貝葉斯廣義傾向性評分方法,或者基于結(jié)局變量模型先驗(yàn)精度為0的情況下應(yīng)用回歸法或分層法的兩步驟貝葉斯廣義傾向性評分法。(5)中間貝葉斯廣義傾向性評分法和兩步驟貝葉斯廣義傾向性評分法得到的處理效應(yīng)最佳值是非常接近的,因而尚未能說明哪一種方法更好。在實(shí)踐中,可以根據(jù)實(shí)際情況,選擇合適的方法,并根據(jù)方法選擇相應(yīng)的條件。
【關(guān)鍵詞】:多組比較 貝葉斯 廣義傾向性評分法
【學(xué)位授予單位】:第二軍醫(yī)大學(xué)
【學(xué)位級別】:博士
【學(xué)位授予年份】:2014
【分類號(hào)】:R181.3
【目錄】:
- 摘要6-10
- Abstract10-14
- 縮略詞表14-15
- 第一部分 概述15-23
- 一、 研究背景15-22
- (一) 傾向性評分法15-17
- (二) 多組比較資料的傾向性評分法17-20
- (三) 貝葉斯方法20-22
- 二、 研究目的和意義22-23
- (一) 研究目的22
- (二) 研究意義22-23
- 第二部分 研究內(nèi)容與方法、研究流程23-35
- 一、 研究內(nèi)容23-24
- (一) 中間貝葉斯傾向性評分法的擴(kuò)展23
- (二) 兩步驟貝葉斯傾向性評分法的擴(kuò)展23
- (三) 實(shí)例驗(yàn)證23-24
- 二、 研究方法24-32
- (一) 中間貝葉斯廣義傾向性評分法的構(gòu)建24-28
- (二) 兩步驟貝葉斯廣義傾向性評分法的構(gòu)建28-32
- (三) 最終結(jié)果和模型評價(jià)32
- 三、 研究流程32-35
- (一) 模擬數(shù)據(jù)研究流程32-34
- (二) 實(shí)際數(shù)據(jù)研究流程34-35
- 第三部分 數(shù)據(jù)的獲取和整理35-48
- 一、 模擬數(shù)據(jù)的結(jié)構(gòu)35-36
- 二、 數(shù)據(jù)模擬過程36-41
- 三、 模擬數(shù)據(jù)的均衡性檢驗(yàn)41-47
- 四、 實(shí)例資料來源、分析工具及研究平臺(tái)47-48
- 第四部分 研究結(jié)果48-79
- 一、 中間貝葉斯廣義傾向性評分法的擬合結(jié)果48-55
- (一) 處理因素為無序多分類變量48-49
- (二) 處理因素為有序多分類變量49-55
- 二、 兩步驟貝葉斯廣義傾向性評分法的擬合結(jié)果55-79
- (一) 無先驗(yàn)信息55-67
- (二) 真實(shí)參數(shù)值為先驗(yàn)信息67-79
- 第五部分 研究討論79-81
- 一、 模擬數(shù)據(jù)討論79
- 二、 研究結(jié)果討論79-81
- 第六部分 實(shí)例應(yīng)用81-87
- 一、 前言81
- (一) 研究背景81
- (二)研究目的81
- 二、 材料和方法81-82
- 三、 結(jié)果與討論82-87
- (一) 自評工作壓力對健康相關(guān)的生活質(zhì)量的影響82-84
- (二) 婚姻狀況對健康相關(guān)的生活質(zhì)量的影響84-87
- 創(chuàng)新與不足87-88
- 1、本研究的創(chuàng)新之處87
- 2、本研究的不足及今后研究方向87-88
- 附錄:核心程序88-101
- 文獻(xiàn)綜述101-111
- 參考文獻(xiàn)109-111
- 參考文獻(xiàn)111-114
- 在讀期間發(fā)表論文和參加科研工作情況說明114-116
- 致謝116
【參考文獻(xiàn)】
中國期刊全文數(shù)據(jù)庫 前6條
1 李其富;Logistic回歸模型與Probit模型及其在刑事作案人員分析中的應(yīng)用[J];四川警官高等?茖W(xué)校學(xué)報(bào);2002年04期
2 李智文;任愛國;;傾向評分加權(quán)分析法[J];中國生育健康雜志;2010年04期
3 李軍;楊秀蘭;張偉;李智;;人工神經(jīng)網(wǎng)絡(luò)應(yīng)用臨床醫(yī)學(xué)診斷的思考[J];醫(yī)學(xué)與哲學(xué)(臨床決策論壇版);2008年10期
4 武艷華;史寶林;葛麗平;;分類與回歸樹分析方法及其在醫(yī)學(xué)研究中的應(yīng)用[J];河北北方學(xué)院學(xué)報(bào)(醫(yī)學(xué)版);2008年06期
5 李智文;李宏田;張樂;劉建蒙;任愛國;;用SPSS宏程序?qū)崿F(xiàn)觀察對象的傾向評分配比[J];中國衛(wèi)生統(tǒng)計(jì);2011年01期
6 吳美京;吳騁;王睿;趙艷芳;賀佳;;傾向性評分法中評分值的估計(jì)方法及比較[J];中國衛(wèi)生統(tǒng)計(jì);2013年03期
本文編號(hào):582476
本文鏈接:http://sikaile.net/yixuelunwen/liuxingb/582476.html
最近更新
教材專著