多組比較資料貝葉斯傾向性評分模型的構(gòu)建及應用
發(fā)布時間:2017-07-27 17:10
本文關鍵詞:多組比較資料貝葉斯傾向性評分模型的構(gòu)建及應用
【摘要】:研究背景: 傾向性評分法是目前控制觀察性研究資料中非隨機化分組組間的混雜偏倚的主要方法之一。該方法主要分兩步進行:第一步,構(gòu)建處理因素模型,估計傾向性評分值;第二步,應用傾向性評分值,構(gòu)建結(jié)局變量模型,即在不同的對比組間根據(jù)該傾向性評分值進行分層、回歸、加權(quán)或者匹配以達到對比組間協(xié)變量分布的均衡,然后在已均衡了協(xié)變量分布的匹配組中或者層內(nèi)構(gòu)建結(jié)局變量模型,進行處理效應的估計。目前,傾向性評分法還存在著一些難以解決的問題:(1)沒有考慮傾向性評分值的不確定性對于估計處理效應的影響;(2)估計處理效應時沒有辦法利用先驗信息。將貝葉斯統(tǒng)計的思想引入到傾向性評分法中可以很好的解決以上問題。然而,截至目前,有關貝葉斯傾向性評分的理論研究和實際應用都僅僅適用于二分類分組變量。而在實踐中,我們常常會遇到處理因素為多個分組的情況。因而,應用于處理因素為多個分組變量的貝葉斯傾向性評分法亟待研究。 研究目的: 本研究旨在探索當處理因素為多個分組變量(包括無序多分類和有序多分類資料)時如何將貝葉斯方法引入傾向性評分法中以控制多組組間的混雜偏倚,并通過不同方法的比較探索均衡多組組間混雜因素的最優(yōu)方法,解決觀察性研究實踐中遇到的實際問題,并將所建立的模型應用到一項流行病學調(diào)查的真實數(shù)據(jù)的分析中,推廣應用。 研究方法: 1、模型的構(gòu)建:(1)提出中間貝葉斯廣義傾向性評分法,分為兩步:第一步為構(gòu)建貝葉斯處理因素模型,估計廣義傾向性評分值。當處理因素為無序多分類變量時采用貝葉斯多分類logistic回歸模型,當處理因素為有序多分類變量時采用貝葉斯有序logistic回歸模型。第二步為構(gòu)建一般結(jié)局變量模型,采用多元線性回歸模型估計處理效應。若處理因素為無序多分類變量,則應用回歸法;若為有序多分類變量時,運用回歸法、分層法和加權(quán)法。(2)提出兩步驟貝葉斯廣義傾向性評分法,第一步為構(gòu)建貝葉斯處理因素模型,第二步為構(gòu)建貝葉斯結(jié)局變量模型,采用貝葉斯回歸模型估計處理效應。估計廣義傾向性評分值方法和應用方法與中間貝葉斯廣義傾向性評分法相同。 2、數(shù)據(jù)的模擬:針對觀察性研究的基本數(shù)據(jù)結(jié)構(gòu)進行原始數(shù)據(jù)的模擬,產(chǎn)生處理因素、協(xié)變量和結(jié)局變量等三種變量構(gòu)成模擬數(shù)據(jù)集,其中處理因素分別考慮有序四分類變量和無序三分類變量的情況;協(xié)變量分別考慮兩分類變量、多分類變量和連續(xù)型變量的情況;結(jié)局變量僅考慮連續(xù)型變量的情況。模擬了1000個數(shù)據(jù)集,并考慮N=100、250和500三種不同的樣本量。當處理因素為無序三分類變量時,考慮1=-0.4,2=0.3和1=-1.5,2=2.5兩種不同的處理效應真實值和B t=0、1、10、100四種不同的處理因素模型的先驗精度;當處理因素為有序四分類變量時,考慮=-0.4和=2.5兩種不同的處理效應真實值,三種不同的處理因素模型的先驗精度(B=1、10、100)和三種不同的廣義傾向性評分值應用方法(回歸法、分層法或加權(quán)法)。對于兩步驟傾向性評分法,我們還考慮了0、1、10、100四種不同的結(jié)局變量模型的先驗精度,并考慮了無先驗信息和真實參數(shù)值作為先驗信息兩種情況。 3、實例應用:本研究將構(gòu)建的模型在一項實際的流行病學調(diào)查“中國人群胃腸疾病患病情況調(diào)查”中進行應用,分析自評工作壓力和婚姻狀況分別對與健康相關的生活質(zhì)量評分的八個維度的影響。采用一般和中間貝葉斯廣義傾向性評分法進行分析,并與傳統(tǒng)的多元線性回歸法的結(jié)果進行比較。 研究結(jié)果: 1、模擬研究結(jié)果:通過估計值與真實值的差值的絕對值(即偏倚)的大小來判斷處理效應估計的準確與否。偏倚越小,估計結(jié)果越準確。通過MSE判斷模型的精度。通過相應的95%置信區(qū)間來判斷處理效應估計值是否有統(tǒng)計學意義。從處理效應估計值的偏倚和MSE來看,一般廣義傾向性評分法重復1000次的結(jié)果比重復1次的結(jié)果更準確; N=500時,即樣本量足夠大時,,貝葉斯廣義傾向性評分法和一般方法得到的估計值非常接近,兩種方法大部分的結(jié)果偏倚在0.01或0.02左右。兩種方法的MSE也很接近,差異也在0.01左右。從處理效應估計值的標準誤差來看,貝葉斯方法的標準誤差略大于一般方法。 (1)中間貝葉斯廣義傾向性評分法的擬合結(jié)果: a)處理因素為無序多分類變量:當1=-1.5,2=2.5且N=100時,貝葉斯方法在B t=0時得到的處理效應估計值比一般方法要準確得多(貝葉斯方法1和2的偏倚為0.04和0.11,MSE為0.21和0.10;一般方法為0.21和0.25,MSE為0.17和0.18)。b)處理因素為有序多分類變量:當=-0.4時,應用回歸法后,貝葉斯方法和一般方法在小樣本即N=100時的任意先驗精度下得到的處理效應估計值相似,與真實值的偏倚均小于0.01。而應用加權(quán)法后,在小樣本N=100的情況下,貝葉斯方法在先驗精度B t=100時得到了比其它先驗精度更為精確的結(jié)果(B t=1時偏倚=0.06,B t=10時偏倚=0.05,B t=100時偏倚=0.01),并且該結(jié)果比一般方法更接近真實值(一般方法的偏倚=0.03)。通過計算MSE得到,貝葉斯方法在先驗精度B t=100時的MSE為0.01,略小于一般方法(MSE=0.02)。根據(jù)各自相應的95%置信區(qū)間,回歸法和加權(quán)法的處理效應估計均有統(tǒng)計學意義。同樣在小樣本的情況下,應用分層法后,貝葉斯方法在先驗精度B t=10時估計效果較其它先驗精度好,并且與一般方法相似,然而各自相應的95%置信區(qū)間均包括了0,因此分層法得到的各估計值均沒有統(tǒng)計學意義。當增加到2.5時,應用回歸法、加權(quán)法以及分層法的處理效應的估計值的特點均與=-0.4時一致。 (2)兩步驟貝葉斯廣義傾向性評分法的擬合結(jié)果:本研究中,無先驗信息和真實值為先驗信息兩種設計得到的結(jié)果相似。a)處理因素為無序多分類變量:當1=-1.5,2=2.5且N=100時,貝葉斯方法在B t=0且B t=0時得到的處理效應估計值比一般方法要準確得多且有統(tǒng)計學意義(貝葉斯方法1和2的偏倚為0.04和0.11,MSE為0.21和0.10;一般方法為0.21和0.25,MSE為0.17和0.18);b)處理因素為有序多分類變量:從處理效應估計值的偏倚來看,不論處理效應的真實值多少,不論樣本量大小,不論處理因素模型的先驗精度取值多少,應用分層法和回歸法后,當結(jié)局變量模型的先驗精度為0時,貝葉斯廣義傾向性評分法和一般方法得到的估計值非常接近,兩種方法大部分的結(jié)果偏倚在0.01左右。從MSE來看,貝葉斯方法上述情況下的MSE與一般方法的差異也在0.01左右。應用加權(quán)法后,則貝葉斯方法在各種條件下得到的處理效應估計值的準確性遠不如一般方法,并且隨著結(jié)局變量模型先驗精度Bγ的增加,偏倚也越來越大。 2、實例研究結(jié)果:(1)自評工作壓力對健康相關的生活質(zhì)量的影響:三種方法結(jié)果相近。工作壓力會影響到VT(活力)和MH(心理健康),當工作壓力每上升一個程度,活力評分就會下降1.32分,心理健康則會下降約2分。(2)婚姻狀況對健康相關的生活質(zhì)量的影響:多元線性回歸模型的結(jié)果中,婚姻狀況會影響到PF、VT、SF、RE和MH等五個維度,而經(jīng)過廣義傾向性評分法調(diào)整以后,所有協(xié)變量都達到均衡的情況下,婚姻狀況主要會影響到GH(健康總體自評)、VT(活力)、RE(情緒對角色功能的影響)、MH(心理健康)。與已婚的人群相比,離婚分居或喪偶的人群的健康總體自評分值下降了3分左右,活力評分則下降了約4分,而情緒影響分值更是下降了6分左右,心理健康評分下降了近5分。 研究結(jié)論: (1)貝葉斯方法在小樣本情況下略顯優(yōu)勢。(2)因考慮了估計的廣義傾向性評分值的不確定性,采用貝葉斯方法得到的處理效應的標準差大于一般方法。(3)在處理因素為無序多分類變量的情況下,一方面,當兩個處理效應的真實值相差較大時,貝葉斯方法在先驗精度為0時能得到與一般方法相比更為接近處理效應真實值的結(jié)果;另一方面,在一般方法得到的處理效應估計的偏倚較大時,采用貝葉斯方法估計可以大大的降低偏倚。(4)當處理因素為有序多分類變量時,我們推薦應用回歸法或者在使用加權(quán)法時采用基于較高先驗精度的中間貝葉斯廣義傾向性評分方法,或者基于結(jié)局變量模型先驗精度為0的情況下應用回歸法或分層法的兩步驟貝葉斯廣義傾向性評分法。(5)中間貝葉斯廣義傾向性評分法和兩步驟貝葉斯廣義傾向性評分法得到的處理效應最佳值是非常接近的,因而尚未能說明哪一種方法更好。在實踐中,可以根據(jù)實際情況,選擇合適的方法,并根據(jù)方法選擇相應的條件。
【關鍵詞】:多組比較 貝葉斯 廣義傾向性評分法
【學位授予單位】:第二軍醫(yī)大學
【學位級別】:博士
【學位授予年份】:2014
【分類號】:R181.3
【目錄】:
- 摘要6-10
- Abstract10-14
- 縮略詞表14-15
- 第一部分 概述15-23
- 一、 研究背景15-22
- (一) 傾向性評分法15-17
- (二) 多組比較資料的傾向性評分法17-20
- (三) 貝葉斯方法20-22
- 二、 研究目的和意義22-23
- (一) 研究目的22
- (二) 研究意義22-23
- 第二部分 研究內(nèi)容與方法、研究流程23-35
- 一、 研究內(nèi)容23-24
- (一) 中間貝葉斯傾向性評分法的擴展23
- (二) 兩步驟貝葉斯傾向性評分法的擴展23
- (三) 實例驗證23-24
- 二、 研究方法24-32
- (一) 中間貝葉斯廣義傾向性評分法的構(gòu)建24-28
- (二) 兩步驟貝葉斯廣義傾向性評分法的構(gòu)建28-32
- (三) 最終結(jié)果和模型評價32
- 三、 研究流程32-35
- (一) 模擬數(shù)據(jù)研究流程32-34
- (二) 實際數(shù)據(jù)研究流程34-35
- 第三部分 數(shù)據(jù)的獲取和整理35-48
- 一、 模擬數(shù)據(jù)的結(jié)構(gòu)35-36
- 二、 數(shù)據(jù)模擬過程36-41
- 三、 模擬數(shù)據(jù)的均衡性檢驗41-47
- 四、 實例資料來源、分析工具及研究平臺47-48
- 第四部分 研究結(jié)果48-79
- 一、 中間貝葉斯廣義傾向性評分法的擬合結(jié)果48-55
- (一) 處理因素為無序多分類變量48-49
- (二) 處理因素為有序多分類變量49-55
- 二、 兩步驟貝葉斯廣義傾向性評分法的擬合結(jié)果55-79
- (一) 無先驗信息55-67
- (二) 真實參數(shù)值為先驗信息67-79
- 第五部分 研究討論79-81
- 一、 模擬數(shù)據(jù)討論79
- 二、 研究結(jié)果討論79-81
- 第六部分 實例應用81-87
- 一、 前言81
- (一) 研究背景81
- (二)研究目的81
- 二、 材料和方法81-82
- 三、 結(jié)果與討論82-87
- (一) 自評工作壓力對健康相關的生活質(zhì)量的影響82-84
- (二) 婚姻狀況對健康相關的生活質(zhì)量的影響84-87
- 創(chuàng)新與不足87-88
- 1、本研究的創(chuàng)新之處87
- 2、本研究的不足及今后研究方向87-88
- 附錄:核心程序88-101
- 文獻綜述101-111
- 參考文獻109-111
- 參考文獻111-114
- 在讀期間發(fā)表論文和參加科研工作情況說明114-116
- 致謝116
【參考文獻】
中國期刊全文數(shù)據(jù)庫 前6條
1 李其富;Logistic回歸模型與Probit模型及其在刑事作案人員分析中的應用[J];四川警官高等?茖W校學報;2002年04期
2 李智文;任愛國;;傾向評分加權(quán)分析法[J];中國生育健康雜志;2010年04期
3 李軍;楊秀蘭;張偉;李智;;人工神經(jīng)網(wǎng)絡應用臨床醫(yī)學診斷的思考[J];醫(yī)學與哲學(臨床決策論壇版);2008年10期
4 武艷華;史寶林;葛麗平;;分類與回歸樹分析方法及其在醫(yī)學研究中的應用[J];河北北方學院學報(醫(yī)學版);2008年06期
5 李智文;李宏田;張樂;劉建蒙;任愛國;;用SPSS宏程序?qū)崿F(xiàn)觀察對象的傾向評分配比[J];中國衛(wèi)生統(tǒng)計;2011年01期
6 吳美京;吳騁;王睿;趙艷芳;賀佳;;傾向性評分法中評分值的估計方法及比較[J];中國衛(wèi)生統(tǒng)計;2013年03期
本文編號:582476
本文鏈接:http://sikaile.net/yixuelunwen/liuxingb/582476.html
最近更新
教材專著