傾向評分法及其處理共線性數(shù)據(jù)的模擬研究
本文選題:傾向評分 + 多重共線性 ; 參考:《南通大學(xué)》2012年碩士論文
【摘要】:目的通過比較傾向評分(Propensity Score, PS)回歸法與傳統(tǒng)logistic回歸法處理多重共線性資料結(jié)果的差異,探討PS回歸法處理多重共線性資料的統(tǒng)計性質(zhì)及其應(yīng)用特點。 方法采用蒙特卡羅(Monte Carlo, MC)模擬法,分別從樣本量、協(xié)變量與暴露變量相關(guān)性以及結(jié)局變量陽性率三個因素的不同水平進行模擬研究,比較PS回歸法與logistic回歸法在處理多重共線性資料的差異,同時探討了三個因素間的相互影響,并用實例對上述模擬結(jié)果予以驗證,進一步闡明傾向評分回歸法處理多重共線性資料的可行性和實用性。 結(jié)果(1)當(dāng)固定結(jié)局變量陽性率(4%),協(xié)變量與暴露因素相關(guān)性較高(r=0.92)時,PS回歸的回歸系數(shù)較logistic回歸更接近標(biāo)準(zhǔn)模型的估計值,但是,隨著樣本量的增加,回歸系數(shù)的估計逐漸趨于一致,而且估計誤差會越來越小。 (2)當(dāng)樣本量固定,PS回歸計算的回歸系數(shù)隨著協(xié)變量與暴露因素相關(guān)性的變化與標(biāo)準(zhǔn)模型變化趨勢一致,兩模型回歸系數(shù)之差并不隨相關(guān)性的增加而變大,而logistic回歸估計的回歸系數(shù)以及標(biāo)準(zhǔn)誤在一定相關(guān)性(1=1000,r0.5;n=500,r0.3)后就開始增大并遠離標(biāo)準(zhǔn)值。同時,與一般1ogistic回歸模型相比,PS回歸法在樣本量較小的資料中對共線性處理的優(yōu)勢更為明顯。 (3)當(dāng)樣本量固定,協(xié)變量與暴露因素相關(guān)性較高(r=0.92)時,與logistic回歸相比,PS回歸的回歸系數(shù)及標(biāo)準(zhǔn)誤與標(biāo)準(zhǔn)模型較為接近,但這種優(yōu)勢隨著陽性率的增加而逐步變小。 結(jié)論基于本研究的結(jié)果,我們認為在處理具有多重共線性的數(shù)據(jù)時,PS回歸的參數(shù)估計較logistic回歸的參數(shù)估計更為可靠,特別是在樣本量小、結(jié)局變量陽性率較低、變量間共線性較高條件下更應(yīng)考慮使用PS回歸以避免參數(shù)估計的偏倚。
[Abstract]:Objective To investigate the statistical properties of multiple collinearity data and its application characteristics by comparing the results of multiple collinearity data with the traditional logistic regression method by comparing the Propensity Score ( PS ) regression method with the traditional logistic regression method .
Methods Monte Carlo ( MC ) simulation was used to study the correlation between the sample size , the association variables and the exposure variables and the positive rate of the outcome variables . The differences of the PS regression method and the logistic regression method in the treatment of multiple collinearity data were compared .
Results ( 1 ) When the positive rate of fixed outcome variables ( 4 % ) , the correlation between covariant and exposure factors is high ( r = 0.92 ) , the regression coefficient of PS regression is closer to the estimation value of the standard model than logistic regression , but with the increase of sample size , the estimation of regression coefficient tends to be consistent , and the estimation error becomes smaller and smaller .
( 2 ) When the sample size is fixed , the regression coefficient of PS regression is consistent with the changing trend of the standard model . The difference of the regression coefficients of the two models does not change with the increase of the correlation , but the regression coefficient and the standard error of the logistic regression estimate are increased and far away from the standard value after a certain correlation ( 1 = 1000 , r0.5 ; n = 500 , r0.3 ) .
( 3 ) Compared with logistic regression , the regression coefficient and standard error of PS regression were close to the standard model when the sample size was fixed and the correlation between covariant and exposure factor was high ( r = 0.92 ) , but this advantage gradually decreased with the increase of positive rate .
Conclusion Based on the results of this study , we believe that the parameter estimation of PS regression is more reliable than that of logistic regression when dealing with data with multiple collinearity , especially in small sample size , low positive rate of outcome variable , and higher inter - variable collinearity . The PS regression should be considered to avoid bias of parameter estimation .
【學(xué)位授予單位】:南通大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2012
【分類號】:R181.1
【共引文獻】
相關(guān)博士學(xué)位論文 前10條
1 鯤鵬;地震災(zāi)后醫(yī)療救助評估與政策研究[D];華中科技大學(xué);2010年
2 徐麗;基于歷代醫(yī)案數(shù)據(jù)庫整理和臨床問卷調(diào)查的月經(jīng)量、色癥狀規(guī)范的研究[D];山東中醫(yī)藥大學(xué);2010年
3 黃銳;基于利益相關(guān)者的公立醫(yī)院組織績效評價指標(biāo)體系研究[D];華中科技大學(xué);2011年
4 張海波;具象思維作業(yè)的腦電空間與頻域特征研究[D];北京中醫(yī)藥大學(xué);2011年
5 劉育辰;甘草質(zhì)量評價多指標(biāo)檢測方法的建立及其在不同來源甘草藥材鑒別上的應(yīng)用[D];北京中醫(yī)藥大學(xué);2011年
6 俞麗華;偏頭痛基于患者報告的結(jié)局評價量表研制及性能初步考評[D];北京中醫(yī)藥大學(xué);2011年
7 孫晶濤;基于內(nèi)容的垃圾郵件過濾技術(shù)研究[D];蘭州理工大學(xué);2010年
8 徐文科;基于微分方程的生態(tài)數(shù)學(xué)模型統(tǒng)計分析[D];東北林業(yè)大學(xué);2009年
9 亓興蘭;SPOT-5遙感影像馬尾松毛蟲害信息提取技術(shù)研究[D];福建農(nóng)林大學(xué);2011年
10 劉云霞;耐多藥結(jié)核病影響因素的生態(tài)學(xué)研究[D];山東大學(xué);2011年
,本文編號:1932374
本文鏈接:http://sikaile.net/yixuelunwen/liuxingb/1932374.html