傾向評分法及其處理共線性數(shù)據的模擬研究
發(fā)布時間:2018-05-25 05:49
本文選題:傾向評分 + 多重共線性; 參考:《南通大學》2012年碩士論文
【摘要】:目的通過比較傾向評分(Propensity Score, PS)回歸法與傳統(tǒng)logistic回歸法處理多重共線性資料結果的差異,探討PS回歸法處理多重共線性資料的統(tǒng)計性質及其應用特點。 方法采用蒙特卡羅(Monte Carlo, MC)模擬法,分別從樣本量、協(xié)變量與暴露變量相關性以及結局變量陽性率三個因素的不同水平進行模擬研究,比較PS回歸法與logistic回歸法在處理多重共線性資料的差異,同時探討了三個因素間的相互影響,并用實例對上述模擬結果予以驗證,進一步闡明傾向評分回歸法處理多重共線性資料的可行性和實用性。 結果(1)當固定結局變量陽性率(4%),協(xié)變量與暴露因素相關性較高(r=0.92)時,PS回歸的回歸系數(shù)較logistic回歸更接近標準模型的估計值,但是,隨著樣本量的增加,回歸系數(shù)的估計逐漸趨于一致,而且估計誤差會越來越小。 (2)當樣本量固定,PS回歸計算的回歸系數(shù)隨著協(xié)變量與暴露因素相關性的變化與標準模型變化趨勢一致,兩模型回歸系數(shù)之差并不隨相關性的增加而變大,而logistic回歸估計的回歸系數(shù)以及標準誤在一定相關性(1=1000,r0.5;n=500,r0.3)后就開始增大并遠離標準值。同時,與一般1ogistic回歸模型相比,PS回歸法在樣本量較小的資料中對共線性處理的優(yōu)勢更為明顯。 (3)當樣本量固定,協(xié)變量與暴露因素相關性較高(r=0.92)時,與logistic回歸相比,PS回歸的回歸系數(shù)及標準誤與標準模型較為接近,但這種優(yōu)勢隨著陽性率的增加而逐步變小。 結論基于本研究的結果,我們認為在處理具有多重共線性的數(shù)據時,PS回歸的參數(shù)估計較logistic回歸的參數(shù)估計更為可靠,特別是在樣本量小、結局變量陽性率較低、變量間共線性較高條件下更應考慮使用PS回歸以避免參數(shù)估計的偏倚。
[Abstract]:Objective To investigate the statistical properties of multiple collinearity data and its application characteristics by comparing the results of multiple collinearity data with the traditional logistic regression method by comparing the Propensity Score ( PS ) regression method with the traditional logistic regression method .
Methods Monte Carlo ( MC ) simulation was used to study the correlation between the sample size , the association variables and the exposure variables and the positive rate of the outcome variables . The differences of the PS regression method and the logistic regression method in the treatment of multiple collinearity data were compared .
Results ( 1 ) When the positive rate of fixed outcome variables ( 4 % ) , the correlation between covariant and exposure factors is high ( r = 0.92 ) , the regression coefficient of PS regression is closer to the estimation value of the standard model than logistic regression , but with the increase of sample size , the estimation of regression coefficient tends to be consistent , and the estimation error becomes smaller and smaller .
( 2 ) When the sample size is fixed , the regression coefficient of PS regression is consistent with the changing trend of the standard model . The difference of the regression coefficients of the two models does not change with the increase of the correlation , but the regression coefficient and the standard error of the logistic regression estimate are increased and far away from the standard value after a certain correlation ( 1 = 1000 , r0.5 ; n = 500 , r0.3 ) .
( 3 ) Compared with logistic regression , the regression coefficient and standard error of PS regression were close to the standard model when the sample size was fixed and the correlation between covariant and exposure factor was high ( r = 0.92 ) , but this advantage gradually decreased with the increase of positive rate .
Conclusion Based on the results of this study , we believe that the parameter estimation of PS regression is more reliable than that of logistic regression when dealing with data with multiple collinearity , especially in small sample size , low positive rate of outcome variable , and higher inter - variable collinearity . The PS regression should be considered to avoid bias of parameter estimation .
【學位授予單位】:南通大學
【學位級別】:碩士
【學位授予年份】:2012
【分類號】:R181.1
【共引文獻】
相關博士學位論文 前10條
1 鯤鵬;地震災后醫(yī)療救助評估與政策研究[D];華中科技大學;2010年
2 徐麗;基于歷代醫(yī)案數(shù)據庫整理和臨床問卷調查的月經量、色癥狀規(guī)范的研究[D];山東中醫(yī)藥大學;2010年
3 黃銳;基于利益相關者的公立醫(yī)院組織績效評價指標體系研究[D];華中科技大學;2011年
4 張海波;具象思維作業(yè)的腦電空間與頻域特征研究[D];北京中醫(yī)藥大學;2011年
5 劉育辰;甘草質量評價多指標檢測方法的建立及其在不同來源甘草藥材鑒別上的應用[D];北京中醫(yī)藥大學;2011年
6 俞麗華;偏頭痛基于患者報告的結局評價量表研制及性能初步考評[D];北京中醫(yī)藥大學;2011年
7 孫晶濤;基于內容的垃圾郵件過濾技術研究[D];蘭州理工大學;2010年
8 徐文科;基于微分方程的生態(tài)數(shù)學模型統(tǒng)計分析[D];東北林業(yè)大學;2009年
9 亓興蘭;SPOT-5遙感影像馬尾松毛蟲害信息提取技術研究[D];福建農林大學;2011年
10 劉云霞;耐多藥結核病影響因素的生態(tài)學研究[D];山東大學;2011年
,本文編號:1932374
本文鏈接:http://sikaile.net/yixuelunwen/liuxingb/1932374.html
最近更新
教材專著