線性模型中共線性條件下自變量效應分析和相對重要性估計
發(fā)布時間:2020-05-14 21:16
【摘要】:目的:在線性回歸分析中,共線性是最常見的問題之一。國際上較為公認的優(yōu)勢分析,相對權重,乘積尺度等自變量相對重要性估計方法在共線性條件下估計自變量相對重要性結果不一致,甚至無法估計。針對以上問題,本文引入共性分析方法和貝葉斯優(yōu)勢分層法兩種方法對有共線性的醫(yī)學數(shù)據(jù)進行自變量的效應分析和相對重要性估計。方法:共性分析法將線性模型總變異R~2的分解為自變量的單獨和共同的變異貢獻(或效應),共2~p-1(P為自變量的個數(shù))個分區(qū)。通過確定不同子集模型(自變量組合)對回歸的變異貢獻效應比例,對自變量進行效應結構分析和相對重要性估計,并對共性分析估計自變量相對重要性進行了改進,與優(yōu)勢分析法進行了比較。貝葉斯分層優(yōu)勢法基于Bradley Terry成對比較模型,先用優(yōu)勢分析法計算出自變量在不同k水平上R~2的貢獻增量,再通過成對比較構建各個k水平win/loss表,構建優(yōu)勢指數(shù)的似然函數(shù)和分層先驗分布推斷出優(yōu)勢指數(shù)的后驗分布。利用Markov Chain Monte Carlo(MCMC)的Gibbs抽樣法以重復迭代的方式求得各自變量的優(yōu)勢指數(shù)及其95%的置信區(qū)間。共性分析法和貝葉斯優(yōu)勢分層法的實證分析均通過R統(tǒng)計軟件實現(xiàn)。結果:在本文中,我們用兩個醫(yī)學研究數(shù)據(jù)對回歸模型中的自變量效應關系和相對重要性進行分析。對以生育能力為因變量,職業(yè)、考試能力、受教育水平、信仰、嬰兒死亡率為自變量的47個地區(qū)樣本數(shù)據(jù)進行共性分析。分析結果發(fā)現(xiàn)職業(yè),考試能力,受教育水平,信仰這四個自變量間存在共線性,職業(yè),考試能力通過抑制受教育水平、信仰與解釋生育能力無關的方差,增強了受教育水平,信仰,職業(yè)對生育能力的解釋能力,有助于人們深入了解受教育水平、信仰對生育能力變化的關鍵作用。改進后的共性分析法自變量相對估計結果與優(yōu)勢分析法一致,各自變量對生育能力的相對重要性排秩為受教育水平考試能力嬰兒死亡率信仰職業(yè),且各自變量估計的總貢獻值等于回歸模型R~2。對以未折疊蛋白質(zhì)的能量為因變量,親脂性常數(shù)(PIE)、親脂性常數(shù)(PIF),一個氨基酸鏈從蛋白質(zhì)內(nèi)部轉(zhuǎn)換成水的自由能(DGR),氨基酸接觸水的表面面積(SAC),分子折射率(MR),極性參數(shù)(Lam),氨基酸的分子面積(Vol)為自變量的19個樣本數(shù)據(jù)進行貝葉斯分層優(yōu)勢分析。MCMC的Gibbs抽樣法重復迭代10000次得到各變量優(yōu)勢指數(shù)d_i的點估計和95%置信區(qū)間,PIF的優(yōu)勢指數(shù)最大,其次為DGR,PIE,Lam,Vol,MR,SAC。因此自變量相對重要性排秩為PIFDGRPIELamVolMRSAC。結論:共性分析法可以顯著提高多元回歸研究中的模型探索能力,當自變量間相關不獨立時,可通過效應分析明確識別共線性和抑制在回歸模型中的大小和位置。改進后的共性分析法與優(yōu)勢分析法在自變量相對重要性估計中的作用一致。當自變量之間高度相關或近似完全相關,可利用貝葉斯優(yōu)勢分層法法估計自變量的相對重要性,該方法為相關自變量的群體相對優(yōu)勢能力提供了更全面的推斷,能作為自變量重要性估計的“適用”工具。
【學位授予單位】:寧波大學
【學位級別】:碩士
【學位授予年份】:2018
【分類號】:R195.1;O212
本文編號:2663947
【學位授予單位】:寧波大學
【學位級別】:碩士
【學位授予年份】:2018
【分類號】:R195.1;O212
【參考文獻】
相關期刊論文 前2條
1 賈孝霞;伍立志;楊文;沈其君;;對策理論在線性回歸模型自變量重要性估計中的分析及應用[J];第二軍醫(yī)大學學報;2014年08期
2 楊梅;肖靜;蔡輝;;多元分析中的多重共線性及其處理方法[J];中國衛(wèi)生統(tǒng)計;2012年04期
,本文編號:2663947
本文鏈接:http://sikaile.net/yixuelunwen/yiyuanguanlilunwen/2663947.html
最近更新
教材專著