廣義線性混合模型中的通信有效分布式統(tǒng)計計算
發(fā)布時間:2020-12-12 10:25
在實際應用中,人們廣泛使用線性混合模型(linear mixed models,簡稱LMMs)、廣義線性模型(generalized linear models,簡稱GLMs)、廣義線性混合模型(generalized linear mixed models,簡稱GLMMs)等工具來分析各類實際數據。特別地,其中廣義線性混合模型在非壽險精算,醫(yī)學,生態(tài)學,傳染病學等領域中存在大量潛在應用。然而,相比其他模型而言,廣義線性混合模型的估計涉及高維積分問題,因此其實際計算較為困難。在現有文獻中,Breslow和Clayton(1993)[3]最早探討了如何采用Laplace方法進行快速近似計算相關擬似然估計的問題,并提出了一類基于懲罰擬似然的計算方法(簡記為PQL,Penalized Quasi-Likelihood),并推導了相關方法的理論性質。然后,近年來隨著數據搜集越來越便利,海量數據逐漸出現,這給相關模型的實際應用帶來極大挑戰(zhàn)。在大數據情形下,Jordan等(2018)[18]提出了針對線性模型、廣義線性等模型的通信有效推斷方法?紤]到Jo...
【文章來源】:江西財經大學江西省
【文章頁數】:60 頁
【學位級別】:碩士
【部分圖文】:
PQL和CSQL方法的性能與數據分割數的關系
廣義線性混合模型中的通信有效分布式統(tǒng)計計算36表示)、出院傾向(用dischargedisposition表示)、入院醫(yī)師的醫(yī)學專業(yè)(用medicalspecialtyoftheadmittingphysician表示)、住院時間(用timespentinhospital表示)。這些協(xié)變量都在BeataStrack等(2014)[38]的表1中進行了描述。每個患者EncounterID被認為是隨機效應,擬合的模型可表達成以下形式:(μ)=0Χ0+1Χ1+2Χ2+3Χ3+4Χ4+5Χ5+6Χ6+其中,μ=Readmission,Χ0=Gender,Χ1=Age,Χ2=Rac,Χ3=Admissionsource,Χ4=Dischargedisposition,Χ5=medicalspecialty,Χ6=Timespentinhospital,(=1,,6;=1,,)是logistic回歸的固定效應,是第個患者的EncounterID的隨機截距。圖2:混合logistic回歸PQL和CSQL方法的性能與數據分割數的關系3.4本章小結本章展開解釋了實證數據分析,運用數字研究和教育研究所(InstituteforDigitalResearchandEducation,簡稱IDRE)的數據與UC-Irvine機器學習庫數據集的實證數據進行了實證分析,具體得出的結論如下:(1)本章首先對IDRE的數據選取這些變量:年齡(用Age表示),結婚的(用Married表示),性別(用Sex表示),(4)紅細胞(RedBloodCell簡稱RBC),白細胞(WhiteBloodCell簡稱WBC)和每個醫(yī)生的固定截距和隨機截距來說明
本文編號:2912374
【文章來源】:江西財經大學江西省
【文章頁數】:60 頁
【學位級別】:碩士
【部分圖文】:
PQL和CSQL方法的性能與數據分割數的關系
廣義線性混合模型中的通信有效分布式統(tǒng)計計算36表示)、出院傾向(用dischargedisposition表示)、入院醫(yī)師的醫(yī)學專業(yè)(用medicalspecialtyoftheadmittingphysician表示)、住院時間(用timespentinhospital表示)。這些協(xié)變量都在BeataStrack等(2014)[38]的表1中進行了描述。每個患者EncounterID被認為是隨機效應,擬合的模型可表達成以下形式:(μ)=0Χ0+1Χ1+2Χ2+3Χ3+4Χ4+5Χ5+6Χ6+其中,μ=Readmission,Χ0=Gender,Χ1=Age,Χ2=Rac,Χ3=Admissionsource,Χ4=Dischargedisposition,Χ5=medicalspecialty,Χ6=Timespentinhospital,(=1,,6;=1,,)是logistic回歸的固定效應,是第個患者的EncounterID的隨機截距。圖2:混合logistic回歸PQL和CSQL方法的性能與數據分割數的關系3.4本章小結本章展開解釋了實證數據分析,運用數字研究和教育研究所(InstituteforDigitalResearchandEducation,簡稱IDRE)的數據與UC-Irvine機器學習庫數據集的實證數據進行了實證分析,具體得出的結論如下:(1)本章首先對IDRE的數據選取這些變量:年齡(用Age表示),結婚的(用Married表示),性別(用Sex表示),(4)紅細胞(RedBloodCell簡稱RBC),白細胞(WhiteBloodCell簡稱WBC)和每個醫(yī)生的固定截距和隨機截距來說明
本文編號:2912374
本文鏈接:http://sikaile.net/shoufeilunwen/benkebiyelunwen/2912374.html