基于統(tǒng)計學(xué)習(xí)理論的傳染病預(yù)警方法研究比較
本文關(guān)鍵詞:基于統(tǒng)計學(xué)習(xí)理論的傳染病預(yù)警方法研究比較 出處:《遼寧師范大學(xué)》2016年碩士論文 論文類型:學(xué)位論文
更多相關(guān)文章: 結(jié)構(gòu)方程模型 人工神經(jīng)網(wǎng)絡(luò) 隨機森林模型 統(tǒng)計學(xué)習(xí)
【摘要】:在所有的突發(fā)公共衛(wèi)生安全事件中,影響最嚴(yán)重的當(dāng)屬傳染病疫情的爆發(fā)。傳染病疫情的爆發(fā)不僅影響人們的正常出行,還容易造成社會大眾的心理恐慌,造成國家經(jīng)濟和社會方方面面的動蕩局面。而傳染病預(yù)測預(yù)警技術(shù)的產(chǎn)生與發(fā)展,對防范傳染病爆發(fā),及時有效的采取應(yīng)對措施就顯得尤為重要。在諸多統(tǒng)計學(xué)學(xué)習(xí)理論中,應(yīng)用于預(yù)測預(yù)警方面的方法有很多并且表現(xiàn)都不錯。本文主要選取了三種常用的統(tǒng)計模型,選取傳染病中的結(jié)核病為對象,通過對收集到的結(jié)核病數(shù)據(jù)進行統(tǒng)計分析,應(yīng)用10折交叉檢驗的方發(fā)比較得出在結(jié)核病預(yù)測預(yù)警方面表現(xiàn)比較好的模型。本文首先介紹了突發(fā)傳染病事件近些年來的狀況以及它給人們的生活帶來的影響。同時介紹了各個國家面對突發(fā)事件做出了哪些應(yīng)對措施,通過分析各個國家應(yīng)用不同統(tǒng)計方法預(yù)測傳染病模型的優(yōu)缺點,最終本文選擇了三種統(tǒng)計模型,以結(jié)核病為傳染病的代表,比較分析這三種模型在傳染病的預(yù)測預(yù)警方面的表現(xiàn)。其次,分別介紹了結(jié)構(gòu)方程模型、人工神經(jīng)網(wǎng)絡(luò)模型和隨機森林模型這三種模型的基礎(chǔ)理論知識。最后進行實證分析。應(yīng)用R軟件程序語言,對收集到的大連市各個學(xué)校的結(jié)核病數(shù)據(jù)進行數(shù)據(jù)處理分析。結(jié)果得到結(jié)構(gòu)方程模型可以將不可觀測的隱變量用多個可觀測的指標(biāo)表示出來,而且能很好的表示隱變量之間的因果關(guān)系。但結(jié)構(gòu)方程的局限性是它本身是一種驗證性的模型,因此不同的模型可能出現(xiàn)不同的結(jié)果。人工神經(jīng)網(wǎng)絡(luò)的非線性處理能力很好,但是容易出現(xiàn)過擬合現(xiàn)象。隨機森林處理數(shù)據(jù)過程快,而且不容易發(fā)生過擬合現(xiàn)象。從人工神經(jīng)網(wǎng)絡(luò)和隨機森立的10折交叉驗證結(jié)果顯示,隨機森林模型的擬合度更高,更穩(wěn)定。
[Abstract]:In all the sudden public health and safety incidents, the most serious impact is the outbreak of infectious disease. The outbreak of infectious disease not only affects the normal travel of people, but also easily cause psychological panic of the general public. The emergence and development of early warning technology for infectious diseases will prevent the outbreak of infectious diseases. Timely and effective measures are particularly important. In many statistical learning theory. There are many methods used in forecasting and early warning, and the performance is good. This paper mainly selects three commonly used statistical models, select tuberculosis in infectious diseases as the object. Through the collection of tuberculosis data for statistical analysis. By using the 10% cross test, the model of TB prediction and early warning is obtained. This paper first introduces the situation of emergent infectious diseases in recent years and its impact on people's lives. At the same time, it introduces the response measures that each country has made in the face of emergency. By analyzing the advantages and disadvantages of using different statistical methods to predict infectious disease models in different countries, three statistical models were selected in this paper, with tuberculosis as the representative of infectious diseases. The performance of these three models in the prediction and early warning of infectious diseases is compared and analyzed. Secondly, the structural equation models are introduced respectively. The basic theoretical knowledge of artificial neural network model and stochastic forest model. Finally, the empirical analysis. Using R software programming language. The data of tuberculosis collected from every school in Dalian were analyzed. The results showed that the unobservable hidden variables could be expressed by multiple observable indexes in the structural equation model. But the limitation of structural equation is that it is a kind of confirmatory model. Therefore, different models may have different results. Artificial neural network has good nonlinear processing ability, but it is prone to over-fit phenomenon. The data process of stochastic forest processing is fast. From the results of artificial neural network and 10 fold cross validation of random forest model, the fitting degree of stochastic forest model is higher and more stable.
【學(xué)位授予單位】:遼寧師范大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2016
【分類號】:R181.8
【相似文獻】
相關(guān)期刊論文 前10條
1 錢維;王超;吳騁;許金芳;葉小飛;杜文民;賀佳;;運用隨機森林分析藥品不良反應(yīng)發(fā)生的影響因素[J];中國衛(wèi)生統(tǒng)計;2013年02期
2 武曉巖;李康;;隨機森林方法在基因表達數(shù)據(jù)分析中的應(yīng)用及研究進展[J];中國衛(wèi)生統(tǒng)計;2009年04期
3 李貞子;張濤;武曉巖;李康;;隨機森林回歸分析及在代謝調(diào)控關(guān)系研究中的應(yīng)用[J];中國衛(wèi)生統(tǒng)計;2012年02期
4 劉永春;宋弘;;基于隨機森林的乳腺腫瘤診斷研究[J];電視技術(shù);2014年15期
5 聶斌;王卓;杜建強;朱明峰;林劍鳴;艾國平;熊玲珠;;基于粗糙集和隨機森林算法輔助糖尿病并發(fā)癥分類研究[J];江西師范大學(xué)學(xué)報(自然科學(xué)版);2014年03期
6 武曉巖;李康;;基因表達數(shù)據(jù)判別分析的隨機森林方法[J];中國衛(wèi)生統(tǒng)計;2006年06期
7 武曉巖;閆曉光;李康;;基因表達數(shù)據(jù)的隨機森林逐步判別分析方法[J];中國衛(wèi)生統(tǒng)計;2007年02期
8 馬廣立;趙筱萍;程翼宇;;基于隨機森林與Chemistry Development Kit描述符的P-gp底物識別[J];高等學(xué);瘜W(xué)學(xué)報;2007年10期
9 苑婕;李曉杰;陳超;宋向崗;王淑美;;基于隨機森林算法的川芎成分-靶點-疾病網(wǎng)絡(luò)的預(yù)測研究[J];中國中藥雜志;2014年12期
10 ;[J];;年期
相關(guān)會議論文 前7條
1 謝程利;王金橋;盧漢清;;核森林及其在目標(biāo)檢測中的應(yīng)用[A];第六屆和諧人機環(huán)境聯(lián)合學(xué)術(shù)會議(HHME2010)、第19屆全國多媒體學(xué)術(shù)會議(NCMT2010)、第6屆全國人機交互學(xué)術(shù)會議(CHCI2010)、第5屆全國普適計算學(xué)術(shù)會議(PCC2010)論文集[C];2010年
2 武曉巖;方慶偉;;基因表達數(shù)據(jù)分析的隨機森林方法及算法改進[A];黑龍江省第十次統(tǒng)計科學(xué)討論會論文集[C];2008年
3 張?zhí)忑?梁龍;王康;李華;;隨機森林結(jié)合激光誘導(dǎo)擊穿光譜技術(shù)用于的鋼鐵分類[A];中國化學(xué)會第29屆學(xué)術(shù)年會摘要集——第19分會:化學(xué)信息學(xué)與化學(xué)計量學(xué)[C];2014年
4 相玉紅;張卓勇;;組蛋白去乙;敢种苿┑臉(gòu)效關(guān)系研究[A];第十一屆全國計算(機)化學(xué)學(xué)術(shù)會議論文摘要集[C];2011年
5 張濤;李貞子;武曉巖;李康;;隨機森林回歸分析方法及在代謝組學(xué)中的應(yīng)用[A];2011年中國衛(wèi)生統(tǒng)計學(xué)年會會議論文集[C];2011年
6 馮飛翔;馮輔周;江鵬程;劉菁;劉建敏;;隨機森林和k-近鄰法在某型坦克變速箱狀態(tài)識別中的應(yīng)用[A];第八屆全國轉(zhuǎn)子動力學(xué)學(xué)術(shù)討論會論文集[C];2008年
7 曹東升;許青松;梁逸曾;陳憲;李洪東;;組合樹的集合體和后向消除策略去分類P-糖蛋白化合物[A];第十屆全國計算(機)化學(xué)學(xué)術(shù)會議論文摘要集[C];2009年
相關(guān)博士學(xué)位論文 前5條
1 張乾;基于隨機森林的視覺數(shù)據(jù)分類關(guān)鍵技術(shù)研究[D];華南理工大學(xué);2016年
2 曹正鳳;隨機森林算法優(yōu)化研究[D];首都經(jīng)濟貿(mào)易大學(xué);2014年
3 雷震;隨機森林及其在遙感影像處理中應(yīng)用研究[D];上海交通大學(xué);2012年
4 岳明;基于隨機森林和規(guī)則集成法的酒類市場預(yù)測與發(fā)展戰(zhàn)略[D];天津大學(xué);2008年
5 李書艷;單點氨基酸多態(tài)性與疾病相關(guān)關(guān)系的預(yù)測及其機制研究[D];蘭州大學(xué);2010年
相關(guān)碩士學(xué)位論文 前10條
1 錢維;藥品不良反應(yīng)監(jiān)測中隨機森林方法的建立與實現(xiàn)[D];第二軍醫(yī)大學(xué);2012年
2 韓燕龍;基于隨機森林的指數(shù)化投資組合構(gòu)建研究[D];華南理工大學(xué);2015年
3 賀捷;隨機森林在文本分類中的應(yīng)用[D];華南理工大學(xué);2015年
4 張文婷;交通環(huán)境下基于改進霍夫森林的目標(biāo)檢測與跟蹤[D];華南理工大學(xué);2015年
5 李強;基于多視角特征融合與隨機森林的蛋白質(zhì)結(jié)晶預(yù)測[D];南京理工大學(xué);2015年
6 朱玟謙;一種收斂性隨機森林在人臉檢測中的應(yīng)用研究[D];武漢理工大學(xué);2015年
7 肖宇;基于序列圖像的手勢檢測與識別算法研究[D];電子科技大學(xué);2014年
8 李慧;一種改進的隨機森林并行分類方法在運營商大數(shù)據(jù)的應(yīng)用[D];電子科技大學(xué);2015年
9 趙亞紅;面向多類標(biāo)分類的隨機森林算法研究[D];哈爾濱工業(yè)大學(xué);2014年
10 黎成;基于隨機森林和ReliefF的致病SNP識別方法[D];西安電子科技大學(xué);2014年
,本文編號:1439762
本文鏈接:http://sikaile.net/yixuelunwen/liuxingb/1439762.html