基于LASSO回歸模型與百度搜索數(shù)據(jù)構(gòu)建的流感疫情預(yù)測系統(tǒng)
本文選題:Bagging + LASSO。 參考:《中國衛(wèi)生統(tǒng)計(jì)》2017年02期
【摘要】:目的探討基于LASSO回歸模型與百度搜索數(shù)據(jù)構(gòu)建流感疫情預(yù)測系統(tǒng)的可行性。方法采用Bagging方法和模型性能的多指標(biāo)優(yōu)化評估策略,對傳統(tǒng)LASSO回歸模型進(jìn)行改進(jìn),構(gòu)建性能提升的集成LASSO回歸模型,將其應(yīng)用于中國大陸地區(qū)季節(jié)性流感流行趨勢的預(yù)測研究。結(jié)果與傳統(tǒng)LASSO回歸模型相比,本研究所構(gòu)建的集成LASSO回歸模型對2011年至2015年中國大陸地區(qū)流感流行趨勢的預(yù)測偏差更小,說明集成LASSO回歸模型的外部推斷能力更強(qiáng),適合于流感疫情的預(yù)測分析;本研究開發(fā)了開源的R軟件程序包Sparse Learner,方便用戶進(jìn)行調(diào)用和進(jìn)一步開發(fā)研究。結(jié)論 Bagging方法和多指標(biāo)優(yōu)化評估策略相結(jié)合所構(gòu)建的集成LASSO回歸模型,有效地增強(qiáng)了傳統(tǒng)LASSO回歸模型的性能。本研究所構(gòu)建的預(yù)測模型可以應(yīng)用于流感等傳染病疫情的預(yù)測研究。
[Abstract]:Objective to explore the feasibility of constructing influenza epidemic forecasting system based on LASSO regression model and Baidu search data. Methods by using bagging method and multi-index optimization evaluation strategy of model performance, the traditional LASSO regression model was improved, and an integrated LASSO regression model with improved performance was constructed, which was applied to predict seasonal influenza epidemic trend in mainland China. Results compared with the traditional LASSO regression model, the integrated LASSO regression model constructed in this study has a lower prediction deviation to the influenza epidemic trend in mainland China from 2011 to 2015, which indicates that the integrated LASSO regression model has stronger external inference ability than the traditional LASSO regression model. It is suitable for the prediction and analysis of influenza epidemic. In this study, open source R software package Sparse Learneris developed, which is convenient for users to call and further research. Conclusion the integrated LASSO regression model based on bagging method and multi-index optimization evaluation strategy can effectively enhance the performance of the traditional LASSO regression model. The prediction model can be used to predict the epidemic situation of infectious diseases such as influenza.
【作者單位】: 汕頭大學(xué)醫(yī)學(xué)院公共衛(wèi)生與預(yù)防醫(yī)學(xué)教研室;中山大學(xué)公共衛(wèi)生學(xué)院醫(yī)學(xué)統(tǒng)計(jì)與流行病學(xué)系;中山大學(xué)衛(wèi)生信息中心、廣東省衛(wèi)生信息學(xué)重點(diǎn)實(shí)驗(yàn)室;
【分類號(hào)】:R511.7
【相似文獻(xiàn)】
相關(guān)期刊論文 前10條
1 徐英;駱福添;;COX回歸模型的樣本含量的計(jì)算方法及軟件實(shí)現(xiàn)[J];數(shù)理醫(yī)藥學(xué)雜志;2008年01期
2 郭孫偉,張照寰,許世瑾,沈福民;Cox回歸模型及其在醫(yī)學(xué)中的應(yīng)用[J];上海第一醫(yī)學(xué)院學(xué)報(bào);1985年04期
3 惲振先;;Cox回歸模型及其在急性非淋巴細(xì)胞白血病預(yù)后因素分析中的應(yīng)用[J];鐵道醫(yī)學(xué);1988年02期
4 黃小蘭;;比較幾種挑選“最優(yōu)”回歸模型的指標(biāo)[J];中國衛(wèi)生統(tǒng)計(jì);1988年04期
5 惲振先;;多個(gè)回歸模型的比較方法[J];中國公共衛(wèi)生;1989年03期
6 黃文涌;李衛(wèi)民;;Cox回歸模型在臨床療效分析中的應(yīng)用[J];貴陽醫(yī)學(xué)院學(xué)報(bào);1990年02期
7 姜潮;胡克震;劉宗航;喬友林;;四分類logistic回歸模型對肺癌分組織類型的多因素研究[J];中國衛(wèi)生統(tǒng)計(jì);1993年01期
8 李麗霞;郜艷暉;周舒冬;徐英;張敏;葉小華;;二分類、多分類Logistic回歸模型SAS程序?qū)崿F(xiàn)的探討[J];數(shù)理醫(yī)藥學(xué)雜志;2007年04期
9 丁建生;馮琪;;應(yīng)用非條件Logistic回歸模型的數(shù)據(jù)分層處理及應(yīng)用程序[J];蘭州醫(yī)學(xué)院學(xué)報(bào);1990年03期
10 沈洪兵,徐耀初;Logistic回歸模型的適用條件及其局限性[J];中國公共衛(wèi)生;1991年03期
相關(guān)會(huì)議論文 前10條
1 孫尚拱;何平平;;經(jīng)典的用回歸模型進(jìn)行統(tǒng)計(jì)控制中的問題[A];中國現(xiàn)場統(tǒng)計(jì)研究會(huì)第12屆學(xué)術(shù)年會(huì)論文集[C];2005年
2 張松松;沈競;;回歸模型和吉布斯抽樣的研究[A];第十屆中國不確定系統(tǒng)年會(huì)、第十四屆中國青年信息與管理學(xué)者大會(huì)論文集[C];2012年
3 艾瑛;陳仲堂;孫海義;劉丹;;利用數(shù)學(xué)軟件求解統(tǒng)計(jì)回歸模型[A];第十一屆沈陽科學(xué)學(xué)術(shù)年會(huì)暨中國汽車產(chǎn)業(yè)集聚區(qū)發(fā)展與合作論壇論文集(信息科學(xué)與工程技術(shù)分冊)[C];2014年
4 古佳;;非參數(shù)回歸模型的研究與應(yīng)用[A];第十二屆中國青年信息與管理學(xué)者大會(huì)論文集[C];2010年
5 陰擁民;徐聰穎;李衛(wèi)華;唐峗;劉桂霞;;構(gòu)建定量回歸模型預(yù)測化合物性質(zhì)[A];中國化學(xué)會(huì)第29屆學(xué)術(shù)年會(huì)摘要集——第19分會(huì):化學(xué)信息學(xué)與化學(xué)計(jì)量學(xué)[C];2014年
6 黃運(yùn)隆;李曉鋼;;基于時(shí)變系數(shù)擴(kuò)展風(fēng)險(xiǎn)回歸模型的可靠性預(yù)計(jì)[A];技術(shù)融合創(chuàng)新·可靠服務(wù)企業(yè)·安全產(chǎn)品制勝——2013年全國機(jī)械行業(yè)可靠性技術(shù)學(xué)術(shù)交流會(huì)暨第四屆可靠性工程分會(huì)第五次全體委員大會(huì)論文集[C];2013年
7 張敏;;企業(yè)薪金制度設(shè)計(jì)的回歸模型與應(yīng)用[A];2003中國現(xiàn)場統(tǒng)計(jì)研究會(huì)第十一屆學(xué)術(shù)年會(huì)論文集(上)[C];2003年
8 張波;沈其君;;Logistic回歸模型中自變量相對重要性的可視化[A];2011年中國衛(wèi)生統(tǒng)計(jì)學(xué)年會(huì)會(huì)議論文集[C];2011年
9 李志林;尹建華;;MATLAB軟件在建立回歸模型中的應(yīng)用[A];中國現(xiàn)場統(tǒng)計(jì)研究會(huì)第12屆學(xué)術(shù)年會(huì)論文集[C];2005年
10 吳利;張敏強(qiáng);;固定效應(yīng)與隨機(jī)效應(yīng)回歸模型下效果量的置信區(qū)間、統(tǒng)計(jì)功效及樣本容量的確定的比較研究[A];第十二屆全國心理學(xué)學(xué)術(shù)大會(huì)論文摘要集[C];2009年
相關(guān)博士學(xué)位論文 前5條
1 田茂再;回歸模型的診斷理論與應(yīng)用[D];南開大學(xué);2001年
2 李鋒;非參和半?yún)⒒貧w模型的穩(wěn)健和截面推斷[D];山東大學(xué);2010年
3 楊玉嬌;基于樣條函數(shù)的兩類回歸模型的研究[D];華東師范大學(xué);2013年
4 夏瑋;幾類數(shù)據(jù)下部分性單調(diào)回歸模型的統(tǒng)計(jì)推斷[D];中國科學(xué)技術(shù)大學(xué);2013年
5 吳擰洪;時(shí)間序列中回歸模型的診斷檢驗(yàn)[D];華東師范大學(xué);2007年
相關(guān)碩士學(xué)位論文 前10條
1 鄧健康;基于級(jí)聯(lián)回歸模型的人臉配準(zhǔn)研究[D];南京信息工程大學(xué);2015年
2 孟祥虎;基因表達(dá)預(yù)測模型研究[D];西安電子科技大學(xué);2014年
3 曹婷婷;我國消費(fèi)者對保險(xiǎn)信息的渴求研究[D];東北財(cái)經(jīng)大學(xué);2015年
4 田震;零一膨脹回歸模型及其統(tǒng)計(jì)診斷[D];云南大學(xué);2016年
5 李昊鑫;三維手姿態(tài)建模及其交互系統(tǒng)研究[D];電子科技大學(xué);2016年
6 陳怡;一類模糊Logistic回歸模型的參數(shù)估計(jì)[D];寧夏大學(xué);2016年
7 楊順華;基于空間回歸模型的土壤有機(jī)質(zhì)區(qū)域分布特征研究[D];華中農(nóng)業(yè)大學(xué);2016年
8 任瑩瑩;病例對照研究的Stereotype Logistic回歸模型[D];南京師范大學(xué);2015年
9 魏冰琪;協(xié)變量受區(qū)間約束的Logistic回歸模型的同步置信帶[D];東北師范大學(xué);2016年
10 蘇蕭蕭;基于樣本效應(yīng)的回歸預(yù)測方法研究[D];河北科技大學(xué);2016年
,本文編號(hào):1993555
本文鏈接:http://sikaile.net/yixuelunwen/chuanranbingxuelunwen/1993555.html