基于互聯(lián)網(wǎng)搜索數(shù)據(jù)的流感預警模型比較與優(yōu)化
本文關鍵詞:基于互聯(lián)網(wǎng)搜索數(shù)據(jù)的流感預警模型比較與優(yōu)化
更多相關文章: 流感 搜索引擎 百度指數(shù) 預警模型 模型比較
【摘要】:流行性感冒是由流感病毒引起的急性呼吸道感染,也是一種傳染性強、傳播速度快的流行病。傳統(tǒng)流行病監(jiān)測系統(tǒng)的數(shù)據(jù)源為手工收集的臨床數(shù)據(jù),對于報告新興疾病來說有一定延遲。而對于突發(fā)疫情,實時反饋和快速響應至關重要。利用開源的網(wǎng)絡數(shù)據(jù)監(jiān)測流行病趨勢是對傳統(tǒng)監(jiān)測手段的有效補充,它可以提供關于疫情嚴重程度的早期預警并降低監(jiān)測費用。2008年,Google發(fā)現(xiàn),搜索流感相關主題的人數(shù)與實際患有流感癥狀的人數(shù)之間存在著密切關系,他們依據(jù)這種數(shù)量關系提出了谷歌流感趨勢,受到廣泛關注。在我國,網(wǎng)民對搜索引擎的使用率可達到80%,其中國內滲透率最高的綜合搜索引擎品牌為百度。在流感預警方面,雖然以往的研究對搜索引擎數(shù)據(jù)進行了一定程度上的應用,但多數(shù)研究的數(shù)據(jù)源于谷歌,而少數(shù)利用百度搜索數(shù)據(jù)進行國內流感預測的研究也并不系統(tǒng),且很少有學者專門比較各個模型的預測效果并進行模型優(yōu)化;诖,本文擬通過百度搜索數(shù)據(jù),分析中文網(wǎng)絡關鍵詞和我國流行性疾病監(jiān)測結果的相關性,擬合并比較各種預測模型,探討利用網(wǎng)絡搜索數(shù)據(jù)輔助流行病監(jiān)測的應用可能。本文的主要研究內容和結果如下:(1)從信息行為、信息搜尋行為等理論概念出發(fā),對網(wǎng)絡搜索數(shù)據(jù)與流感病例數(shù)據(jù)之間的邏輯關系進行探討,建立理論框架模型,認為個體健康情況可能會激發(fā)其對健康信息的需求,從而進一步驅使個體實施健康信息搜尋行為。(2)根據(jù)搜索數(shù)據(jù)與流感病例數(shù)的關聯(lián)框架圖,用范圍選詞法從流感預防、流感癥狀、流感治療和流感常用詞四個維度對關鍵詞進行初步篩選,得到79個初始搜索詞;然后利用互相關,分析出初始搜索關鍵詞與流感病例數(shù)之間的相關關系和時差關系,最后得到22個關鍵詞用于構建模型。在實證研究的過程中,時差分析結果與本文給出的關聯(lián)框架大致相同,先行十周左右的關鍵詞內容都和流感疫苗相關,先行一周左右的關鍵詞多涉及到流感的癥狀表現(xiàn),而同步類關鍵詞多為常用搜索詞或治療方法,在一定程度上印證了理論基礎的可行性。(3)根據(jù)時差關系和模型原理的不同,擬合了8個模型,通過比較擬合優(yōu)度和預測效果,發(fā)現(xiàn)多元線性回歸和人工神經(jīng)網(wǎng)絡模型具有更好的擬合優(yōu)度,但擬合效果好并不一定代表預測精度準;主成分回歸模型雖然在理論上可以減少變量之間的共線性,但實踐證明無論是其擬合效果還是預測效果相對于多元回歸模型來說都有所下降。(4)對僅基于搜索數(shù)據(jù)的模型進行優(yōu)化,引入流感監(jiān)測的歷史信息,形成結合歷史信息與網(wǎng)絡數(shù)據(jù)兩個變量的綜合模型。通過比較該優(yōu)化模型與僅基于歷史信息的時間序列模型、基于搜索數(shù)據(jù)的最優(yōu)模型,發(fā)現(xiàn)歷史數(shù)據(jù)和搜索數(shù)據(jù)包含的信息具有一定程度的互補性,聯(lián)合使用兩種數(shù)據(jù)進行預測具有最好的預測效果。
【關鍵詞】:流感 搜索引擎 百度指數(shù) 預警模型 模型比較
【學位授予單位】:南開大學
【學位級別】:碩士
【學位授予年份】:2016
【分類號】:R511.7
【目錄】:
- 中文摘要3-5
- Abstract5-9
- 第一章 緒論9-17
- 第一節(jié) 研究背景9-13
- 一、流行病與“流行病情報學”9-11
- 二、中國互聯(lián)網(wǎng)及搜索引擎的普及11-12
- 三、互聯(lián)網(wǎng)技術在流行病監(jiān)測領域中的應用和影響12-13
- 第二節(jié) 研究意義、目的與內容13-15
- 一、研究意義13-14
- 二、研究目的14
- 三、研究內容14-15
- 第三節(jié) 研究方法與技術路線15-17
- 一、研究方法15-16
- 二、技術路線16-17
- 第二章 文獻綜述17-24
- 第一節(jié) 基于網(wǎng)絡搜索數(shù)據(jù)的應用研究17-20
- 一、經(jīng)濟金融領域的應用研究17-18
- 二、社會心理領域的應用研究18-19
- 三、旅游管理領域的應用研究19
- 四、消費者行為領域的應用研究19-20
- 第二節(jié) 基于網(wǎng)絡搜索數(shù)據(jù)的流行病監(jiān)測應用研究20-24
- 一、流感監(jiān)測的應用研究20-22
- 二、其它流行病監(jiān)測的應用研究22-24
- 第三章 理論框架與模型原理24-34
- 第一節(jié) 理論基礎與框架24-26
- 第二節(jié) 關鍵詞選擇原理26-29
- 一、關鍵詞初選26-27
- 二、互相關分析27-29
- 第三節(jié) 預測模型原理29-34
- 一、一元線性回歸29-30
- 二、多元線性回歸30-31
- 三、主成分回歸31-32
- 四、人工神經(jīng)網(wǎng)絡模型32-33
- 五、時間序列分析33-34
- 第四章 實證分析34-63
- 第一節(jié) 數(shù)據(jù)來源34-35
- 一、中國國家流感中心流感周報34
- 二、百度指數(shù)34-35
- 第二節(jié) 關鍵詞選擇結果35-40
- 一、關鍵詞初選結果35-38
- 二、互相關分析結果38-40
- 第三節(jié) 基于搜索數(shù)據(jù)的流感預警模型擬合與檢驗40-51
- 一、一元線性回歸模型40-43
- 二、多元線性回歸模型43-46
- 三、主成份回歸模型46-50
- 四、BP神經(jīng)網(wǎng)絡模型50-51
- 第四節(jié) 基于搜索數(shù)據(jù)的模型效果比較51-58
- 一、模型擬合效果比較52-54
- 二、模型預測能力比較54-58
- 第五節(jié) 優(yōu)化模型的建立與比較58-63
- 一、模型建立58-60
- 二、模型比較60-63
- 第五章 結論63-67
- 第一節(jié) 討論63-65
- 第二節(jié) 研究發(fā)現(xiàn)65-66
- 第三節(jié) 研究局限與未來展望66-67
- 參考文獻67-72
- 致謝72-73
- 個人簡歷、在學期間發(fā)表的學術論文與研究成果73
【相似文獻】
中國期刊全文數(shù)據(jù)庫 前4條
1 張敏;杜燮yN;朱彩云;劉國華;;高危作業(yè)有害因素預防控制水平預警模型[J];中國安全生產(chǎn)科學技術;2009年02期
2 萬歡英;過依;;慢性阻塞性肺疾病預警模型研究[J];內科理論與實踐;2012年06期
3 劉如春;陳田木;;長沙市流感/甲型H1N1流感預警模型建立與評價[J];醫(yī)學動物防制;2010年04期
4 ;[J];;年期
中國重要會議論文全文數(shù)據(jù)庫 前6條
1 張國興;劉鵬;汪應洛;郭菊娥;;銀行集中信用違約預警模型[A];社會經(jīng)濟發(fā)展轉型與系統(tǒng)工程——中國系統(tǒng)工程學會第17屆學術年會論文集[C];2012年
2 鄭伯峰;張錦;李司鐸;劉瀟;;基于貝葉斯網(wǎng)絡的大客戶離網(wǎng)預警模型研究[A];第四屆中國智能計算大會論文集[C];2010年
3 應江勇;周宇;;決策樹在我國通信行業(yè)用戶預警模型中的研究應用[A];第十三屆中國管理科學學術年會論文集[C];2011年
4 翟東升;張金寶;王明吉;張書杰;;基于財務指標的上市公司信用預警模型研究[A];中國現(xiàn)場統(tǒng)計研究會第12屆學術年會論文集[C];2005年
5 文柯;;基于Logistic的上市公司產(chǎn)融結合風險預警模型研究[A];第十四屆中國管理科學學術年會論文集(上冊)[C];2012年
6 潘潔珠;吳共慶;胡學鋼;;基于關聯(lián)規(guī)則的成績預警模型研究[A];計算機技術與應用進展·2007——全國第18屆計算機技術與應用(CACIS)學術會議論文集[C];2007年
中國重要報紙全文數(shù)據(jù)庫 前4條
1 本報通訊員 宋娟 嚴明良;構建預警模型 降低路網(wǎng)風險[N];中國氣象報;2013年
2 廣發(fā)證券股份有限公司 何沛俐 章早立;立體空間下的全新財務危機遠期預警模型[N];證券時報;2003年
3 記者 謝柳;合眾人壽完成信用風險預警模型[N];中國保險報;2011年
4 張憲邋郝力平 涂春輝 王法力 洪明 劉年財;全流通后警惕公司財務危機[N];中國證券報;2007年
中國博士學位論文全文數(shù)據(jù)庫 前9條
1 董鶴云;大型施工項目目標偏差適時監(jiān)控方法及預警模型研究[D];華北電力大學;2015年
2 劉彥文;上市公司財務危機預警模型研究[D];大連理工大學;2009年
3 朱鈞鈞;主權違約風險的評估方法和預警模型[D];復旦大學;2011年
4 丁寶成;煤礦安全預警模型及應用研究[D];遼寧工程技術大學;2010年
5 張云波;工程項目工期延誤原因及預警模型研究[D];天津大學;2004年
6 趙軍;基于GIS空間統(tǒng)計分析的區(qū)域房地產(chǎn)動態(tài)預警模型[D];中國地質大學(北京);2011年
7 張加強;中國農(nóng)業(yè)類上市公司可持續(xù)發(fā)展預警模型研究[D];華中農(nóng)業(yè)大學;2011年
8 汪冬華;我國上市公司行業(yè)分析方法及違約風險預警模型研究[D];華中科技大學;2004年
9 馬輝;中國金融風險指標體系構建與預警研究[D];吉林大學;2009年
中國碩士學位論文全文數(shù)據(jù)庫 前10條
1 冷靜;秦皇島旅游業(yè)可持續(xù)發(fā)展預警模型建立[D];燕山大學;2015年
2 陳小志;輸電線路鳥害預警模型及系統(tǒng)的設計與實現(xiàn)[D];電子科技大學;2014年
3 汪旭穎;基于支持向量回歸機的油田異常井預警模型研究[D];東北石油大學;2015年
4 劉若辰;我國建筑業(yè)上市公司財務危機預警模型研究[D];山東建筑大學;2016年
5 王敏蝦;基于邏輯回歸關聯(lián)規(guī)則的疾病預警模型[D];山東大學;2016年
6 明杰;企業(yè)安全生產(chǎn)預警模型與應用研究[D];首都經(jīng)濟貿(mào)易大學;2016年
7 王若佳;基于互聯(lián)網(wǎng)搜索數(shù)據(jù)的流感預警模型比較與優(yōu)化[D];南開大學;2016年
8 潘志兵;我國上市公司財務失敗預警模型的實證研究及應用[D];西北工業(yè)大學;2002年
9 尚紅超;金融危機預警模型的系統(tǒng)研究[D];東北財經(jīng)大學;2010年
10 張海蘭;基于平衡計分卡的企業(yè)預警模型構建研究[D];首都經(jīng)濟貿(mào)易大學;2006年
,本文編號:820585
本文鏈接:http://sikaile.net/yixuelunwen/chuanranbingxuelunwen/820585.html