基于Twitter社交網(wǎng)絡數(shù)據(jù)的流感預測應用研究
發(fā)布時間:2024-01-19 15:22
隨著全球氣候變化,流感的發(fā)病人數(shù)大幅增加,嚴重流感的死亡率接近50%,因此對流感暴發(fā)進行預測研究愈發(fā)重要。現(xiàn)有研究中,已將社交媒體用于地震災害檢測和趨勢預測,本研究將機器學習算法和大數(shù)據(jù)方法結合應用于流感暴發(fā)的預測。通過文本分類模型實現(xiàn)Twitter社交網(wǎng)絡數(shù)據(jù)預處理,利用時間序列預測模型對澳大利亞昆士蘭州的流感疫情進行趨勢預測。本文主要研究內容如下:1)應用XGBoost算法實現(xiàn)流感數(shù)據(jù)文本分類,解決了傳統(tǒng)機器學習算法對于文本分類效果較差的問題。為了驗證該方法的性能,以Twitter數(shù)據(jù)為研究對象,首先通過關鍵詞過濾技術提取疑似流感數(shù)據(jù),然后采用XGBoost算法對疑似流感數(shù)據(jù)進行分類預測,并與傳統(tǒng)的樸素貝葉斯算法進行對比。實驗結果表明,XGBoost算法對Twitter數(shù)據(jù)的分類結果正確率為90%,明顯優(yōu)于樸素貝葉斯算法的分類結果,可用于Twitter數(shù)據(jù)中流感發(fā)病頻率及發(fā)病時間的提取。2)提出基于Twitter數(shù)據(jù)和溫度數(shù)據(jù)的多元時間序列預測模型,解決了一元時間序列預測模型時效性差、預測結果相對誤差較高的問題。首先通過2015年第1周至2017年第32周的流感歷史數(shù)據(jù),建立ARI...
【文章頁數(shù)】:62 頁
【學位級別】:碩士
本文編號:3880035
【文章頁數(shù)】:62 頁
【學位級別】:碩士
本文編號:3880035
本文鏈接:http://sikaile.net/kejilunwen/zidonghuakongzhilunwen/3880035.html
最近更新
教材專著