天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

一種多模型集成的網(wǎng)絡(luò)論壇流量預(yù)測模型

發(fā)布時間:2021-06-12 04:28
  論壇流量預(yù)測對網(wǎng)絡(luò)規(guī)劃、輿情管理等任務(wù)具有重要意義,針對線性預(yù)測模型無法預(yù)測非線性關(guān)系、非線性預(yù)測模型的特征工程過于復(fù)雜的問題,利用歷史時間序列作為特征,建立一種基于不同算法的集成模型以預(yù)測論壇發(fā)帖量。運用差分自回歸移動平均、長短期記憶神經(jīng)網(wǎng)絡(luò)、Prophet以及梯度提升決策樹4種模型分別對時間序列進行預(yù)測,參照加權(quán)投票法的思想,各模型投票選出時間序列單位下密度較大的預(yù)測值區(qū)間,依據(jù)各模型預(yù)測值所處區(qū)間的密度大小對各預(yù)測值進行權(quán)重分配,然后通過加權(quán)平均得到最終的預(yù)測結(jié)果。實驗結(jié)果表明,與算術(shù)平均模型、基于均方根誤差的加權(quán)平均模型相比,該模型預(yù)測結(jié)果的RMSE值以及相對誤差值更小。 

【文章來源】:計算機工程. 2020,46(12)北大核心CSCD

【文章頁數(shù)】:8 頁

【部分圖文】:

一種多模型集成的網(wǎng)絡(luò)論壇流量預(yù)測模型


集成模型流程

模型圖,預(yù)測值,模型,區(qū)間


圖2所示為5個子模型對2018年8月17日股吧論壇發(fā)帖量的預(yù)測值。從圖2可以看出,當k值取28時,LSTM、Prophet以及GBDT 3個子模型的預(yù)測值位于同一區(qū)間且該區(qū)間為密度最大的區(qū)間,表明當日真實值最有可能位于此區(qū)間。因此,賦予這個區(qū)間的3個子模型預(yù)測值較大的權(quán)重,并對預(yù)測值不在該區(qū)間的ARIMA模型和算術(shù)平均模型賦予較小的權(quán)重,從而降低此時間尺度單位下ARIMA模型和算術(shù)平均模型預(yù)測值過小對最終結(jié)果產(chǎn)生的影響,提高預(yù)測精度。綜上,本文集成模型算法描述如下:

時間序列,論壇,時間序列


本文實驗數(shù)據(jù)集包含股吧論壇所有子論壇從2017年7月1日—2018年9月30日的每日發(fā)帖量數(shù)據(jù),共457條。將2017年7月1日—2017年8月15日的發(fā)帖量作為測試集,依據(jù)不同的算法建立子模型以預(yù)測2017年8月16日—2018年9月28日的發(fā)帖量,并與實際情況相比較。股吧論壇發(fā)帖量的時間序列如圖3所示,可以看出,股吧論壇發(fā)帖量的時間序列具有周和年2種周期性。在數(shù)據(jù)集預(yù)處理時對數(shù)據(jù)集中的缺失項進行中位數(shù)插值。此外,2018年9月27日與9月28日兩天受國慶節(jié)放假影響,數(shù)據(jù)量偏高,因此,在分析結(jié)果時刪除這2條異常數(shù)據(jù)。

【參考文獻】:
期刊論文
[1]基于維度加權(quán)的殘差LSTM短期交通流量預(yù)測[J]. 李月龍,唐德華,姜桂圓,肖志濤,耿磊,張芳,吳駿.  計算機工程. 2019(06)
[2]基于GMM-FMs的廣告點擊率預(yù)測研究[J]. 鄧路佳,劉平山.  計算機工程. 2019(05)



本文編號:3225950

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/guanlilunwen/ydhl/3225950.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶b8cce***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com