基于集成學習的交通流量預(yù)測方法研究

發(fā)布時間：2021-08-06 13:06

　　現(xiàn)代城市區(qū)域中,交通狀況通常會迅速變化,大部分城市中的道路基礎(chǔ)設(shè)施和交通資源已臨近飽和,無法通過增加基礎(chǔ)設(shè)施緩解交通擁堵問題,日益增長的私家車保有量也在不斷挑戰(zhàn)交通系統(tǒng)的極限。使用智能交通系統(tǒng)發(fā)現(xiàn)交通流量的規(guī)律并預(yù)測交通流量,從而制定管理分流措施逐漸成為交通管理的新模式,智能交通系統(tǒng)的應(yīng)用可以有效緩解交通擁堵,充分利用交通資源。隨著科技的不斷發(fā)展,智能交通系統(tǒng)通過傳感器,行車裝置收集交通數(shù)據(jù),使得動態(tài)分析交通狀態(tài)與預(yù)測交通流量變?yōu)榭赡�。本文使用集成學習作為一種提高預(yù)測精確度的方法,構(gòu)建并結(jié)合多個學習模型來完成學習任務(wù),集成預(yù)測結(jié)果保證精度。由于數(shù)據(jù)中隨機因素的影響,不同的學習模型會產(chǎn)生具有一定區(qū)別的預(yù)測結(jié)果,提出了一種基于極端梯度提升樹與支持向量回歸的堆疊集成預(yù)測模型,使用極端梯度提升樹轉(zhuǎn)換每個記錄的輸入,使用其預(yù)測結(jié)果形成的新特征,輸入通過粒子群優(yōu)化的支持向量回歸模型進行再次學習,形成預(yù)測模型。在城市區(qū)域數(shù)據(jù)的相關(guān)實驗證明這種回歸與優(yōu)化組成的集成預(yù)測方法是有效的。考慮交通流會受路網(wǎng)結(jié)構(gòu)影響,存在空間相關(guān)性,提出了一種基于時空數(shù)據(jù)集成預(yù)測的交通流量預(yù)測方法,該方法使用隨機森林和Ligh...

【文章來源】：北方工業(yè)大學北京市

【文章頁數(shù)】：66 頁

【學位級別】：碩士

【部分圖文】：

集成學習模型

思想,方法,學習器,集成模型

第二章相關(guān)工作研究6/202(()())(1)1exp(12)2TkTkkTPHxfxkT(2-2)P(H(x)f(x))代表集成模型的錯誤率，是基學習器的錯誤率，集成模型的分類錯誤率與基學習器數(shù)量呈指數(shù)下降。這種負相關(guān)關(guān)系的前提是基分類器之間相互獨立，這在實際問題中是不現(xiàn)實的，所以如何平衡準確性與差異性是集成模型的最重要問題，集成學習通過幾種不同的集成方式有效的找到了平衡點。2.1.2集成方式集成學習主要可以分為Bagging，Boosting，Stacking三大類別，旨在通過減少分類器的偏差和方差，平衡差異性來提高整體的準確性[27]。其中一些集合方法，例如Bagging中的隨機森林(RandomForest，RF)，僅用于減少方差，而其他集合方法，如增強Boosting，可以幫助減少偏差和方差。（1）BaggingBagging是起源最早的基本集成技術(shù)之一，是一種并行的集成學習方法，所有的基學習器不存在訓練先后順序，相互之間具有一定的獨立性。Bagging可以描述為使用多個基學習器，分別對數(shù)據(jù)進行學習，最后結(jié)合得出結(jié)果，如果使用一樣的學習算法作為基學習器，難以保證各基學習器之間的獨立性，所以Bagging方法基于bootstrapping思想。圖2-2基于bootstrapping思想的Bagging方法bootstrapping思想把訓練集看做全體數(shù)據(jù)的子集，訓練集對全體數(shù)據(jù)學習后的估計等價于用采樣子集獲得的數(shù)據(jù)來估計訓練集。其主要特點為每個基學習器

方法,學習器,算法,樣本

第二章相關(guān)工作研究7采用有放回的隨機抽樣來獲取訓練數(shù)據(jù)，各個基學習器之間沒有關(guān)聯(lián)。Bagging的這種特點意味著可以徹底實現(xiàn)數(shù)據(jù)并行訓練，提升效率。（2）BoostingBoosting方法是近些年廣泛使用的梯度提升樹GBDT[28]和AdaBoost[29]等模型使用的主要方法。Boosting方法是一種串行的思想，將基學習器不斷提升，每一次構(gòu)造新的基學習器會考慮上一個學習器的效果，形成強學習模型。圖2-3Boosting方法以AdaBoost模型為例，該模型通過增加前一個基學習器錯誤預(yù)測樣本的權(quán)值，使后一個基學習器對錯誤樣本的關(guān)注度不斷提升，從而盡可能糾正錯誤。AdaBoost的權(quán)值與樣本分布與其使用的指數(shù)損失函數(shù)關(guān)聯(lián)較強，如算法2-1所示：算法2-1AdaBoost算法偽代碼輸入：訓練集D={(x1,y1),…,(xn,yn)}基學習器算法Ψ迭代次數(shù)T1()1/txn2fort1,2,,Tdo3,;tthD4~()()ttxtPhxfx5if0.5tbreak611ln2ttt71()exp,if()()()exp,if()()ttttttthfZhfxxxxxx()exp()()ttttfhZxxx8endfor輸出：1()(())TtttHxsignahx

【參考文獻】：
期刊論文
[1]基于分類決策樹的城市內(nèi)部遷居人群通勤時間預(yù)測模型[J]. 吳靜嫻,楊敏,韓印.  交通運輸系統(tǒng)工程與信息. 2019(06)
[2]基于深度學習的短時交通流預(yù)測[J]. 羅向龍,焦琴琴,牛力瑤,孫壯文.  計算機應(yīng)用研究. 2017(01)
[3]智能交通系統(tǒng)綜述[J]. 趙娜,袁家斌,徐晗.  計算機科學. 2014(11)
[4]基于云遺傳的RBF神經(jīng)網(wǎng)絡(luò)的交通流量預(yù)測[J]. 張琛,徐國麗.  計算機工程與應(yīng)用. 2014(16)
[5]集成學習算法的研究與應(yīng)用[J]. 侯勇,鄭雪峰.  計算機工程與應(yīng)用. 2012(34)
[6]An autoregressive integrated moving average model for short-term prediction of hepatitis C virus seropositivity among male volunteer blood donors in Karachi,Pakistan[J]. Saeed Akhtar,Shafquat Rozi.  World Journal of Gastroenterology. 2009(13)
[7]智能交通系統(tǒng)研究回顧與展望[J]. 吳小強,李鵬,曲衛(wèi)民.  國外公路. 2000(04)

本文編號：3325829

資料下載

論文發(fā)表

支付寶下載

Download by Alipay
微信下載

Download by Wechat
會員下載

Download by Member

本文鏈接：http://sikaile.net/guanlilunwen/lindaojc/3325829.html

上一篇：中國女性領(lǐng)導者的特點與領(lǐng)導力提升路徑
下一篇：基于業(yè)財融合的財務(wù)管控研究 ——以A通信公司為例

論文發(fā)表

·知網(wǎng)|萬方|維普|龍源|省級|國家級|科技核心|北大核心|南大核心CSSCI|EI|SCI|SSCI|

天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

基于集成學習的交通流量預(yù)測方法研究