基于集成學習的交通流量預(yù)測方法研究
發(fā)布時間:2021-08-06 13:06
現(xiàn)代城市區(qū)域中,交通狀況通常會迅速變化,大部分城市中的道路基礎(chǔ)設(shè)施和交通資源已臨近飽和,無法通過增加基礎(chǔ)設(shè)施緩解交通擁堵問題,日益增長的私家車保有量也在不斷挑戰(zhàn)交通系統(tǒng)的極限。使用智能交通系統(tǒng)發(fā)現(xiàn)交通流量的規(guī)律并預(yù)測交通流量,從而制定管理分流措施逐漸成為交通管理的新模式,智能交通系統(tǒng)的應(yīng)用可以有效緩解交通擁堵,充分利用交通資源。隨著科技的不斷發(fā)展,智能交通系統(tǒng)通過傳感器,行車裝置收集交通數(shù)據(jù),使得動態(tài)分析交通狀態(tài)與預(yù)測交通流量變?yōu)榭赡。本文使用集成學習作為一種提高預(yù)測精確度的方法,構(gòu)建并結(jié)合多個學習模型來完成學習任務(wù),集成預(yù)測結(jié)果保證精度。由于數(shù)據(jù)中隨機因素的影響,不同的學習模型會產(chǎn)生具有一定區(qū)別的預(yù)測結(jié)果,提出了一種基于極端梯度提升樹與支持向量回歸的堆疊集成預(yù)測模型,使用極端梯度提升樹轉(zhuǎn)換每個記錄的輸入,使用其預(yù)測結(jié)果形成的新特征,輸入通過粒子群優(yōu)化的支持向量回歸模型進行再次學習,形成預(yù)測模型。在城市區(qū)域數(shù)據(jù)的相關(guān)實驗證明這種回歸與優(yōu)化組成的集成預(yù)測方法是有效的。考慮交通流會受路網(wǎng)結(jié)構(gòu)影響,存在空間相關(guān)性,提出了一種基于時空數(shù)據(jù)集成預(yù)測的交通流量預(yù)測方法,該方法使用隨機森林和Ligh...
【文章來源】:北方工業(yè)大學北京市
【文章頁數(shù)】:66 頁
【學位級別】:碩士
【部分圖文】:
集成學習模型
第二章相關(guān)工作研究6/202(()())(1)1exp(12)2TkTkkTPHxfxkT(2-2)P(H(x)f(x))代表集成模型的錯誤率,是基學習器的錯誤率,集成模型的分類錯誤率與基學習器數(shù)量呈指數(shù)下降。這種負相關(guān)關(guān)系的前提是基分類器之間相互獨立,這在實際問題中是不現(xiàn)實的,所以如何平衡準確性與差異性是集成模型的最重要問題,集成學習通過幾種不同的集成方式有效的找到了平衡點。2.1.2集成方式集成學習主要可以分為Bagging,Boosting,Stacking三大類別,旨在通過減少分類器的偏差和方差,平衡差異性來提高整體的準確性[27]。其中一些集合方法,例如Bagging中的隨機森林(RandomForest,RF),僅用于減少方差,而其他集合方法,如增強Boosting,可以幫助減少偏差和方差。(1)BaggingBagging是起源最早的基本集成技術(shù)之一,是一種并行的集成學習方法,所有的基學習器不存在訓練先后順序,相互之間具有一定的獨立性。Bagging可以描述為使用多個基學習器,分別對數(shù)據(jù)進行學習,最后結(jié)合得出結(jié)果,如果使用一樣的學習算法作為基學習器,難以保證各基學習器之間的獨立性,所以Bagging方法基于bootstrapping思想。圖2-2基于bootstrapping思想的Bagging方法bootstrapping思想把訓練集看做全體數(shù)據(jù)的子集,訓練集對全體數(shù)據(jù)學習后的估計等價于用采樣子集獲得的數(shù)據(jù)來估計訓練集。其主要特點為每個基學習器
第二章相關(guān)工作研究7采用有放回的隨機抽樣來獲取訓練數(shù)據(jù),各個基學習器之間沒有關(guān)聯(lián)。Bagging的這種特點意味著可以徹底實現(xiàn)數(shù)據(jù)并行訓練,提升效率。(2)BoostingBoosting方法是近些年廣泛使用的梯度提升樹GBDT[28]和AdaBoost[29]等模型使用的主要方法。Boosting方法是一種串行的思想,將基學習器不斷提升,每一次構(gòu)造新的基學習器會考慮上一個學習器的效果,形成強學習模型。圖2-3Boosting方法以AdaBoost模型為例,該模型通過增加前一個基學習器錯誤預(yù)測樣本的權(quán)值,使后一個基學習器對錯誤樣本的關(guān)注度不斷提升,從而盡可能糾正錯誤。AdaBoost的權(quán)值與樣本分布與其使用的指數(shù)損失函數(shù)關(guān)聯(lián)較強,如算法2-1所示:算法2-1AdaBoost算法偽代碼輸入:訓練集D={(x1,y1),…,(xn,yn)}基學習器算法Ψ迭代次數(shù)T1()1/txn2fort1,2,,Tdo3,;tthD4~()()ttxtPhxfx5if0.5tbreak611ln2ttt71()exp,if()()()exp,if()()ttttttthfZhfxxxxxx()exp()()ttttfhZxxx8endfor輸出:1()(())TtttHxsignahx
【參考文獻】:
期刊論文
[1]基于分類決策樹的城市內(nèi)部遷居人群通勤時間預(yù)測模型[J]. 吳靜嫻,楊敏,韓印. 交通運輸系統(tǒng)工程與信息. 2019(06)
[2]基于深度學習的短時交通流預(yù)測[J]. 羅向龍,焦琴琴,牛力瑤,孫壯文. 計算機應(yīng)用研究. 2017(01)
[3]智能交通系統(tǒng)綜述[J]. 趙娜,袁家斌,徐晗. 計算機科學. 2014(11)
[4]基于云遺傳的RBF神經(jīng)網(wǎng)絡(luò)的交通流量預(yù)測[J]. 張琛,徐國麗. 計算機工程與應(yīng)用. 2014(16)
[5]集成學習算法的研究與應(yīng)用[J]. 侯勇,鄭雪峰. 計算機工程與應(yīng)用. 2012(34)
[6]An autoregressive integrated moving average model for short-term prediction of hepatitis C virus seropositivity among male volunteer blood donors in Karachi,Pakistan[J]. Saeed Akhtar,Shafquat Rozi. World Journal of Gastroenterology. 2009(13)
[7]智能交通系統(tǒng)研究回顧與展望[J]. 吳小強,李鵬,曲衛(wèi)民. 國外公路. 2000(04)
本文編號:3325829
【文章來源】:北方工業(yè)大學北京市
【文章頁數(shù)】:66 頁
【學位級別】:碩士
【部分圖文】:
集成學習模型
第二章相關(guān)工作研究6/202(()())(1)1exp(12)2TkTkkTPHxfxkT(2-2)P(H(x)f(x))代表集成模型的錯誤率,是基學習器的錯誤率,集成模型的分類錯誤率與基學習器數(shù)量呈指數(shù)下降。這種負相關(guān)關(guān)系的前提是基分類器之間相互獨立,這在實際問題中是不現(xiàn)實的,所以如何平衡準確性與差異性是集成模型的最重要問題,集成學習通過幾種不同的集成方式有效的找到了平衡點。2.1.2集成方式集成學習主要可以分為Bagging,Boosting,Stacking三大類別,旨在通過減少分類器的偏差和方差,平衡差異性來提高整體的準確性[27]。其中一些集合方法,例如Bagging中的隨機森林(RandomForest,RF),僅用于減少方差,而其他集合方法,如增強Boosting,可以幫助減少偏差和方差。(1)BaggingBagging是起源最早的基本集成技術(shù)之一,是一種并行的集成學習方法,所有的基學習器不存在訓練先后順序,相互之間具有一定的獨立性。Bagging可以描述為使用多個基學習器,分別對數(shù)據(jù)進行學習,最后結(jié)合得出結(jié)果,如果使用一樣的學習算法作為基學習器,難以保證各基學習器之間的獨立性,所以Bagging方法基于bootstrapping思想。圖2-2基于bootstrapping思想的Bagging方法bootstrapping思想把訓練集看做全體數(shù)據(jù)的子集,訓練集對全體數(shù)據(jù)學習后的估計等價于用采樣子集獲得的數(shù)據(jù)來估計訓練集。其主要特點為每個基學習器
第二章相關(guān)工作研究7采用有放回的隨機抽樣來獲取訓練數(shù)據(jù),各個基學習器之間沒有關(guān)聯(lián)。Bagging的這種特點意味著可以徹底實現(xiàn)數(shù)據(jù)并行訓練,提升效率。(2)BoostingBoosting方法是近些年廣泛使用的梯度提升樹GBDT[28]和AdaBoost[29]等模型使用的主要方法。Boosting方法是一種串行的思想,將基學習器不斷提升,每一次構(gòu)造新的基學習器會考慮上一個學習器的效果,形成強學習模型。圖2-3Boosting方法以AdaBoost模型為例,該模型通過增加前一個基學習器錯誤預(yù)測樣本的權(quán)值,使后一個基學習器對錯誤樣本的關(guān)注度不斷提升,從而盡可能糾正錯誤。AdaBoost的權(quán)值與樣本分布與其使用的指數(shù)損失函數(shù)關(guān)聯(lián)較強,如算法2-1所示:算法2-1AdaBoost算法偽代碼輸入:訓練集D={(x1,y1),…,(xn,yn)}基學習器算法Ψ迭代次數(shù)T1()1/txn2fort1,2,,Tdo3,;tthD4~()()ttxtPhxfx5if0.5tbreak611ln2ttt71()exp,if()()()exp,if()()ttttttthfZhfxxxxxx()exp()()ttttfhZxxx8endfor輸出:1()(())TtttHxsignahx
【參考文獻】:
期刊論文
[1]基于分類決策樹的城市內(nèi)部遷居人群通勤時間預(yù)測模型[J]. 吳靜嫻,楊敏,韓印. 交通運輸系統(tǒng)工程與信息. 2019(06)
[2]基于深度學習的短時交通流預(yù)測[J]. 羅向龍,焦琴琴,牛力瑤,孫壯文. 計算機應(yīng)用研究. 2017(01)
[3]智能交通系統(tǒng)綜述[J]. 趙娜,袁家斌,徐晗. 計算機科學. 2014(11)
[4]基于云遺傳的RBF神經(jīng)網(wǎng)絡(luò)的交通流量預(yù)測[J]. 張琛,徐國麗. 計算機工程與應(yīng)用. 2014(16)
[5]集成學習算法的研究與應(yīng)用[J]. 侯勇,鄭雪峰. 計算機工程與應(yīng)用. 2012(34)
[6]An autoregressive integrated moving average model for short-term prediction of hepatitis C virus seropositivity among male volunteer blood donors in Karachi,Pakistan[J]. Saeed Akhtar,Shafquat Rozi. World Journal of Gastroenterology. 2009(13)
[7]智能交通系統(tǒng)研究回顧與展望[J]. 吳小強,李鵬,曲衛(wèi)民. 國外公路. 2000(04)
本文編號:3325829
本文鏈接:http://sikaile.net/guanlilunwen/lindaojc/3325829.html
教材專著