基于集成學(xué)習(xí)的交通流量預(yù)測(cè)方法研究
發(fā)布時(shí)間:2021-08-06 13:06
現(xiàn)代城市區(qū)域中,交通狀況通常會(huì)迅速變化,大部分城市中的道路基礎(chǔ)設(shè)施和交通資源已臨近飽和,無(wú)法通過(guò)增加基礎(chǔ)設(shè)施緩解交通擁堵問(wèn)題,日益增長(zhǎng)的私家車保有量也在不斷挑戰(zhàn)交通系統(tǒng)的極限。使用智能交通系統(tǒng)發(fā)現(xiàn)交通流量的規(guī)律并預(yù)測(cè)交通流量,從而制定管理分流措施逐漸成為交通管理的新模式,智能交通系統(tǒng)的應(yīng)用可以有效緩解交通擁堵,充分利用交通資源。隨著科技的不斷發(fā)展,智能交通系統(tǒng)通過(guò)傳感器,行車裝置收集交通數(shù)據(jù),使得動(dòng)態(tài)分析交通狀態(tài)與預(yù)測(cè)交通流量變?yōu)榭赡。本文使用集成學(xué)習(xí)作為一種提高預(yù)測(cè)精確度的方法,構(gòu)建并結(jié)合多個(gè)學(xué)習(xí)模型來(lái)完成學(xué)習(xí)任務(wù),集成預(yù)測(cè)結(jié)果保證精度。由于數(shù)據(jù)中隨機(jī)因素的影響,不同的學(xué)習(xí)模型會(huì)產(chǎn)生具有一定區(qū)別的預(yù)測(cè)結(jié)果,提出了一種基于極端梯度提升樹(shù)與支持向量回歸的堆疊集成預(yù)測(cè)模型,使用極端梯度提升樹(shù)轉(zhuǎn)換每個(gè)記錄的輸入,使用其預(yù)測(cè)結(jié)果形成的新特征,輸入通過(guò)粒子群優(yōu)化的支持向量回歸模型進(jìn)行再次學(xué)習(xí),形成預(yù)測(cè)模型。在城市區(qū)域數(shù)據(jù)的相關(guān)實(shí)驗(yàn)證明這種回歸與優(yōu)化組成的集成預(yù)測(cè)方法是有效的?紤]交通流會(huì)受路網(wǎng)結(jié)構(gòu)影響,存在空間相關(guān)性,提出了一種基于時(shí)空數(shù)據(jù)集成預(yù)測(cè)的交通流量預(yù)測(cè)方法,該方法使用隨機(jī)森林和Ligh...
【文章來(lái)源】:北方工業(yè)大學(xué)北京市
【文章頁(yè)數(shù)】:66 頁(yè)
【學(xué)位級(jí)別】:碩士
【部分圖文】:
集成學(xué)習(xí)模型
第二章相關(guān)工作研究6/202(()())(1)1exp(12)2TkTkkTPHxfxkT(2-2)P(H(x)f(x))代表集成模型的錯(cuò)誤率,是基學(xué)習(xí)器的錯(cuò)誤率,集成模型的分類錯(cuò)誤率與基學(xué)習(xí)器數(shù)量呈指數(shù)下降。這種負(fù)相關(guān)關(guān)系的前提是基分類器之間相互獨(dú)立,這在實(shí)際問(wèn)題中是不現(xiàn)實(shí)的,所以如何平衡準(zhǔn)確性與差異性是集成模型的最重要問(wèn)題,集成學(xué)習(xí)通過(guò)幾種不同的集成方式有效的找到了平衡點(diǎn)。2.1.2集成方式集成學(xué)習(xí)主要可以分為Bagging,Boosting,Stacking三大類別,旨在通過(guò)減少分類器的偏差和方差,平衡差異性來(lái)提高整體的準(zhǔn)確性[27]。其中一些集合方法,例如Bagging中的隨機(jī)森林(RandomForest,RF),僅用于減少方差,而其他集合方法,如增強(qiáng)Boosting,可以幫助減少偏差和方差。(1)BaggingBagging是起源最早的基本集成技術(shù)之一,是一種并行的集成學(xué)習(xí)方法,所有的基學(xué)習(xí)器不存在訓(xùn)練先后順序,相互之間具有一定的獨(dú)立性。Bagging可以描述為使用多個(gè)基學(xué)習(xí)器,分別對(duì)數(shù)據(jù)進(jìn)行學(xué)習(xí),最后結(jié)合得出結(jié)果,如果使用一樣的學(xué)習(xí)算法作為基學(xué)習(xí)器,難以保證各基學(xué)習(xí)器之間的獨(dú)立性,所以Bagging方法基于bootstrapping思想。圖2-2基于bootstrapping思想的Bagging方法bootstrapping思想把訓(xùn)練集看做全體數(shù)據(jù)的子集,訓(xùn)練集對(duì)全體數(shù)據(jù)學(xué)習(xí)后的估計(jì)等價(jià)于用采樣子集獲得的數(shù)據(jù)來(lái)估計(jì)訓(xùn)練集。其主要特點(diǎn)為每個(gè)基學(xué)習(xí)器
第二章相關(guān)工作研究7采用有放回的隨機(jī)抽樣來(lái)獲取訓(xùn)練數(shù)據(jù),各個(gè)基學(xué)習(xí)器之間沒(méi)有關(guān)聯(lián)。Bagging的這種特點(diǎn)意味著可以徹底實(shí)現(xiàn)數(shù)據(jù)并行訓(xùn)練,提升效率。(2)BoostingBoosting方法是近些年廣泛使用的梯度提升樹(shù)GBDT[28]和AdaBoost[29]等模型使用的主要方法。Boosting方法是一種串行的思想,將基學(xué)習(xí)器不斷提升,每一次構(gòu)造新的基學(xué)習(xí)器會(huì)考慮上一個(gè)學(xué)習(xí)器的效果,形成強(qiáng)學(xué)習(xí)模型。圖2-3Boosting方法以AdaBoost模型為例,該模型通過(guò)增加前一個(gè)基學(xué)習(xí)器錯(cuò)誤預(yù)測(cè)樣本的權(quán)值,使后一個(gè)基學(xué)習(xí)器對(duì)錯(cuò)誤樣本的關(guān)注度不斷提升,從而盡可能糾正錯(cuò)誤。AdaBoost的權(quán)值與樣本分布與其使用的指數(shù)損失函數(shù)關(guān)聯(lián)較強(qiáng),如算法2-1所示:算法2-1AdaBoost算法偽代碼輸入:訓(xùn)練集D={(x1,y1),…,(xn,yn)}基學(xué)習(xí)器算法Ψ迭代次數(shù)T1()1/txn2fort1,2,,Tdo3,;tthD4~()()ttxtPhxfx5if0.5tbreak611ln2ttt71()exp,if()()()exp,if()()ttttttthfZhfxxxxxx()exp()()ttttfhZxxx8endfor輸出:1()(())TtttHxsignahx
【參考文獻(xiàn)】:
期刊論文
[1]基于分類決策樹(shù)的城市內(nèi)部遷居人群通勤時(shí)間預(yù)測(cè)模型[J]. 吳靜嫻,楊敏,韓印. 交通運(yùn)輸系統(tǒng)工程與信息. 2019(06)
[2]基于深度學(xué)習(xí)的短時(shí)交通流預(yù)測(cè)[J]. 羅向龍,焦琴琴,牛力瑤,孫壯文. 計(jì)算機(jī)應(yīng)用研究. 2017(01)
[3]智能交通系統(tǒng)綜述[J]. 趙娜,袁家斌,徐晗. 計(jì)算機(jī)科學(xué). 2014(11)
[4]基于云遺傳的RBF神經(jīng)網(wǎng)絡(luò)的交通流量預(yù)測(cè)[J]. 張琛,徐國(guó)麗. 計(jì)算機(jī)工程與應(yīng)用. 2014(16)
[5]集成學(xué)習(xí)算法的研究與應(yīng)用[J]. 侯勇,鄭雪峰. 計(jì)算機(jī)工程與應(yīng)用. 2012(34)
[6]An autoregressive integrated moving average model for short-term prediction of hepatitis C virus seropositivity among male volunteer blood donors in Karachi,Pakistan[J]. Saeed Akhtar,Shafquat Rozi. World Journal of Gastroenterology. 2009(13)
[7]智能交通系統(tǒng)研究回顧與展望[J]. 吳小強(qiáng),李鵬,曲衛(wèi)民. 國(guó)外公路. 2000(04)
本文編號(hào):3325829
【文章來(lái)源】:北方工業(yè)大學(xué)北京市
【文章頁(yè)數(shù)】:66 頁(yè)
【學(xué)位級(jí)別】:碩士
【部分圖文】:
集成學(xué)習(xí)模型
第二章相關(guān)工作研究6/202(()())(1)1exp(12)2TkTkkTPHxfxkT(2-2)P(H(x)f(x))代表集成模型的錯(cuò)誤率,是基學(xué)習(xí)器的錯(cuò)誤率,集成模型的分類錯(cuò)誤率與基學(xué)習(xí)器數(shù)量呈指數(shù)下降。這種負(fù)相關(guān)關(guān)系的前提是基分類器之間相互獨(dú)立,這在實(shí)際問(wèn)題中是不現(xiàn)實(shí)的,所以如何平衡準(zhǔn)確性與差異性是集成模型的最重要問(wèn)題,集成學(xué)習(xí)通過(guò)幾種不同的集成方式有效的找到了平衡點(diǎn)。2.1.2集成方式集成學(xué)習(xí)主要可以分為Bagging,Boosting,Stacking三大類別,旨在通過(guò)減少分類器的偏差和方差,平衡差異性來(lái)提高整體的準(zhǔn)確性[27]。其中一些集合方法,例如Bagging中的隨機(jī)森林(RandomForest,RF),僅用于減少方差,而其他集合方法,如增強(qiáng)Boosting,可以幫助減少偏差和方差。(1)BaggingBagging是起源最早的基本集成技術(shù)之一,是一種并行的集成學(xué)習(xí)方法,所有的基學(xué)習(xí)器不存在訓(xùn)練先后順序,相互之間具有一定的獨(dú)立性。Bagging可以描述為使用多個(gè)基學(xué)習(xí)器,分別對(duì)數(shù)據(jù)進(jìn)行學(xué)習(xí),最后結(jié)合得出結(jié)果,如果使用一樣的學(xué)習(xí)算法作為基學(xué)習(xí)器,難以保證各基學(xué)習(xí)器之間的獨(dú)立性,所以Bagging方法基于bootstrapping思想。圖2-2基于bootstrapping思想的Bagging方法bootstrapping思想把訓(xùn)練集看做全體數(shù)據(jù)的子集,訓(xùn)練集對(duì)全體數(shù)據(jù)學(xué)習(xí)后的估計(jì)等價(jià)于用采樣子集獲得的數(shù)據(jù)來(lái)估計(jì)訓(xùn)練集。其主要特點(diǎn)為每個(gè)基學(xué)習(xí)器
第二章相關(guān)工作研究7采用有放回的隨機(jī)抽樣來(lái)獲取訓(xùn)練數(shù)據(jù),各個(gè)基學(xué)習(xí)器之間沒(méi)有關(guān)聯(lián)。Bagging的這種特點(diǎn)意味著可以徹底實(shí)現(xiàn)數(shù)據(jù)并行訓(xùn)練,提升效率。(2)BoostingBoosting方法是近些年廣泛使用的梯度提升樹(shù)GBDT[28]和AdaBoost[29]等模型使用的主要方法。Boosting方法是一種串行的思想,將基學(xué)習(xí)器不斷提升,每一次構(gòu)造新的基學(xué)習(xí)器會(huì)考慮上一個(gè)學(xué)習(xí)器的效果,形成強(qiáng)學(xué)習(xí)模型。圖2-3Boosting方法以AdaBoost模型為例,該模型通過(guò)增加前一個(gè)基學(xué)習(xí)器錯(cuò)誤預(yù)測(cè)樣本的權(quán)值,使后一個(gè)基學(xué)習(xí)器對(duì)錯(cuò)誤樣本的關(guān)注度不斷提升,從而盡可能糾正錯(cuò)誤。AdaBoost的權(quán)值與樣本分布與其使用的指數(shù)損失函數(shù)關(guān)聯(lián)較強(qiáng),如算法2-1所示:算法2-1AdaBoost算法偽代碼輸入:訓(xùn)練集D={(x1,y1),…,(xn,yn)}基學(xué)習(xí)器算法Ψ迭代次數(shù)T1()1/txn2fort1,2,,Tdo3,;tthD4~()()ttxtPhxfx5if0.5tbreak611ln2ttt71()exp,if()()()exp,if()()ttttttthfZhfxxxxxx()exp()()ttttfhZxxx8endfor輸出:1()(())TtttHxsignahx
【參考文獻(xiàn)】:
期刊論文
[1]基于分類決策樹(shù)的城市內(nèi)部遷居人群通勤時(shí)間預(yù)測(cè)模型[J]. 吳靜嫻,楊敏,韓印. 交通運(yùn)輸系統(tǒng)工程與信息. 2019(06)
[2]基于深度學(xué)習(xí)的短時(shí)交通流預(yù)測(cè)[J]. 羅向龍,焦琴琴,牛力瑤,孫壯文. 計(jì)算機(jī)應(yīng)用研究. 2017(01)
[3]智能交通系統(tǒng)綜述[J]. 趙娜,袁家斌,徐晗. 計(jì)算機(jī)科學(xué). 2014(11)
[4]基于云遺傳的RBF神經(jīng)網(wǎng)絡(luò)的交通流量預(yù)測(cè)[J]. 張琛,徐國(guó)麗. 計(jì)算機(jī)工程與應(yīng)用. 2014(16)
[5]集成學(xué)習(xí)算法的研究與應(yīng)用[J]. 侯勇,鄭雪峰. 計(jì)算機(jī)工程與應(yīng)用. 2012(34)
[6]An autoregressive integrated moving average model for short-term prediction of hepatitis C virus seropositivity among male volunteer blood donors in Karachi,Pakistan[J]. Saeed Akhtar,Shafquat Rozi. World Journal of Gastroenterology. 2009(13)
[7]智能交通系統(tǒng)研究回顧與展望[J]. 吳小強(qiáng),李鵬,曲衛(wèi)民. 國(guó)外公路. 2000(04)
本文編號(hào):3325829
本文鏈接:http://sikaile.net/guanlilunwen/lindaojc/3325829.html
最近更新
教材專著