城市區(qū)域流量短期預(yù)測(cè)方法研究
發(fā)布時(shí)間:2020-03-19 18:28
【摘要】:隨著我國(guó)城市化進(jìn)程的加快、物聯(lián)網(wǎng)時(shí)代的到來(lái),越來(lái)越多的多源、異構(gòu)的數(shù)據(jù)可以被獲取到,這些數(shù)據(jù)為實(shí)現(xiàn)有效的城市區(qū)域流量預(yù)測(cè)提供了可能。城市區(qū)域流量預(yù)測(cè)是指通過(guò)技術(shù)手段,有效的利用獲取到的數(shù)據(jù)去預(yù)測(cè)未來(lái)短時(shí)城市區(qū)域流量,對(duì)城市的道路規(guī)劃、交通管理以及安全預(yù)警等具有重要作用。區(qū)域流量預(yù)測(cè)是一個(gè)多因素影響的時(shí)空序列預(yù)測(cè)問題,具有高維、強(qiáng)非線性等特點(diǎn),時(shí)間維和空間維的挖掘增加了區(qū)域流量預(yù)測(cè)任務(wù)的復(fù)雜性,使該任務(wù)的研究更具有挑戰(zhàn)性。正因?yàn)槿绱?研究合理有效的城市區(qū)域流量預(yù)測(cè)方法顯得尤為重要。本文從影響區(qū)域流量多種因素的角度出發(fā)進(jìn)行了深入的研究,主要以機(jī)器學(xué)習(xí)和深度學(xué)習(xí)為核心研究方法,具體的研究工作如下:1)針對(duì)城市區(qū)域流量受多因素影響的這一特征,給出了一種基于梯度提升樹(GBDT)的城市區(qū)域流量相關(guān)因素分析方法。首先對(duì)區(qū)域流量數(shù)據(jù)集進(jìn)行了描述和統(tǒng)計(jì)分析,然后通過(guò)特征提取,利用已有的時(shí)空數(shù)據(jù)集構(gòu)造新的數(shù)據(jù)集。實(shí)驗(yàn)結(jié)果表明GBDT方法可以實(shí)現(xiàn)對(duì)區(qū)域流量的有效預(yù)測(cè),同時(shí)對(duì)特征重要度進(jìn)行了分析,給出了相關(guān)因素序列,為后續(xù)的研究提供了基礎(chǔ)。2)針對(duì)城市區(qū)域流量的時(shí)間依賴和空間相關(guān)問題分別進(jìn)行了研究,提出了基于時(shí)間依賴性LSTM網(wǎng)絡(luò)實(shí)現(xiàn)城市區(qū)域流量的預(yù)測(cè)方法,給定不同的輸入形式,利用長(zhǎng)短期記憶(LSTM)神經(jīng)網(wǎng)絡(luò)獲取數(shù)據(jù)的時(shí)間依賴性。實(shí)驗(yàn)結(jié)果表明區(qū)域流量具有長(zhǎng)期時(shí)間依賴的特點(diǎn),以時(shí)間統(tǒng)計(jì)特征作為輸入更加合理有效。然后又提出了基于空間相關(guān)性卷積LSTM網(wǎng)絡(luò)實(shí)現(xiàn)城市區(qū)域流量的預(yù)測(cè)方法,該方法沿用時(shí)間統(tǒng)計(jì)特征作為輸入,在LSTM網(wǎng)絡(luò)的基礎(chǔ)上增加了卷積操作。實(shí)驗(yàn)結(jié)果表明,相比于LSTM方法,卷積有效的獲取到空間相關(guān)性,避免了空間特征的冗余,時(shí)空屬性考慮較為全面,同時(shí)兩種方法均實(shí)現(xiàn)了端到端的預(yù)測(cè)。3)針對(duì)外部事件對(duì)區(qū)域流量的影響以及更好的挖掘數(shù)據(jù)的時(shí)空特性,提出了基于多源數(shù)據(jù)融合與CRNN相結(jié)合的城市區(qū)域流量預(yù)測(cè)方法,該方法通過(guò)CNN和RNN的組合來(lái)挖掘數(shù)據(jù)的空間相關(guān)性,同時(shí)考慮到外部事件對(duì)于區(qū)域流量的影響,以全連接網(wǎng)絡(luò)的方式實(shí)現(xiàn)外部特征的挖掘。實(shí)驗(yàn)結(jié)果表明,卷積遞歸神經(jīng)網(wǎng)絡(luò)(CRNN)可以提取數(shù)據(jù)的空間特征,相比于Conv LSTM方法,提取能力更強(qiáng),同時(shí)外部特征的融入有效提升了方法的預(yù)測(cè)精度。
【圖文】:
圖 1-1 本文的主要研究?jī)?nèi)容1)通過(guò)對(duì)區(qū)域流量時(shí)空數(shù)據(jù)集和實(shí)際問題進(jìn)行分析,說(shuō)明城市區(qū)域流量受多因素影響這一特征,針對(duì)該特性,實(shí)現(xiàn)了一種基于梯度提升樹(GradientBoosting Decision Tree,GBDT)的城市區(qū)域流量短期預(yù)測(cè)方法。該方法通過(guò)給定的特征提取方法,利用已有的時(shí)空數(shù)據(jù)集構(gòu)造新的數(shù)據(jù)集,然后在新的訓(xùn)練集上有監(jiān)督的訓(xùn)練 GBDT 模型,對(duì)城市某一區(qū)域流量進(jìn)行預(yù)測(cè),,評(píng)估預(yù)測(cè)結(jié)果,對(duì)影響區(qū)域流量的相關(guān)因素做出詳細(xì)分析,并根據(jù)特征的重要程度給出影響因素序列,為后續(xù)的研究工作提供了基礎(chǔ)。2)針對(duì)城市區(qū)域流量的時(shí)間依賴性和空間相關(guān)性問題分別進(jìn)行了研究,首先提出了基于時(shí)間依賴性 LSTM 網(wǎng)絡(luò)實(shí)現(xiàn)城市區(qū)域流量預(yù)測(cè)的方法,給定兩種不同的輸入形式,分別為臨近性輸入和時(shí)間統(tǒng)計(jì)特征輸入,利用長(zhǎng)短期記憶(LSTM)神經(jīng)網(wǎng)絡(luò)獲取數(shù)據(jù)的時(shí)間依賴性。實(shí)驗(yàn)結(jié)果表明區(qū)域流量具有長(zhǎng)期時(shí)間依賴的特點(diǎn),以時(shí)間統(tǒng)計(jì)特征作為輸入更加合理有效。然后又提出了基于空間相關(guān)性卷積 LSTM 網(wǎng)絡(luò)實(shí)現(xiàn)城市區(qū)域流量預(yù)測(cè)的方法,該方法沿用時(shí)間統(tǒng)計(jì)特征作為輸入,將 LSTM 網(wǎng)絡(luò)結(jié)構(gòu)中 input to state 和 state to
每個(gè)小格子代表一個(gè)城市區(qū)域,以半小時(shí)為時(shí)間戳,將 GPS 軌跡分好的區(qū)域里進(jìn)行統(tǒng)計(jì),為了分析問題的全面性,在每個(gè)小格子 inflow 和 outflow 兩種數(shù)據(jù),inflow 表示流入信息,定義為上一區(qū)域,當(dāng)前時(shí)間段在該區(qū)域的個(gè)體數(shù)量。outflow 表示流出信息,間段在該區(qū)域,當(dāng)前時(shí)間段不在該區(qū)域的個(gè)體數(shù)量。每個(gè)時(shí)間段半小時(shí)為時(shí)間戳統(tǒng)計(jì),比如一天 24 個(gè)小時(shí)將統(tǒng)計(jì) 48 個(gè)時(shí)間戳的數(shù) outflow 的形式化定義如公式(2-11)和(2-12)所示。其中tx 表段的數(shù)據(jù);i 和 j 表示分割成 32*32 格子后,區(qū)域的坐標(biāo),也就是;P 表示第 t 個(gè)時(shí)間段的目標(biāo)的軌跡集合;kg 表示 k 時(shí)刻的目標(biāo)inflow: inf , ,11 ( , ) ( , )low i jt k kTr Px k g i j g i j (2outflow: , ,11 ( , ) ( , )outflow i jt k kTr Px k g i j g i j (2據(jù)集包含的時(shí)空數(shù)據(jù)形式如圖 2-1 所示,其中時(shí)間維度上的每一格都對(duì)應(yīng)映射好的城市范圍區(qū)域流量。
【學(xué)位授予單位】:哈爾濱工業(yè)大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2018
【分類號(hào)】:F299.2;F49
本文編號(hào):2590545
【圖文】:
圖 1-1 本文的主要研究?jī)?nèi)容1)通過(guò)對(duì)區(qū)域流量時(shí)空數(shù)據(jù)集和實(shí)際問題進(jìn)行分析,說(shuō)明城市區(qū)域流量受多因素影響這一特征,針對(duì)該特性,實(shí)現(xiàn)了一種基于梯度提升樹(GradientBoosting Decision Tree,GBDT)的城市區(qū)域流量短期預(yù)測(cè)方法。該方法通過(guò)給定的特征提取方法,利用已有的時(shí)空數(shù)據(jù)集構(gòu)造新的數(shù)據(jù)集,然后在新的訓(xùn)練集上有監(jiān)督的訓(xùn)練 GBDT 模型,對(duì)城市某一區(qū)域流量進(jìn)行預(yù)測(cè),,評(píng)估預(yù)測(cè)結(jié)果,對(duì)影響區(qū)域流量的相關(guān)因素做出詳細(xì)分析,并根據(jù)特征的重要程度給出影響因素序列,為后續(xù)的研究工作提供了基礎(chǔ)。2)針對(duì)城市區(qū)域流量的時(shí)間依賴性和空間相關(guān)性問題分別進(jìn)行了研究,首先提出了基于時(shí)間依賴性 LSTM 網(wǎng)絡(luò)實(shí)現(xiàn)城市區(qū)域流量預(yù)測(cè)的方法,給定兩種不同的輸入形式,分別為臨近性輸入和時(shí)間統(tǒng)計(jì)特征輸入,利用長(zhǎng)短期記憶(LSTM)神經(jīng)網(wǎng)絡(luò)獲取數(shù)據(jù)的時(shí)間依賴性。實(shí)驗(yàn)結(jié)果表明區(qū)域流量具有長(zhǎng)期時(shí)間依賴的特點(diǎn),以時(shí)間統(tǒng)計(jì)特征作為輸入更加合理有效。然后又提出了基于空間相關(guān)性卷積 LSTM 網(wǎng)絡(luò)實(shí)現(xiàn)城市區(qū)域流量預(yù)測(cè)的方法,該方法沿用時(shí)間統(tǒng)計(jì)特征作為輸入,將 LSTM 網(wǎng)絡(luò)結(jié)構(gòu)中 input to state 和 state to
每個(gè)小格子代表一個(gè)城市區(qū)域,以半小時(shí)為時(shí)間戳,將 GPS 軌跡分好的區(qū)域里進(jìn)行統(tǒng)計(jì),為了分析問題的全面性,在每個(gè)小格子 inflow 和 outflow 兩種數(shù)據(jù),inflow 表示流入信息,定義為上一區(qū)域,當(dāng)前時(shí)間段在該區(qū)域的個(gè)體數(shù)量。outflow 表示流出信息,間段在該區(qū)域,當(dāng)前時(shí)間段不在該區(qū)域的個(gè)體數(shù)量。每個(gè)時(shí)間段半小時(shí)為時(shí)間戳統(tǒng)計(jì),比如一天 24 個(gè)小時(shí)將統(tǒng)計(jì) 48 個(gè)時(shí)間戳的數(shù) outflow 的形式化定義如公式(2-11)和(2-12)所示。其中tx 表段的數(shù)據(jù);i 和 j 表示分割成 32*32 格子后,區(qū)域的坐標(biāo),也就是;P 表示第 t 個(gè)時(shí)間段的目標(biāo)的軌跡集合;kg 表示 k 時(shí)刻的目標(biāo)inflow: inf , ,11 ( , ) ( , )low i jt k kTr Px k g i j g i j (2outflow: , ,11 ( , ) ( , )outflow i jt k kTr Px k g i j g i j (2據(jù)集包含的時(shí)空數(shù)據(jù)形式如圖 2-1 所示,其中時(shí)間維度上的每一格都對(duì)應(yīng)映射好的城市范圍區(qū)域流量。
【學(xué)位授予單位】:哈爾濱工業(yè)大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2018
【分類號(hào)】:F299.2;F49
【參考文獻(xiàn)】
相關(guān)期刊論文 前1條
1 劉大有;陳慧靈;齊紅;楊博;;時(shí)空數(shù)據(jù)挖掘研究進(jìn)展[J];計(jì)算機(jī)研究與發(fā)展;2013年02期
本文編號(hào):2590545
本文鏈接:http://sikaile.net/jingjilunwen/jingjiguanlilunwen/2590545.html
最近更新
教材專著