基于出租車軌跡數(shù)據(jù)挖掘的推薦模型研究
本文關(guān)鍵詞:基于出租車軌跡數(shù)據(jù)挖掘的推薦模型研究,由筆耕文化傳播整理發(fā)布。
【摘要】:隨著出租車行業(yè)的快速發(fā)展,出租車彌補了公共交通和私人交通的不足之處,成為了人們?nèi)粘3鲂兄斜夭豢缮俚慕煌üぞ咧?在交通出行中起到了扮演了重要的角色。目前,北京市的交通狀況正在逐步惡化,一方面,“打車難”成為交通出行的普遍現(xiàn)象;與之相對應(yīng)的,有些時間段,很多出租車因為在路上載不到乘客而空載,出現(xiàn)“空車跑”的現(xiàn)象。這些空載的情況不僅會提高出租車司機的運營成本、減少收入,而且會給現(xiàn)有的交通狀況帶來額外的負擔(dān),同時還會加重環(huán)境污染和能源浪費的問題;谝陨系脑,如何有效的改善出租車與乘客之間的供需關(guān)系,達到供需平衡成為一個亟待解決的問題。近些年來,為了安全考慮和調(diào)度方便,很多大城市如上海、深圳、北京等都在出租車上裝備了GPS定位設(shè)備。這些GPS定位設(shè)備會以一定的頻率向出租車管理中心發(fā)送車輛的狀態(tài)信息,包括所在的經(jīng)緯度、時間以及載客狀態(tài)等。這些數(shù)據(jù)不斷積累,生成了大量的出租車GPS軌跡數(shù)據(jù)。出租車GPS軌跡數(shù)據(jù)包括了兩方面的內(nèi)容,一方面是出租車乘客的出行信息,例如乘客什么時候上車、下車,出行的出發(fā)地和目的地等,可以用來研究居民的日常出行行為;另一方面,出租車的行駛路線包括了出租車司機的習(xí)慣和行為,例如在哪些地方能夠找到乘客、怎樣的行駛的路線最近、油耗最少、時間最短等等,可以用來研究城市道路的最短路徑和交通擁堵情況。通過對以上兩方面的研究,本文通過挖掘大量的出租車GPS軌跡數(shù)據(jù),提出了針對打車乘客的乘客候車點推薦模型和針對出租車司機的乘客訂單推薦模型。具體包括兩方面的內(nèi)容:一方面,通過對大量的GPS軌跡數(shù)據(jù)的挖掘,發(fā)現(xiàn)出租車司機的日常行為特點,為正在打車的乘客推薦步行可以到達的最有可能遇到空載的出租車的地點,這些地點在文中稱為出租車?奎c,向乘客推薦候車點,有效的減少了乘客的等車時間,緩解出租車和乘客之間的供需矛盾;另一方面,通過改進CKNN算法,根據(jù)正在尋找乘客的出租車司機的地理位置和當(dāng)前的時間,為司機尋找最適合的乘客候選集,并提出兩個影響出租車司機選擇乘客行為的指標(biāo):乘客目的地的熱門程度和司機偏好相關(guān)度,利用BP神經(jīng)網(wǎng)絡(luò)算法構(gòu)建乘客推薦模型進行乘客訂單篩選,為出租車司機推薦最佳的乘客集,從而有助于減少出租車的空載時間,提高司機的收益,同時也能達到減少油耗,降低污染的目的。本文的主要貢獻如下:本文從出租車的GPS軌跡數(shù)據(jù)出發(fā),通過聚類算法挖掘那些利潤較高的出租車司機,并研究他們在非乘客高峰時間停車等待乘客的行為特點,根據(jù)這些出租車?奎c的特征,提出一種可以準(zhǔn)確的挖掘出租車?奎c的候選軌跡點的算法,通過對候選軌跡點的過濾和聚類,得到了真正的出租車?奎c,從而構(gòu)建了基于出租車候車點的乘客推薦模型,在有乘客發(fā)出打車需求時,實時檢索乘客附近的出租車?奎c,該?奎c即為乘客最佳的候車點。本文改進了原有的CKNN算法,提出一種近似的CKNN算法來實時檢索出租車附近的候選乘客集,通過對出租車GPS軌跡數(shù)據(jù)的挖掘,提出兩個影響出租車司機選擇乘客行為的指標(biāo):乘客目的地的熱門程度、與司機的偏好相關(guān)度,可以通過挖掘出租車的熱點載客區(qū)域計算乘客目的地的熱門程度,通過挖掘出租車的歷史行駛軌跡來計算司機的偏好相關(guān)度,最后利用BP神經(jīng)網(wǎng)絡(luò)算法構(gòu)建乘客推薦模型,利用模型判定候選乘客集中每個乘客的推薦程度,為出租車司機推薦最佳的候選乘客集。
【關(guān)鍵詞】:出租車軌跡數(shù)據(jù) DBCSAN聚類 出租車?奎c 熱點區(qū)域司機偏好
【學(xué)位授予單位】:首都經(jīng)濟貿(mào)易大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2015
【分類號】:F572;F224
【目錄】:
- 摘要5-7
- ABSTRACT7-11
- 1 緒論11-18
- 1.1 引言11
- 1.2 研究背景與意義11-12
- 1.3 相關(guān)文獻綜述12-14
- 1.4 論文的目標(biāo)、主要內(nèi)容、織結(jié)構(gòu)及創(chuàng)新點14-18
- 1.4.1 論文目標(biāo)14-15
- 1.4.2 論文主要內(nèi)容15-16
- 1.4.3 論文組織結(jié)構(gòu)16-17
- 1.4.4 論文主要創(chuàng)新點17-18
- 2 出租車軌跡數(shù)據(jù)挖掘的基本理論和相關(guān)技術(shù)18-25
- 2.1 出租車軌跡數(shù)據(jù)挖掘的基本理論18-21
- 2.1.1 出租車軌跡數(shù)據(jù)基本概念18-19
- 2.1.2 出租車軌跡數(shù)據(jù)的基本特征19
- 2.1.3 出租車軌跡數(shù)據(jù)的來源和獲取方法19-21
- 2.1.3.1 浮動車采集技術(shù)19-20
- 2.1.3.2 出租車軌跡數(shù)據(jù)的來源20-21
- 2.2 軌跡數(shù)據(jù)挖掘的相關(guān)技術(shù)21-24
- 2.2.1 軌跡數(shù)據(jù)挖掘方法21-22
- 2.2.2 基于密度的聚類算法22-24
- 2.2.2.1 DBSCAN算法22-23
- 2.2.2.2 OPTICS算法23-24
- 2.3 其他相關(guān)技術(shù)24-25
- 2.3.1 GPS定位技術(shù)24
- 2.3.2 手機移動定位技術(shù)24-25
- 3 出租車軌跡數(shù)據(jù)預(yù)處理25-30
- 3.1 軌跡數(shù)據(jù)預(yù)處理25-28
- 3.1.1 數(shù)據(jù)冗余處理26
- 3.1.2 數(shù)據(jù)缺失處理26-27
- 3.1.3 數(shù)據(jù)漂移處理27-28
- 3.2 地圖匹配28-30
- 4 基于出租車軌跡數(shù)據(jù)挖掘的乘客候車點推薦模型30-40
- 4.1 乘客候車點30-31
- 4.2 出租車?奎c挖掘31-36
- 4.2.1 出租車?奎c搜索算法31-33
- 4.2.2 出租車?奎c過濾33-35
- 4.2.3 候選點群OPTICS方法聚類35-36
- 4.3 乘客最佳候車點推薦36-37
- 4.4 模型實證37-40
- 4.4.1 出租車?奎c驗證38-39
- 4.4.2 實地測試39-40
- 5 基于出租車軌跡數(shù)據(jù)挖掘的乘客推薦模型40-58
- 5.1 研究動因40-41
- 5.2 候選乘客集檢索41-45
- 5.2.1 出租車的近似連續(xù)k近鄰檢索(CkNN )41-44
- 5.2.2 候選乘客集44-45
- 5.3 出租車熱點載客區(qū)域檢測45-49
- 5.3.1 數(shù)據(jù)處理46
- 5.3.2 出租車載客時間段劃分46-48
- 5.3.3 按時段進行DBSCAN聚類48-49
- 5.4 司機偏好挖掘49-51
- 5.4.1 載客重點區(qū)域挖掘50-51
- 5.4.2 司機偏好相關(guān)度51
- 5.5 乘客推薦模型的建立51-53
- 5.5.1 BP神經(jīng)網(wǎng)絡(luò)模型51-53
- 5.5.2 乘客推薦模型53
- 5.6 基于MatLab的乘客推薦模型仿真實驗53-58
- 6 總結(jié)及展望58-60
- 6.1 現(xiàn)階段工作總結(jié)58-59
- 6.2 前景及展望59-60
- 致謝60-61
- 參考文獻61-65
- 在學(xué)期間發(fā)表的學(xué)術(shù)論文及研究成果65-66
【參考文獻】
中國期刊全文數(shù)據(jù)庫 前5條
1 程鵬飛;閆浩文;韓振輝;;一個求解多邊形最小面積外接矩形的算法[J];工程圖學(xué)學(xué)報;2008年01期
2 付鵬;;采用層次分析法確定技術(shù)標(biāo)權(quán)重的實踐[J];價值工程;2012年24期
3 Dao-Zheng Zhang;Daniel (Jian) Sun;Zhong-Ren Peng;;A Comprehensive Taxi Assessment Index Using Floating Car Data[J];Journal of Harbin Institute of Technology;2014年01期
4 賀桂和;;基于用戶偏好挖掘的電子商務(wù)協(xié)同過濾推薦算法研究[J];情報科學(xué);2013年12期
5 唐爐亮;常曉猛;李清泉;SHAW S L;;基于蟻群優(yōu)化算法與出租車GPS數(shù)據(jù)的公眾出行路徑優(yōu)化[J];中國公路學(xué)報;2011年02期
中國博士學(xué)位論文全文數(shù)據(jù)庫 前2條
1 尹華罡;基于海量時空數(shù)據(jù)的路線挖掘與檢索[D];中國科學(xué)技術(shù)大學(xué);2012年
2 王冠男;基于GPS軌跡和照片軌跡的時空數(shù)據(jù)挖掘[D];中南大學(xué);2013年
中國碩士學(xué)位論文全文數(shù)據(jù)庫 前1條
1 溫雅靜;基于熱點載客區(qū)域的出租車應(yīng)急調(diào)度方案研究[D];北京交通大學(xué);2014年
本文關(guān)鍵詞:基于出租車軌跡數(shù)據(jù)挖掘的推薦模型研究,,由筆耕文化傳播整理發(fā)布。
本文編號:387244
本文鏈接:http://sikaile.net/jingjilunwen/jingjiguanlilunwen/387244.html