基于公交車刷卡數(shù)據(jù)的客流分析研究
本文關(guān)鍵詞:基于公交車刷卡數(shù)據(jù)的客流分析研究 出處:《北方工業(yè)大學(xué)》2017年碩士論文 論文類型:學(xué)位論文
更多相關(guān)文章: 公交IC卡數(shù)據(jù) 數(shù)據(jù)清洗 時空屬性數(shù)據(jù) 海量數(shù)據(jù) 公交客流量 公交站間運達(dá)時速
【摘要】:公交行業(yè)的發(fā)展,產(chǎn)生了海量多元的公交IC卡刷卡數(shù)據(jù),為行業(yè)應(yīng)用提供快速、準(zhǔn)確的站點客流量統(tǒng)計,以及站間公交時速的服務(wù)一直是智能公交建設(shè)的重點。以往對站點客流量的研究只是針對上下車客流量進行了簡單的數(shù)據(jù)統(tǒng)計;在站點換乘客流量方面,根據(jù)站點吸引等方法對站點換乘客流量進行預(yù)測,缺乏大量出行記錄作為其數(shù)據(jù)支撐,使得準(zhǔn)確度不高;在公交站點區(qū)間行程時間及公交站間運達(dá)時速等方面的研究,也主要集中于小規(guī)模樣本數(shù)據(jù)統(tǒng)計的基礎(chǔ)上進行的預(yù)測,提出的并行算法在海量數(shù)據(jù)規(guī)模下不具備水平擴展能力。本文在總結(jié)已有的相關(guān)工作和研究成果的基礎(chǔ)上,對海量公交刷卡數(shù)據(jù)進行數(shù)據(jù)清洗,并在此基礎(chǔ)上,根據(jù)數(shù)據(jù)所具有的時空特性對站點客流量、及站間公交運達(dá)時速等方面進行分析研究,并對提出的計算分析方法在Hadoop MapReduce上進行了實現(xiàn)驗證,具體的研究工作如下:(1)在公交數(shù)據(jù)清洗方面,針對具有時空屬性的原始公交IC卡數(shù)據(jù),提出了在大數(shù)據(jù)環(huán)境下基于時間的聚類、和基于規(guī)則的過濾的分析計算方法;跁r間的聚類主要是根據(jù)時間一致性原則判斷數(shù)據(jù)時間范圍,并根據(jù)數(shù)據(jù)所在城市,即北京市的交通運營情況等,采取基于規(guī)則的過濾策略,對異常數(shù)據(jù)進行修改、剔除,為后續(xù)對數(shù)據(jù)的深入分析提供了數(shù)據(jù)支持。(2)在公交站點客流量方面,主要針對站點上下車客流量、站點換乘客流量進行分析:在公交站點上下車客流量方面,提出了在大數(shù)據(jù)環(huán)境下的一種公交刷卡時間的聚類方法,通過對每趟次刷卡數(shù)據(jù)的聚類分析,來判斷該輛車上車刷卡數(shù)據(jù)或下車刷卡數(shù)據(jù)的歸屬時間段,在清洗后的數(shù)據(jù)基礎(chǔ)上,通過兩次計算得到所有站點在不同時間段的上車刷卡數(shù)據(jù)量和下車刷卡數(shù)據(jù)量;在站點換乘客流量方面,通過時空等條件的約束,判斷是否有換乘行為,進而得到站點在不同時段的換乘客流量。(3)在反映相鄰站間客流運達(dá)能力方面,針對相鄰站間公交運達(dá)時速進行了分析,提出了在大數(shù)據(jù)環(huán)境下對公交車在站點停靠時刻、離站時刻的計算分析方法,在清洗后的公交刷卡數(shù)據(jù)的基礎(chǔ)上,根據(jù)上述方法,計算公交車在不同線路方向上的相鄰站點區(qū)間的行程時間和站間公交運達(dá)時速。本文搭建了實驗環(huán)境,在Hadoop平臺上,采用HDFS來存儲海量原始公交刷卡數(shù)據(jù)及中間結(jié)果集,采用MapReduce編程模型對大規(guī)模數(shù)據(jù)集進行并行處理,并通過大量實驗,對上述計算分析方法在大數(shù)據(jù)環(huán)境下的可行性、準(zhǔn)確性及擴展性進行了驗證。
[Abstract]:......
【學(xué)位授予單位】:北方工業(yè)大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2017
【分類號】:TP311.13
【參考文獻】
相關(guān)期刊論文 前10條
1 張慶;;基于大數(shù)據(jù)的公交車GPS歷史軌跡的數(shù)據(jù)處理[J];物聯(lián)網(wǎng)技術(shù);2016年04期
2 周敏;韓印;姚佼;;基于廣義回歸神經(jīng)網(wǎng)絡(luò)的公交車運行時間預(yù)測模型[J];交通與運輸(學(xué)術(shù)版);2013年02期
3 左忠義;汪磊;;公交到站時間實時預(yù)測信息發(fā)布技術(shù)研究[J];交通運輸系統(tǒng)工程與信息;2013年01期
4 周雪梅;楊熙宇;吳曉飛;;基于IC卡信息的公交客流起止點反推方法[J];同濟大學(xué)學(xué)報(自然科學(xué)版);2012年07期
5 陳紹輝;陳艷艷;尹長勇;;基于特征站點的公交IC卡數(shù)據(jù)站點匹配方法研究[J];北京工業(yè)大學(xué)學(xué)報;2012年06期
6 陳紹輝;陳艷艷;賴見輝;;基于GPS與IC卡數(shù)據(jù)的公交站點匹配方法[J];公路交通科技;2012年05期
7 亓開元;趙卓峰;房俊;馬強;;針對高速數(shù)據(jù)流的大規(guī)模數(shù)據(jù)實時處理方法[J];計算機學(xué)報;2012年03期
8 張孜;鄒亮;朱玲湘;;基于公交IC卡的公交換乘數(shù)據(jù)獲取方法研究[J];交通信息與安全;2011年06期
9 張春輝;宋瑞;孫楊;;基于卡爾曼濾波的公交站點短時客流預(yù)測[J];交通運輸系統(tǒng)工程與信息;2011年04期
10 姚寶珍;楊成永;于濱;;動態(tài)公交車輛運行時間預(yù)測模型[J];系統(tǒng)工程學(xué)報;2010年03期
相關(guān)博士學(xué)位論文 前1條
1 宋曉梅;常規(guī)公交網(wǎng)絡(luò)運行可靠性多層次評價模型與算法[D];北京交通大學(xué);2010年
相關(guān)碩士學(xué)位論文 前10條
1 盧帥;移動對象數(shù)據(jù)流下相似軌跡查詢方法研究[D];北方工業(yè)大學(xué);2015年
2 王鑫;基于GPS數(shù)據(jù)的公交車?空緯r間預(yù)測研究[D];重慶大學(xué);2015年
3 湯月華;基于GPS數(shù)據(jù)的公交站點區(qū)間行程時間分布與可靠性分析[D];浙江大學(xué);2015年
4 靳佳;基于IC卡的北京市公交出行特征分析[D];首都師范大學(xué);2013年
5 唐真;基于hadoop的推薦系統(tǒng)設(shè)計與實現(xiàn)[D];電子科技大學(xué);2013年
6 吳祥國;基于公交IC卡和GPS數(shù)據(jù)的居民公交出行OD矩陣推導(dǎo)與應(yīng)用[D];山東大學(xué);2011年
7 姜文;基于Hadoop平臺的數(shù)據(jù)分析和應(yīng)用[D];北京郵電大學(xué);2011年
8 程功;基于公交到站時間預(yù)測的公交調(diào)度模型研究[D];華南理工大學(xué);2010年
9 章玉;基于數(shù)據(jù)挖掘的動態(tài)公交客流OD獲取方法研究[D];北京交通大學(xué);2010年
10 廖澤容;基于公交IC數(shù)據(jù)的公交客流量分析[D];云南大學(xué);2010年
,本文編號:1349611
本文鏈接:http://sikaile.net/shoufeilunwen/xixikjs/1349611.html