基于無監(jiān)督學(xué)習(xí)技術(shù)的位置大數(shù)據(jù)分析
本文關(guān)鍵詞: 出租車 軌跡 特征 出行方式 識別 出處:《浙江理工大學(xué)》2017年碩士論文 論文類型:學(xué)位論文
【摘要】:隨著社會的發(fā)展和科學(xué)技術(shù)的不斷進步,移動通信和傳感設(shè)備等位置感知技術(shù)形成了大量的位置數(shù)據(jù),對這些位置數(shù)據(jù)進行挖掘和分析,從而發(fā)現(xiàn)其潛在的有用信息,合理進行城市建設(shè)規(guī)劃和出行路線規(guī)劃,將會大大促進現(xiàn)代社會的智能化、信息化。同時,從人們出行的軌跡數(shù)據(jù)中得到其出行的交通方式,也將有助于研究人員從中推測人們對交通工具擁有情況、收入水平和職業(yè)情況。本文圍繞位置大數(shù)據(jù)進行了一些相關(guān)研究。首先,對出租車GPS軌跡數(shù)據(jù)進行分析,分析了可能產(chǎn)生數(shù)據(jù)誤差的影響因素,并有針對性地對原始數(shù)據(jù)做預(yù)處理,包括對數(shù)據(jù)進行誤差分析,數(shù)據(jù)處理依據(jù)和方法,之后對居民出行的起止點進行識別,并利用ArcGIS進行地圖的可視化呈現(xiàn);谔幚砗蟮腉PS數(shù)據(jù),分析了居民出行的時空分布特征,包括工作日和休息日的出行量,日出行的高峰時段,并得到了相關(guān)的結(jié)論。將聚類分析方法應(yīng)用到出租車GPS數(shù)據(jù)的應(yīng)用研究中,選取合理的聚類方法對研究區(qū)域進行交通小區(qū)的劃分,并建立出行OD矩陣。其次,采用基于時間空間聚類的K-Means方法,得到乘客上下車的活躍中心點,并結(jié)合ArcGIS空間分析工具,構(gòu)建緩沖區(qū)找到乘客最容易搭乘出租車的路段,解決了活躍中心點偏離道路的問題。此外,利用密度聚類的方法,對城市居民出行熱點區(qū)域的分布規(guī)律進行了研究,并與實際情況相結(jié)合,證明了本文方法的有效性。然后,為提高不同出行方式的識別率,提出了一種基于深度學(xué)習(xí)的出行方式識別模型,以微軟亞洲研究院收集的用戶GPS軌跡數(shù)據(jù)集為基礎(chǔ),利用時間特性提取不同出行方式對應(yīng)的GPS軌跡段,分析了不同出行方式的特征,考慮了迭代次數(shù)對均方根誤差和網(wǎng)絡(luò)訓(xùn)練運行時間的影響,選擇合適的迭代次數(shù),以盡可能短的時間,使網(wǎng)絡(luò)達到最優(yōu)的訓(xùn)練效果。最后,將本文方法與BP神經(jīng)網(wǎng)絡(luò)以及SVM方法進行實驗對比,結(jié)果表明,本文提出的基于深度學(xué)習(xí)的模型能對不同的出行方式進行有效識別,其識別準(zhǔn)確率較傳統(tǒng)方法有明顯的提高,證明了該模型在出行方式識別問題上的可行性。
[Abstract]:With the development of society and the continuous progress of science and technology, location sensing technology such as mobile communication and sensor equipment has formed a large number of location data, mining and analysis of these location data. In order to find its potential useful information, reasonable planning of urban construction and travel route planning, will greatly promote the intelligence of modern society, information. At the same time. Getting the way people travel from track data will also help researchers speculate on how people own vehicles. Income level and career situation. This paper carried out some related research around location big data. Firstly, the paper analyzed the GPS track data of taxi, and analyzed the factors that may cause the data error. And the original data preprocessing, including data error analysis, data processing basis and methods, and then the residents travel start and stop point identification. Based on the processed GPS data, this paper analyzes the spatial and temporal distribution characteristics of residents' travel, including the travel volume on weekdays and rest days, and the peak time of daily travel. And get the relevant conclusion. Apply the cluster analysis method to the taxi GPS data application research, select the reasonable clustering method to the study area to divide the traffic area. Secondly, the K-Means method based on time-space clustering is used to get the active center points of passengers, and combined with ArcGIS spatial analysis tools. Constructing buffer zone to find the section where passengers can easily take a taxi solves the problem of active center point deviating from the road. In addition, the density clustering method is used. This paper studies the distribution law of urban residents' travel hot spots, and combines with the actual situation to prove the effectiveness of this method. Then, in order to improve the recognition rate of different travel modes. Based on the user GPS trajectory data collected by Microsoft Asia Research Institute, a travel pattern recognition model based on deep learning is proposed. The GPS trajectory segments corresponding to different trip modes are extracted by using time characteristics. The characteristics of different travel modes are analyzed and the effects of iteration times on root mean square error and network training running time are considered. The appropriate number of iterations is selected for the shortest possible time. Finally, the experiment results show that the proposed method is compared with BP neural network and SVM method. The proposed model based on depth learning can effectively identify different travel modes, and its recognition accuracy is obviously higher than that of the traditional method, which proves the feasibility of the model in the problem of trip pattern identification.
【學(xué)位授予單位】:浙江理工大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2017
【分類號】:TP311.13
【相似文獻】
相關(guān)期刊論文 前10條
1 斯華齡;張立明;;多通道無監(jiān)督學(xué)習(xí)——一種新的智能處理方法[J];科學(xué);2004年01期
2 馮文剛;高雋;Bill P.Buckles;吳克偉;;無監(jiān)督學(xué)習(xí)的無線膠囊內(nèi)診鏡視頻分類方法[J];中國圖象圖形學(xué)報;2011年11期
3 陳斌;陳松燦;潘志松;李斌;;異常檢測綜述[J];山東大學(xué)學(xué)報(工學(xué)版);2009年06期
4 王濤;李艾華;蔡艷平;王聲才;;基于核的學(xué)習(xí)機研究綜述[J];計算機應(yīng)用研究;2010年06期
5 劉開第;劉昕;趙奇;周少玲;;基于分類權(quán)與質(zhì)心驅(qū)動的無監(jiān)督學(xué)習(xí)算法[J];自動化學(xué)報;2009年05期
6 裘晨曦;徐雅斌;李艷平;李卓;;一種基于無監(jiān)督學(xué)習(xí)的社交網(wǎng)絡(luò)流量快速識別方法[J];數(shù)學(xué)的實踐與認識;2014年03期
7 賈真;何大可;尹紅風(fēng);李天瑞;;基于無監(jiān)督學(xué)習(xí)的部分-整體關(guān)系獲取[J];西南交通大學(xué)學(xué)報;2014年04期
8 張躍,譚詠梅,姚天順;英漢機譯中一種基于無監(jiān)督學(xué)習(xí)的詞類消歧策略[J];小型微型計算機系統(tǒng);2000年08期
9 趙博;李永忠;楊鴿;徐靜;;改進SVM在入侵檢測中的應(yīng)用研究[J];計算機工程與應(yīng)用;2009年17期
10 修馳;宋柔;;基于無監(jiān)督學(xué)習(xí)的專業(yè)領(lǐng)域分詞歧義消解方法[J];計算機應(yīng)用;2013年03期
相關(guān)會議論文 前1條
1 王波;王厚峰;;中文單詞聚類的比較研究[A];第三屆學(xué)生計算語言學(xué)研討會論文集[C];2006年
相關(guān)博士學(xué)位論文 前2條
1 李狀;基于無監(jiān)督學(xué)習(xí)的風(fēng)電機組傳動鏈智能故障診斷方法研究[D];華北電力大學(xué)(北京);2016年
2 錢利強;無監(jiān)督學(xué)習(xí)框架下學(xué)習(xí)分類器系統(tǒng)聚類與主干網(wǎng)提取方法研究[D];蘇州大學(xué);2016年
相關(guān)碩士學(xué)位論文 前4條
1 趙福青;無監(jiān)督學(xué)習(xí)的產(chǎn)品評論微摘要技術(shù)研究[D];寧波大學(xué);2015年
2 林海娟;時間序列無監(jiān)督學(xué)習(xí)算法研究[D];福州大學(xué);2013年
3 李斯凡;基于無監(jiān)督學(xué)習(xí)技術(shù)的位置大數(shù)據(jù)分析[D];浙江理工大學(xué);2017年
4 岳永鵬;深度無監(jiān)督學(xué)習(xí)算法研究[D];西南石油大學(xué);2015年
,本文編號:1467398
本文鏈接:http://sikaile.net/shoufeilunwen/xixikjs/1467398.html