基于軌跡數(shù)據(jù)的出行目的地預測及隱私保護方法研究
發(fā)布時間:2020-10-02 06:40
對于城市計算中預測問題的研究,是指通過對已有的數(shù)據(jù)的分析,發(fā)現(xiàn)并解決城市中存在的問題,比如,越來越多的交通事故、交通擁堵、環(huán)境惡化、噪音污染、能源消耗等等,從而更好地規(guī)劃城市。隨著越來越多車載設備的普及,交通數(shù)據(jù)的采集變得更加容易,數(shù)據(jù)屬性變得更加豐富,數(shù)據(jù)量變得更加龐大,所以,基于交通大數(shù)據(jù)的研究變得更具可行性。如今,基于位置服務越來越重要,出租車是用戶出行的重要方式之一,本文利用真實的上海市出租車GPS軌跡對其出行目的地進行預測,完成對用戶行程模式的挖掘,可以對基于位置服務的應用產(chǎn)生積極的影響。提出了一種基于不同時間段的目的地預測算法能夠有效地解決傳統(tǒng)方法所存在數(shù)據(jù)稀疏的問題,從實驗結(jié)果分析可以看出,通過增加對時間因素的考量,該算法的預測結(jié)果具有更高的準確性和預測效率。同時,在基于位置服務中,對用戶的真實位置信息進行有效保護是十分必要的,所以,本文不僅對目的地預測中的位置隱私保護進行了研究,還利用真實的長春市手機信令數(shù)據(jù),在軌跡公布過程中,對用戶軌跡數(shù)據(jù)進行了隱私保護研究,即對用戶的軌跡數(shù)據(jù)進行匿名化處理,從而達到隱私保護的目的。由此看來,對于軌跡數(shù)據(jù)的深入研究對交通智能化有現(xiàn)實意義和重要價值。本文主要貢獻:1.提出了時間因素對目的地預測的影響,即在子軌跡合成算法[1]的基礎上增加了時間因素,先判斷軌跡所處的時間段,之后對其進行目的地的預測,使得預測結(jié)果更加準確。2.分模態(tài)建模。根據(jù)不同時間段內(nèi)的軌跡數(shù)量的不同可知,不同時間段內(nèi)的馬爾可夫模型是不同的,所以分別在不同時間段內(nèi)建立馬爾可夫模型,從而求出不同的狀態(tài)轉(zhuǎn)移概率矩陣,之后即可得到以時間為Y軸的三維狀態(tài)轉(zhuǎn)移概率矩陣,應用于預測算法的之后步驟。3.對手機信令軌跡數(shù)據(jù)進行隱私保護。提出基于地圖網(wǎng)格化以及空間上的軌跡聚類算法,對用戶的行程軌跡進行匿名化處理,從而達到隱私保護的目的。4.采用真實的出租車GPS軌跡數(shù)據(jù)與手機信令數(shù)據(jù)進行實驗,實驗結(jié)果證明了基于時間的目的地預測算法以及基于網(wǎng)格和軌跡聚類對軌跡數(shù)據(jù)進行隱私保護的算法是有效的。
【學位單位】:吉林大學
【學位級別】:碩士
【學位年份】:2018
【中圖分類】:U495;TP309
【部分圖文】:
將所研究區(qū)域劃分為 20*20 的網(wǎng)格。其中圖2.2 的高亮部分是本文所研究的地域范圍,圖 2.3 是將所研究范圍進行網(wǎng)格化之后得到的結(jié)果:1 2 3 456 789 1011 1213 14 15 16 1 2 3 4
圖 2.2 上海市地圖 圖 2.3 實驗所用區(qū)域網(wǎng)格化2.3 馬爾可夫模型馬爾可夫模型(Markov Model)是一種統(tǒng)計模型,它是以俄羅斯數(shù)學家安德雷·安德耶維齊·馬爾可夫(1856—1922)命名的。馬爾可夫鏈(MarkovChain)[39,40],是指數(shù)學中具有馬爾可夫性質(zhì)的離散事件隨機過程。該過程中,在已知的當前知識或信息被確定的情況下,過去(即當前以前的狀態(tài))對于預測將來(即當前以后的狀態(tài))是不相關的。在馬爾可夫鏈的每一步,系統(tǒng)根據(jù)概率分布,可以從一個狀態(tài)轉(zhuǎn)換成其他狀態(tài),也可以保持當前狀態(tài)。狀態(tài)的改變叫做轉(zhuǎn)移,在不同的狀態(tài)之間進行轉(zhuǎn)換的概率叫做轉(zhuǎn)移概率。公式(2.1)中 的值代表在時間 n 的狀態(tài)。如果 +1對于過去狀態(tài)的條件概率分布僅與 相關,即: +1= 1= 1, 2= 2, , = = +1= = … (2.1)
第 3 章 基于 GPS 軌跡數(shù)據(jù)的目的地預測算法研究該參數(shù)的含義是預測的目的地與實際目的地的距離。行程完成度是對軌跡當置距離其起點位置的度量標準,即記錄當前時刻,車輛行走的距離占其總行百分比,行程完成度越高代表車輛越接近目的地,本文實驗所選的行程完成次為 30%、50%、70%。預測誤差結(jié)果如下所示,可以得出的結(jié)論是隨著行成度越高,預測誤差越小。
本文編號:2832056
【學位單位】:吉林大學
【學位級別】:碩士
【學位年份】:2018
【中圖分類】:U495;TP309
【部分圖文】:
將所研究區(qū)域劃分為 20*20 的網(wǎng)格。其中圖2.2 的高亮部分是本文所研究的地域范圍,圖 2.3 是將所研究范圍進行網(wǎng)格化之后得到的結(jié)果:1 2 3 456 789 1011 1213 14 15 16 1 2 3 4
圖 2.2 上海市地圖 圖 2.3 實驗所用區(qū)域網(wǎng)格化2.3 馬爾可夫模型馬爾可夫模型(Markov Model)是一種統(tǒng)計模型,它是以俄羅斯數(shù)學家安德雷·安德耶維齊·馬爾可夫(1856—1922)命名的。馬爾可夫鏈(MarkovChain)[39,40],是指數(shù)學中具有馬爾可夫性質(zhì)的離散事件隨機過程。該過程中,在已知的當前知識或信息被確定的情況下,過去(即當前以前的狀態(tài))對于預測將來(即當前以后的狀態(tài))是不相關的。在馬爾可夫鏈的每一步,系統(tǒng)根據(jù)概率分布,可以從一個狀態(tài)轉(zhuǎn)換成其他狀態(tài),也可以保持當前狀態(tài)。狀態(tài)的改變叫做轉(zhuǎn)移,在不同的狀態(tài)之間進行轉(zhuǎn)換的概率叫做轉(zhuǎn)移概率。公式(2.1)中 的值代表在時間 n 的狀態(tài)。如果 +1對于過去狀態(tài)的條件概率分布僅與 相關,即: +1= 1= 1, 2= 2, , = = +1= = … (2.1)
第 3 章 基于 GPS 軌跡數(shù)據(jù)的目的地預測算法研究該參數(shù)的含義是預測的目的地與實際目的地的距離。行程完成度是對軌跡當置距離其起點位置的度量標準,即記錄當前時刻,車輛行走的距離占其總行百分比,行程完成度越高代表車輛越接近目的地,本文實驗所選的行程完成次為 30%、50%、70%。預測誤差結(jié)果如下所示,可以得出的結(jié)論是隨著行成度越高,預測誤差越小。
【參考文獻】
相關期刊論文 前5條
1 張偉;王旭然;王玨;陳云芳;;基于k-鄰域同構(gòu)的動態(tài)社會網(wǎng)絡隱私保護方法[J];南京郵電大學學報(自然科學版);2014年05期
2 武艷娜;趙澤茂;孫傳林;;劃分子匿名區(qū)域的k-匿名位置隱私保護方法[J];信息安全與技術;2014年10期
3 李建明;;智慧城市發(fā)展綜述[J];中國電子科學研究院學報;2014年03期
4 胡騰波;葉建栲;;馬爾科夫鏈模型在GIS數(shù)據(jù)預測中的應用[J];計算機系統(tǒng)應用;2008年08期
5 汪海波,張海臣,段雪麗;基于MATLAB的自組織競爭神經(jīng)網(wǎng)絡聚類研究[J];邢臺職業(yè)技術學院學報;2005年01期
相關博士學位論文 前1條
1 楊小兵;聚類分析中若干關鍵技術的研究[D];浙江大學;2005年
相關碩士學位論文 前2條
1 周靈通;基于歷史行車軌跡的目的地預測算法研究[D];華南理工大學;2015年
2 段明秀;層次聚類算法的研究及應用[D];中南大學;2009年
本文編號:2832056
本文鏈接:http://sikaile.net/kejilunwen/jiaotonggongchenglunwen/2832056.html