云計算環(huán)境下時空軌跡聚集模式挖掘算法研究
本文關(guān)鍵詞:云計算環(huán)境下時空軌跡聚集模式挖掘算法研究
更多相關(guān)文章: 聚集模式 時空數(shù)據(jù)挖掘 軌跡模式挖掘 并行數(shù)據(jù)挖掘
【摘要】:隨著位置采集技術(shù),包括遙測技術(shù)、車載GPS、無線網(wǎng)絡(luò)以及智能手機的應(yīng)用,人們可以記錄任何移動對象的行走軌跡,從而形成了以軌跡作為表現(xiàn)形式的龐大時空數(shù)據(jù)庫。分析各種不同移動對象的時空軌跡數(shù)據(jù),有助于我們對人類行為模式、交通物流、動物習(xí)性以及市場營銷等進行研究。時空軌跡模式挖掘是數(shù)據(jù)挖掘的重要研究內(nèi)容。時空軌跡聚集模式是時空軌跡模式重要的組成部分,它是指一組時空移動對象在一定時間內(nèi)一起移動形成的行為模式。對時空軌跡數(shù)據(jù)進行挖掘,可提取出有意義的聚集模式,從而幫助人們監(jiān)控和預(yù)測一些不尋常的群體事件。本文研究時空軌跡聚集模式挖掘算法,取得的主要研究成果如下:(1)提出了一種時空軌跡gathering聚集模式并行挖掘算法PDGP(Parallel algorithm for Discovering Gathering Pattern),并利用MapReduce并行編程模型加以實現(xiàn)。PDGP算法將gathering聚集模式挖掘算法中極其耗時的聚類操作分發(fā)到各個計算節(jié)點并行處理,以此達到提高算法運行效率的目的。實驗結(jié)果表明PDGP算法的運行效率與原挖掘算法相比有較大提升,而且隨著計算節(jié)點數(shù)量的增加,并行算法的加速比較高,在大數(shù)據(jù)集上顯示出了明顯的性能優(yōu)勢。(2)提出了一種基于網(wǎng)格索引的時空軌跡聚類算法GTRAJ-DBSCAN(Grid-based algorithm for TRAJectory-DBSCAN),在云環(huán)境下實現(xiàn)基于網(wǎng)格索引的時空軌跡并行聚類算法GPTRAJ-DBSCAN(Grid-based Parallel algorithm for TRAJectory-DBSCAN).實驗結(jié)果表明本文提出的GTRAJ-DBSCAN和GPTRAJ-DBSCAN算法性能優(yōu)于TRAJ-DBSCAN算法,這兩個算法通過建立網(wǎng)格索引,在進行軌跡聚類時,利用網(wǎng)格索引實現(xiàn)對軌跡段的區(qū)域查詢,從而降低了計算量,有效地提高了軌跡聚類的速度。(3)提出了一種基于中心距離的閉合聚集檢測算法CDCC(algorithm based on Center-distance for Discovering Closed Crowds),該算法計算簇內(nèi)所有移動對象位置均值從而獲得該簇的聚類中心,通過計算各個簇聚類中心的距離從而獲得各個簇之間的距離從而極大地減少了計算量。實驗結(jié)果表明本文提出的CDCC算法相比較于DCC算法在保證結(jié)果精確性的同時,在時間效率方面有一定的提升。
【關(guān)鍵詞】:聚集模式 時空數(shù)據(jù)挖掘 軌跡模式挖掘 并行數(shù)據(jù)挖掘
【學(xué)位授予單位】:南京師范大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2016
【分類號】:TP311.13
【目錄】:
- 摘要4-5
- Abstract5-10
- 第1章 緒論10-16
- 1.1 研究背景及意義10-11
- 1.2 研究現(xiàn)狀11-14
- 1.3 本文研究內(nèi)容14-15
- 1.4 本人組織結(jié)構(gòu)15-16
- 第2章 時空軌跡模式挖掘研究進展16-30
- 2.1 時空軌跡模式挖掘簡介16-17
- 2.1.1 時空軌跡頻繁模式16
- 2.1.2 時空軌跡伴隨模式16-17
- 2.1.3 時空軌跡異常模式17
- 2.1.4 時空軌跡聚集模式17
- 2.2 時空軌跡聚集模式分類17-21
- 2.2.1 Group模式17
- 2.2.2 Flock模式17-18
- 2.2.3 Moving Cluster模式18-19
- 2.2.4 Convoy模式19
- 2.2.5 Evolving Convoy模式19-20
- 2.2.6 Swarm模式20
- 2.2.7 Gathering模式20-21
- 2.3 時空軌跡聚集模式挖掘方法21-25
- 2.3.1 基于近似查詢的聚集模式挖掘算法22-23
- 2.3.2 基于關(guān)聯(lián)規(guī)則剪枝的挖掘算法23
- 2.3.3 基于密度聚類的聚集模式挖掘算法23-25
- 2.4 時空軌跡Gathering聚集模式挖掘算法25-29
- 2.4.1 背景知識25-26
- 2.4.2 軌跡簡化26-27
- 2.4.3 軌跡聚類27-28
- 2.4.4 聚集檢測28-29
- 2.5 本章小結(jié)29-30
- 第3章 時空軌跡Gathering聚集模式并行挖掘算法30-41
- 3.1 并行編程模型30-33
- 3.1.1 Hadoop30-32
- 3.1.2 Spark32
- 3.1.3 GPU32-33
- 3.2 算法思想33
- 3.3 算法描述33-36
- 3.4 實驗與結(jié)果分析36-40
- 3.4.1 實驗環(huán)境36
- 3.4.2 實驗數(shù)據(jù)源36
- 3.4.3 實驗結(jié)果分析36-40
- 3.5 本章小結(jié)40-41
- 第4章 時空軌跡Gathering聚集模式挖掘算法的改進41-52
- 4.1 基于網(wǎng)格索引的時空軌跡并行聚類算法41-48
- 4.1.1 引言41-43
- 4.1.2 GPTRAJ-DBSCAN算法思想43-46
- 4.1.3 實驗與結(jié)果分析46-48
- 4.2 基于中心距離的閉合聚集檢測算法48-51
- 4.2.1 引言48-49
- 4.2.2 CDCC算法思想49-50
- 4.2.3 實驗與結(jié)果分析50-51
- 4.3 本章小結(jié)51-52
- 第5章 總結(jié)與展望52-54
- 5.1 總結(jié)52-53
- 5.2 展望53-54
- 參考文獻54-59
- 附錄 攻讀碩士學(xué)位期間發(fā)表論文情況59-60
- 致謝60
【相似文獻】
中國期刊全文數(shù)據(jù)庫 前10條
1 王宇新;田佳;郭禾;吳樹朋;楊元生;;應(yīng)用模糊方法的設(shè)計模式挖掘策略研究[J];計算機工程與應(yīng)用;2010年02期
2 陸億紅;王子仁;黃燕;;適合稀少空間特征的同位模式挖掘算法[J];浙江工業(yè)大學(xué)學(xué)報;2007年04期
3 郭燕萍;辛伯宇;;高選票例外模式挖掘研究與實現(xiàn)[J];電腦開發(fā)與應(yīng)用;2007年08期
4 徐顯九;楊燕;岳愛萍;;高效的用戶移動模式挖掘方法[J];計算機應(yīng)用研究;2007年09期
5 李帆;夏士雄;張磊;;基于模糊理論的不確定軌跡模式挖掘[J];微電子學(xué)與計算機;2011年08期
6 李中元;邊馥苓;;空間同位模式挖掘研究進展[J];地理空間信息;2013年06期
7 邢東山,沈鈞毅,宋擒豹;用戶瀏覽偏愛模式挖掘算法的研究[J];西安交通大學(xué)學(xué)報;2002年04期
8 劉洪輝;吳岳芬;;用戶行為模式挖掘問題的研究[J];計算機技術(shù)與發(fā)展;2006年05期
9 付曉翠;許盈;車路;;游戲訪問模式挖掘的研究與應(yīng)用[J];鄭州大學(xué)學(xué)報(理學(xué)版);2007年04期
10 顏一鳴;郭鑫;李仁發(fā);;一種非確定樹模式挖掘算法[J];計算機工程與應(yīng)用;2011年15期
中國重要會議論文全文數(shù)據(jù)庫 前10條
1 王肅;杜軍平;高田;;基于本體與知識背景的模式挖掘框架研究[A];2009年中國智能自動化會議論文集(第二分冊)[C];2009年
2 繆裕青;尹東;;分布式存儲結(jié)構(gòu)的頻繁閉合模式挖掘并行算法[A];2007年全國開放式分布與并行計算機學(xué)術(shù)會議論文集(下冊)[C];2007年
3 王淼;尚學(xué)群;謝華博;李戰(zhàn)懷;;行常量差異共表達基因模式挖掘算法研究[A];第29屆中國數(shù)據(jù)庫學(xué)術(shù)會議論文集(B輯)(NDBC2012)[C];2012年
4 劉玉葆;蔡嘉榮;印鑒;黃志蘭;;基于最大訪問模式挖掘的數(shù)據(jù)庫異常行為檢測[A];第二十三屆中國數(shù)據(jù)庫學(xué)術(shù)會議論文集(研究報告篇)[C];2006年
5 陸葉;王麗珍;陳紅梅;趙麗紅;;基于可能世界的不確定空間co-location模式挖掘研究[A];NDBC2010第27屆中國數(shù)據(jù)庫學(xué)術(shù)會議論文集(B輯)[C];2010年
6 王麗珍;陸葉;陳紅梅;肖清;;基于前綴樹結(jié)構(gòu)的空間co-location模式挖掘算法研究[A];NDBC2010第27屆中國數(shù)據(jù)庫學(xué)術(shù)會議論文集(B輯)[C];2010年
7 胡偉成;曹三省;李丹;;一種基于QPop增量時域分割升維的媒體內(nèi)容應(yīng)用模式挖掘改進算法[A];第二十二屆中國數(shù)據(jù)庫學(xué)術(shù)會議論文集(技術(shù)報告篇)[C];2005年
8 薛丹;李德敏;裴仁林;;移動計算中基于PrefixSpan算法的用戶移動模式挖掘[A];第二十一屆中國數(shù)據(jù)庫學(xué)術(shù)會議論文集(技術(shù)報告篇)[C];2004年
9 宋國杰;馬帥;唐世渭;楊冬青;;基于模式挖掘的交通預(yù)測模型[A];第十九屆全國數(shù)據(jù)庫學(xué)術(shù)會議論文集(技術(shù)報告篇)[C];2002年
10 夏慶;馬元元;孫志揮;;路徑遍歷模式挖掘方法的改進[A];第十六屆全國數(shù)據(jù)庫學(xué)術(shù)會議論文集[C];1999年
中國重要報紙全文數(shù)據(jù)庫 前1條
1 辛苑薇;誰將分享“大數(shù)據(jù)”的智慧盛宴?[N];21世紀經(jīng)濟報道;2012年
中國博士學(xué)位論文全文數(shù)據(jù)庫 前7條
1 Shafqat Ali Shad;移動用戶軌跡與行為模式挖掘方法研究[D];中國科學(xué)技術(shù)大學(xué);2013年
2 錢烽;同位模式挖掘研究[D];浙江大學(xué);2012年
3 劉勇;圖模式挖掘技術(shù)的研究[D];哈爾濱工業(yè)大學(xué);2010年
4 覃桂敏;復(fù)雜網(wǎng)絡(luò)模式挖掘算法研究[D];西安電子科技大學(xué);2012年
5 王樂;數(shù)據(jù)流模式挖掘算法及應(yīng)用研究[D];大連理工大學(xué);2013年
6 林耀進;多源環(huán)境中數(shù)據(jù)預(yù)處理與模式挖掘的研究[D];合肥工業(yè)大學(xué);2014年
7 曾海泉;時間序列挖掘與相似性查找技術(shù)研究[D];復(fù)旦大學(xué);2003年
中國碩士學(xué)位論文全文數(shù)據(jù)庫 前10條
1 張子瀚;面向大數(shù)據(jù)的高效用模式挖掘方法研究[D];北方工業(yè)大學(xué);2016年
2 張剛領(lǐng);一種基于團的閉頻繁Co-location模式挖掘方法[D];云南大學(xué);2016年
3 江萬國;基于領(lǐng)域驅(qū)動的空間高效用Co-location模式挖掘[D];云南大學(xué);2016年
4 吳錫宇;基于約束的城市co-location模式挖掘[D];云南大學(xué);2016年
5 馮魯橋;基于C/C++代碼庫的API調(diào)用模式挖掘研究及實現(xiàn)[D];電子科技大學(xué);2016年
6 王敏;云計算環(huán)境下時空軌跡聚集模式挖掘算法研究[D];南京師范大學(xué);2016年
7 岳愛萍;基于時間的用戶移動模式挖掘研究[D];西南交通大學(xué);2008年
8 盧榮;基于動態(tài)扭曲算法的時間序列部分周期模式挖掘研究[D];天津大學(xué);2009年
9 胡德勇;基于電信數(shù)據(jù)的模式挖掘與分析[D];北京郵電大學(xué);2010年
10 甘海燕;基于動態(tài)鏈表結(jié)構(gòu)的時間序列異步周期模式挖掘研究[D];天津大學(xué);2010年
,本文編號:534926
本文鏈接:http://sikaile.net/guanlilunwen/wuliuguanlilunwen/534926.html