【摘要】:隨著GNSS(Global Navigation Satellite System)終端設(shè)備的普及與廣泛應(yīng)用,日益產(chǎn)生了海量的、帶豐富位置信息的數(shù)據(jù),這些數(shù)據(jù)正在支撐地球探測技術(shù)的發(fā)展。然而,GPS(Global Position System)作為GNSS的一種應(yīng)用最廣泛、數(shù)據(jù)積累最豐富的導(dǎo)航衛(wèi)星系統(tǒng),怎樣分析、處理且獲取到GPS數(shù)據(jù)中所隱藏的地質(zhì)與空間變遷信息,并將結(jié)果應(yīng)用到地球探測中拓展GIS(Geographic Information System)應(yīng)用范圍,為智慧城市發(fā)展和規(guī)劃提供更有效的參考和支持,是當(dāng)前地球探測領(lǐng)域研究的熱點(diǎn)。論文以城市出租車GPS數(shù)據(jù)為研究對象,以遺傳算法、粒子群算法和蟻群算法三種智能算法為研究基礎(chǔ),以聚焦劃分的聚類算法(K-means/K-means++、Fuzzy C-means、K-median)為自動(dòng)聚類的基本算法;提出了基于智能優(yōu)化的GPS數(shù)據(jù)自動(dòng)聚類學(xué)習(xí)算法,這些算法可以不需要用戶輸入過多參數(shù)而實(shí)現(xiàn)GPS數(shù)據(jù)自動(dòng)聚類,并能獲得較好的聚類結(jié)果以及更好的發(fā)現(xiàn)城市熱點(diǎn)、城市運(yùn)行狀態(tài)等有價(jià)值的信息,從而為地球探測的發(fā)展提供有效的技術(shù)支撐。在GNSS數(shù)據(jù)的智能聚類學(xué)習(xí)算法中,提出了基于噪音和密度的初始化種群技術(shù)、構(gòu)建了基于模糊系統(tǒng)的智能算法參數(shù)自動(dòng)生成技術(shù)、提出了基于密度的共享小生境技術(shù)及其智能算法混合方法,用于克服了智能學(xué)習(xí)算法優(yōu)化停滯難以全局最優(yōu)化、需要用戶定義眾多參數(shù)、以及算法本身易早熟等現(xiàn)象,確保了智能算法適應(yīng)了劃分聚類的非監(jiān)督自適應(yīng)學(xué)習(xí);同時(shí),也有效克服了基于劃分的聚類算法聚類數(shù)目不易確定、對種子點(diǎn)的敏感、易陷入局部最優(yōu)等長期以來存在的缺陷。因此,創(chuàng)新開展了以下工作。(1)結(jié)合噪音、改進(jìn)Canopy、密度估計(jì)與K-means++分別提出了三種遺傳算法的初始化種群技術(shù),并將時(shí)間復(fù)雜度控制在O(n)左右(n是GPS數(shù)據(jù)點(diǎn)的數(shù)目);同時(shí)提出了一種基于密度估計(jì)的共享小生境技術(shù)和改進(jìn)型基因重排技術(shù),用于避免遺傳算法早熟現(xiàn)象且處理不等長的染色體長度。并結(jié)合自適應(yīng)交叉、變異、精英操作實(shí)現(xiàn)遺傳優(yōu)化,找到最優(yōu)個(gè)體(染色體)實(shí)現(xiàn)城市出租車GPS數(shù)據(jù)的K-means自動(dòng)聚類。最終通過實(shí)驗(yàn)驗(yàn)證顯示,獲得了較好的對聚類結(jié)果。特別地,在捕獲的最優(yōu)個(gè)體中,包括了聚類數(shù)目和初始化聚類中心(種子點(diǎn)),也是基于遺傳算法的最優(yōu)解。因此,整個(gè)算法有效克服了遺傳算法早熟現(xiàn)象,并能有效確保種群的多樣性,達(dá)到全局優(yōu)化;同時(shí),不需要事先為K-means聚類輸入聚類數(shù)目和隨機(jī)選擇種子點(diǎn),有效提高了K-means聚類的性能。(2)用基于噪音的初始化種群方法、遺傳算法與自適應(yīng)模糊的粒子群算法融合,提出一種新的模糊粒子群算法與遺傳算法融合的自動(dòng)聚類算法。一方面找到最優(yōu)染色體實(shí)現(xiàn)K-means自動(dòng)聚類;另一方面改進(jìn)了噪音半徑(自動(dòng)生成噪音半徑實(shí)現(xiàn)種群初始化)和增加了模糊輸出量,并將K-means融合到粒子群與遺傳算法混合中實(shí)現(xiàn)聚類,即先粒子群操作,再執(zhí)行遺傳操作聚類,后執(zhí)行K-means操作,最終以最好哪個(gè)個(gè)體作為最終聚類結(jié)果。用多組出租車GPS數(shù)據(jù)實(shí)驗(yàn)評估表明,兩種方法都可以獲取較好的結(jié)果,更容易挖掘到城市熱點(diǎn)和人群聚焦點(diǎn)。(3)用基于噪音的初始化種群方法、遺傳算法與提出的自適應(yīng)模糊蟻群系統(tǒng)全面混合,提出一種遺傳算法與蟻群系統(tǒng)相結(jié)合的自適應(yīng)模糊蟻群K-means自動(dòng)聚類算法,即先遺傳操作獲得最優(yōu)染色體,后再進(jìn)入蟻群系統(tǒng)算法中實(shí)現(xiàn)蟻群K-means自適應(yīng)聚類,有效克服了遺傳算法、蟻群系統(tǒng)和K-means不足,特別是有效解決了K-means聚類敏感于初始化聚類中心和將上一代最優(yōu)聚類結(jié)果保存到下一代的問題,實(shí)現(xiàn)了非監(jiān)督自動(dòng)學(xué)習(xí)完成聚類。最后以幾種出租車城市GPS數(shù)據(jù)為實(shí)驗(yàn)數(shù)據(jù),從兩個(gè)角度實(shí)驗(yàn)驗(yàn)證評估表明算法具有很好的有效性,并提高聚類性能,有效避免了聚類陷入局部最優(yōu)化。(4)在云計(jì)算環(huán)境下,提出了基于MapReduce的遺傳K-means聚類算法,用于處理大體量GPS數(shù)據(jù)。首先以Mahout中的Canopy、K-means為基礎(chǔ),用采樣頻率改進(jìn)Canopy和K-means++(是基于MapReduce的)并使其產(chǎn)生適當(dāng)聚類數(shù)目,生成遺傳操作的初始化種群;接著進(jìn)行自適應(yīng)遺傳操作完成聚類優(yōu)化,然后獲取最優(yōu)染色體實(shí)現(xiàn)K-means操作;實(shí)驗(yàn)采用一組208M、19M和1.9M的出租車GPS數(shù)據(jù)與其它算法比較表明,本文提出的算法具有較好的效率,并獲取到了優(yōu)良的聚類結(jié)果。(5)以出租車GPS數(shù)據(jù)特征為基礎(chǔ),提出一種基于角度劃分和余弦約束的GPS軌跡片段生成方法(含有3個(gè)GPS點(diǎn)的片段),再結(jié)合基于拉格朗日定理改進(jìn)了模糊C-means(Fuzzy C-means)聚類算法,并對所生成的軌跡片段進(jìn)行聚類。同時(shí),結(jié)合基于噪音的初始化種群方法和模糊系統(tǒng),提出了模糊自適應(yīng)GA,并用于實(shí)現(xiàn)改進(jìn)型模糊C-means軌跡片段的自動(dòng)聚類;最后采用最小二乘算法回歸生成GPS平滑軌跡,能用于解釋軌跡周邊的城市熱點(diǎn)、人流量和交通狀態(tài)等。最后以含有71375個(gè)北京出租車GPS點(diǎn)的實(shí)驗(yàn)驗(yàn)證表明,所提出的兩種方法具有很好的性能和效率,并能降低GPS軌跡局部信息丟失和避免聚類陷入局部最優(yōu),從而為城市道路規(guī)劃、城市運(yùn)行趨勢和城市發(fā)展提供一定的參考。
【學(xué)位授予單位】:成都理工大學(xué)
【學(xué)位級(jí)別】:博士
【學(xué)位授予年份】:2018
【分類號(hào)】:P228.4
【參考文獻(xiàn)】
相關(guān)期刊論文 前10條
1 唐爐亮;劉章;楊雪;闞子涵;李清泉;董坤;;符合認(rèn)知規(guī)律的時(shí)空軌跡融合與路網(wǎng)生成方法[J];測繪學(xué)報(bào);2015年11期
2 姜曉睿;鄭春益;蔣莉;梁榮華;;大規(guī)模出租車起止點(diǎn)數(shù)據(jù)可視分析[J];計(jì)算機(jī)輔助設(shè)計(jì)與圖形學(xué)學(xué)報(bào);2015年10期
3 袁華;錢宇;楊銳;;基于GPS軌跡的用戶興趣點(diǎn)及頻繁路徑挖掘研究[J];系統(tǒng)工程理論與實(shí)踐;2015年05期
4 楊揚(yáng);姚恩建;潘龍;趙楠;;基于GPS數(shù)據(jù)的出租車路徑選擇行為研究[J];交通運(yùn)輸系統(tǒng)工程與信息;2015年01期
5 禹文豪;艾廷華;;核密度估計(jì)法支持下的網(wǎng)絡(luò)空間POI點(diǎn)可視化與分析[J];測繪學(xué)報(bào);2015年01期
6 劉經(jīng)南;;大數(shù)據(jù)與位置服務(wù)[J];測繪科學(xué);2014年03期
7 王靜遠(yuǎn);李超;熊璋;單志廣;;以數(shù)據(jù)為中心的智慧城市研究綜述[J];計(jì)算機(jī)研究與發(fā)展;2014年02期
8 莫贊;羅世雄;楊清平;吳靜;;基于K-means算法的改進(jìn)蟻群聚類算法及其應(yīng)用[J];系統(tǒng)科學(xué)學(xué)報(bào);2012年03期
9 劉衍民;隋常玲;趙慶禎;;基于K-均值聚類的動(dòng)態(tài)多種群粒子群算法及其應(yīng)用[J];控制與決策;2011年07期
10 李書全;孫雪;孫德輝;邊偉朋;;遺傳算法中的交叉算子的述評[J];計(jì)算機(jī)工程與應(yīng)用;2012年01期
相關(guān)博士學(xué)位論文 前2條
1 夏大文;基于MapReduce的移動(dòng)軌跡大數(shù)據(jù)挖掘方法與應(yīng)用研究[D];西南大學(xué);2016年
2 許玉杰;云計(jì)算環(huán)境下海量數(shù)據(jù)的并行聚類算法研究[D];大連海事大學(xué);2014年
本文編號(hào):
2715642
本文鏈接:http://sikaile.net/kejilunwen/dizhicehuilunwen/2715642.html