天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當前位置:主頁 > 科技論文 > 自動化論文 >

基于等距特征映射的非線性降維及其應用研究

發(fā)布時間:2018-04-01 03:36

  本文選題:非線性降維 切入點:流形學習 出處:《中國科學技術大學》2017年博士論文


【摘要】:隨著大數(shù)據(jù)時代的到來,海量信息給我們的生活帶來更多機遇的同時也帶來了新的挑戰(zhàn)。海量數(shù)據(jù)通常具有很高的維度,使得很多傳統(tǒng)的數(shù)據(jù)分析方法無法直接對這些數(shù)據(jù)進行處理,這就是著名的"維數(shù)災難",是21世紀數(shù)據(jù)分析面臨的巨大挑戰(zhàn)。數(shù)據(jù)降維作為解決"維數(shù)災難"的重要工具,一直是機器學習、人工智能以及數(shù)據(jù)挖掘等領域的研究熱點。然而傳統(tǒng)線性降維算法的全局線性假設己經(jīng)不能適應海量高維數(shù)據(jù)日益復雜的非線性結構,因此非線性降維方法成為了新的研究熱點,其中流形學習的發(fā)展最為引人關注。以等距特征映射(Isometric Feature Mapping,ISOMAP)和局部線性嵌入(Locally Linear Embedding,LLE)為代表的流形學習算法以其簡單直觀的幾何特性和完善的理論已經(jīng)被成功地應用到不同的領域。但是目前基于流形學習的降維算法的研究中依然存在一些問題,例如計算復雜度問題、參數(shù)選擇問題以及魯棒性問題。以此為出發(fā)點,本論文圍繞流形學習算法,特別是地標等距特征映射(Landmark-ISOMAP,L-ISOMAP)算法中存在的一些問題,進行了深入的探討和研究,針對每一類問題提出了相應的解決方法,并且在人造標準數(shù)據(jù)集和真實數(shù)據(jù)集上對所提方法的有效性和可行性進行了驗證。本文的主要工作和貢獻如下:1.針對L-ISOMAP算法中的landmark點選擇問題,提出了兩種自適應的landmark點選擇方法。第一種方法先采取貪婪策略得到鄰域圖的一個子覆蓋,產(chǎn)生landmark候選點,然后從中挑選出互不相鄰的點作為landmark點。第二種方法基于圖論中的圖頂點染色思想,采用Welsh-Powell算法對鄰域圖的頂點染色,然后利用Welsh-Powell染色定理選擇其中的一個顏色劃分中的點作為landmark點。在標準測試數(shù)據(jù)集和真實數(shù)據(jù)集上的仿真實驗表明L-ISOMAP采用這兩種方法所選取的landmark點都可以得到理想的低維嵌入結果。通過比較,第一種方法在計算準確性上要優(yōu)于第二種方法;但是當遇到大規(guī)模數(shù)據(jù)集的時候,第二種方法具有更高的計算效率。在實際應用中,可以根據(jù)應用的場景和需求選取合適的方法。2.針對L-ISOMAP算法的魯棒性問題,提出了兩種消除"短路邊"的方法。第一種方法基于計算最短路徑時采用的Dijkstra算法的貪婪特性定義"邊流量",通過選取"測試路徑",實現(xiàn)對"邊流量"的快速計算并且以此作為判斷一條邊是否為"短路邊"的重要依據(jù);第二種方法基于"短路邊"的定義和流形的局部線性性質,以概率統(tǒng)計中的多維核密度估計函數(shù)為工具,分別計算流形上點的局部密度和邊的區(qū)域密度,并且以此作為判斷"短路邊"的依據(jù)。通過大量在不同數(shù)據(jù)集上的仿真實驗,驗證了本文所提的兩種方法可以準確地找出鄰域圖中的"短路邊"并且將其從鄰域圖中刪除,大大提高了 L-ISOMAP算法的魯棒性。3.針對因特網(wǎng)流量矩陣數(shù)據(jù)的高維特性,利用改進的L-ISOMAP算法對因特網(wǎng)流量矩陣進行降維,分析流量矩陣的低維流形結構。首先對真實的網(wǎng)絡流量數(shù)據(jù)進行流量矩陣建模,然后利用改進的L-ISOMAP算法對其進行降維,通過分析低維嵌入產(chǎn)生的"殘差"曲線,證實了高維因特網(wǎng)流量矩陣的確具有低維特性。最后將流量矩陣數(shù)據(jù)投影到三維和二維空間中,分析了不同流量矩陣數(shù)據(jù)的低維非線性結構,為從全網(wǎng)絡的視角分析因特網(wǎng)數(shù)據(jù)流量特征提供了一種新的思路和解決方案。
[Abstract]:......
【學位授予單位】:中國科學技術大學
【學位級別】:博士
【學位授予年份】:2017
【分類號】:TP181

【相似文獻】

相關期刊論文 前10條

1 Mudasser NASEER;秦世引;;基于非線性降維多項式邏輯斯蒂回歸的圖像/非圖像數(shù)據(jù)的分類與識別(英文)[J];智能系統(tǒng)學報;2010年01期

2 瞿師;吳玲達;于榮歡;魏迎梅;馮曉萌;;人體運動的非線性降維及新運動生成[J];計算機輔助設計與圖形學學報;2011年09期

3 涂騰濤;顧嗣揚;;基于非線性降維的人臉識別新算法[J];計算機應用;2008年08期

4 蔣科輝;王宇東;余紅山;;基于局部約束字典學習的非線性降維人臉識別[J];科學技術與工程;2013年35期

5 蘇變萍;侯筱婷;;文本數(shù)據(jù)的非線性降維方法研究[J];微電子學與計算機;2007年10期

6 孟德宇;古楠楠;徐宗本;梁怡;;針對環(huán)狀流形數(shù)據(jù)的非線性降維[J];軟件學報;2008年11期

7 李德啟;劉傳領;;一種非線性降維改進算法在圖像處理中的應用[J];陜西科技大學學報(自然科學版);2011年01期

8 譚璐,易東云,吳翊,袁偉;基于非線性降維的圖像識別[J];計算機工程;2005年13期

9 楊廣源;付旭平;黃燕;李瑤;;一種基于非線性降維和Procrustes分析的基因選取方法[J];復旦學報(自然科學版);2009年03期

10 梁淑芬;張志偉;唐紅梅;吳濤;;一種應用于人臉識別的非線性降維方法[J];電路與系統(tǒng)學報;2009年04期

相關會議論文 前5條

1 蘇變萍;侯筱婷;;文本數(shù)據(jù)的非線性降維方法研究[A];2007年全國開放式分布與并行計算機學術會議論文集(下冊)[C];2007年

2 吳玲達;瞿師;魏迎梅;于榮歡;馮曉萌;;一種人體運動自動連接方法[A];第七屆和諧人機環(huán)境聯(lián)合學術會議(HHME2011)論文集【oral】[C];2011年

3 劉翠響;張艷;于明;趙衛(wèi)萍;;基于非線性降維的人臉圖像數(shù)據(jù)分析[A];2006中國控制與決策學術年會論文集[C];2006年

4 譚璐;易東云;吳翊;袁偉;;基于非線性降維方法的圖像識別[A];第一屆全國Web信息系統(tǒng)及其應用會議(WISA2004)論文集[C];2004年

5 沈徐輝;羅小平;杜鵬英;;基于模糊的改進KPCA方法[A];第二十九屆中國控制會議論文集[C];2010年

相關博士學位論文 前1條

1 石潔;基于等距特征映射的非線性降維及其應用研究[D];中國科學技術大學;2017年

相關碩士學位論文 前1條

1 李榮燦;基于非線性降維的合成生物元件可視化及其聚類研究[D];合肥工業(yè)大學;2016年

,

本文編號:1693813

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/zidonghuakongzhilunwen/1693813.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權申明:資料由用戶f7e17***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com