等距映射流形學(xué)習(xí)算法中的若干問(wèn)題研究
本文關(guān)鍵詞:等距映射流形學(xué)習(xí)算法中的若干問(wèn)題研究
更多相關(guān)文章: 數(shù)據(jù)降維 流形學(xué)習(xí) 等距映射 拓?fù)浔3?/b> 在線映射
【摘要】:隨著互聯(lián)網(wǎng)的高速發(fā)展,大數(shù)據(jù)(Big data)吸引了各領(lǐng)域越來(lái)越多的關(guān)注。實(shí)際應(yīng)用中的復(fù)雜高維數(shù)據(jù),不僅對(duì)于計(jì)算復(fù)雜度和空間復(fù)雜度產(chǎn)生很高的要求,還會(huì)產(chǎn)生維數(shù)災(zāi)難(the curse of dimensionality),對(duì)數(shù)據(jù)分析和應(yīng)用帶來(lái)嚴(yán)重的問(wèn)題。在盡可能保持原始數(shù)據(jù)信息的基礎(chǔ)上降低數(shù)據(jù)維度,是解決上述問(wèn)題的重要手段之一。流形學(xué)習(xí)作為非線性數(shù)據(jù)降維方法,憑借其能夠?qū)W習(xí)原始數(shù)據(jù)在高維空間中的非線性結(jié)構(gòu)、發(fā)現(xiàn)其本質(zhì)維度的優(yōu)勢(shì),近年來(lái)取得很多關(guān)注,出現(xiàn)了大量研究成果。然而當(dāng)前的流形學(xué)習(xí)方法還存在一些普遍問(wèn)題,如面對(duì)海量數(shù)據(jù)的計(jì)算效率問(wèn)題、無(wú)法處理新數(shù)據(jù)導(dǎo)致的監(jiān)督學(xué)習(xí)問(wèn)題等。其中經(jīng)典的等距映射流形學(xué)習(xí)算法Isomap具有計(jì)算效率低、鄰域難以確定、無(wú)法處理新數(shù)據(jù)等內(nèi)在缺點(diǎn),限制了其進(jìn)一步的實(shí)際應(yīng)用。本文從Isomap算法存在的問(wèn)題出發(fā),研究Isomap及其改進(jìn)算法產(chǎn)生的背景,針對(duì)它們存在的缺點(diǎn)提出了兩種有效的流形學(xué)習(xí)算法,并和現(xiàn)有的相關(guān)研究成果進(jìn)行了計(jì)算復(fù)雜度、空間復(fù)雜度和實(shí)驗(yàn)結(jié)果的比較。本文的主要貢獻(xiàn)概括如下:1.梳理了Isomap算法的發(fā)展經(jīng)歷以及改進(jìn)算法,介紹了相關(guān)算法的產(chǎn)生以及主要思想。2.提出了基于自組織神經(jīng)網(wǎng)絡(luò)的SoinnLandmark-Isomap(下稱(chēng)SL-Isomap)算法,具有同時(shí)確定基準(zhǔn)點(diǎn)數(shù)量和位置的優(yōu)勢(shì),解決了現(xiàn)有基準(zhǔn)點(diǎn)Isomap算法中難以確定合適數(shù)量基準(zhǔn)點(diǎn)的問(wèn)題,同時(shí)實(shí)現(xiàn)了數(shù)據(jù)壓縮與非線性降維。3.提出了基于自組織神經(jīng)網(wǎng)絡(luò)的拓?fù)鋵W(xué)習(xí)與在線映射算法(Topology Learning and Out-of-sample Embedding, TLOE),同時(shí)解決了傳統(tǒng)Isomap及其改進(jìn)算法中計(jì)算效率低、鄰域難以確定、無(wú)法處理新數(shù)據(jù)的三個(gè)內(nèi)在缺點(diǎn)。更重要的是,由于TLOE能夠?qū)π聰?shù)據(jù)進(jìn)行在線降維映射,而不用重新訓(xùn)練整個(gè)數(shù)據(jù)集,使得TLOE的實(shí)際應(yīng)用擴(kuò)展到了監(jiān)督學(xué)習(xí)。因此解決了流形學(xué)習(xí)中的計(jì)算效率和監(jiān)督學(xué)習(xí)兩大普遍問(wèn)題。
【關(guān)鍵詞】:數(shù)據(jù)降維 流形學(xué)習(xí) 等距映射 拓?fù)浔3?/strong> 在線映射
【學(xué)位授予單位】:南京大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2016
【分類(lèi)號(hào)】:TP181
【目錄】:
- 摘要4-6
- Abstract6-12
- 第一章 緒論12-16
- 1.1 研究背景和意義12-13
- 1.1.1 數(shù)據(jù)降維概述12-13
- 1.1.2 流形學(xué)習(xí)與等距映射算法13
- 1.2 本文工作13-14
- 1.3 本文組織結(jié)構(gòu)14-16
- 第二章 等距映射算法Isomap的產(chǎn)生及發(fā)展綜述16-23
- 2.1 主成分分析算法PCA16-18
- 2.2 多維尺度變換算法MDS18-19
- 2.3 基準(zhǔn)點(diǎn)多維尺度變換算法LMDS19-20
- 2.4 等距映射算法Isomap20-21
- 2.5 基準(zhǔn)點(diǎn)等距映射算法L-Isomap21
- 2.6 本章小結(jié)21-23
- 第三章 改進(jìn)基準(zhǔn)點(diǎn)選取的算法SL-Isomap23-39
- 3.1 研究動(dòng)機(jī)23-25
- 3.2 SOINN簡(jiǎn)介25-26
- 3.3 SLIsomap算法描述26-30
- 3.3.1 基準(zhǔn)點(diǎn)選取26-28
- 3.3.2 測(cè)地線距離計(jì)算28-29
- 3.3.3 基準(zhǔn)點(diǎn)降維映射29-30
- 3.3.4 基于基準(zhǔn)點(diǎn)對(duì)數(shù)據(jù)降維映射30
- 3.3.5 坐標(biāo)標(biāo)準(zhǔn)化30
- 3.4 拓?fù)浔3址治?/span>30-31
- 3.5 計(jì)算與空間復(fù)雜度分析31
- 3.6 對(duì)比實(shí)驗(yàn)分析31-36
- 3.6.1 Swiss_roll_data數(shù)據(jù)集32-33
- 3.6.2 含噪聲的swiss_roll_data數(shù)據(jù)集33-35
- 3.6.3 AT&T face數(shù)據(jù)集35-36
- 3.7 誤差分析36-38
- 3.8 本章小結(jié)38-39
- 第四章 拓?fù)鋵W(xué)習(xí)與在線降維算法(TLOE)39-52
- 4.1 研究動(dòng)機(jī)39
- 4.2 TLOE算法描述39-43
- 4.2.1 基準(zhǔn)點(diǎn)近鄰圖構(gòu)造40
- 4.2.2 基準(zhǔn)點(diǎn)測(cè)地線距離計(jì)算40-42
- 4.2.3 基準(zhǔn)點(diǎn)降維映射42
- 4.2.4 新數(shù)據(jù)點(diǎn)測(cè)地線距離計(jì)算42-43
- 4.2.5 新數(shù)據(jù)點(diǎn)降維映射43
- 4.3 拓?fù)浔3址治?/span>43-44
- 4.4 計(jì)算與空間復(fù)雜度分析44
- 4.5 可視化效果44
- 4.6 對(duì)比實(shí)驗(yàn)分析44-49
- 4.6.1 Swiss_roll_data數(shù)據(jù)集的降維可視化46-47
- 4.6.2 含噪聲的swiss_roll_data數(shù)據(jù)集的降維可視化47-48
- 4.6.3 Mnist數(shù)據(jù)集的分類(lèi)任務(wù)48-49
- 4.7 誤差分析49-50
- 4.8 本章小結(jié)50-52
- 第五章 總結(jié)與展望52-53
- 參考文獻(xiàn)53-58
- 致謝58-59
- 簡(jiǎn)歷與科研成果59-62
【相似文獻(xiàn)】
中國(guó)期刊全文數(shù)據(jù)庫(kù) 前10條
1 曾憲華;羅四維;;局部保持的流形學(xué)習(xí)算法對(duì)比研究[J];計(jì)算機(jī)工程與應(yīng)用;2008年29期
2 劉志勇;;基于保距與保拓?fù)涞牧餍螌W(xué)習(xí)算法[J];長(zhǎng)江大學(xué)學(xué)報(bào)(自然科學(xué)版)理工卷;2010年02期
3 閆志敏;劉希玉;;流形學(xué)習(xí)及其算法研究[J];計(jì)算機(jī)技術(shù)與發(fā)展;2011年05期
4 楊海紅;;流形學(xué)習(xí)中鄰域大小的選擇算法[J];山西煤炭管理干部學(xué)院學(xué)報(bào);2011年01期
5 周華;蔡超;丁明躍;;基于流形學(xué)習(xí)和流形高階近似的圖像距離度量[J];華中科技大學(xué)學(xué)報(bào)(自然科學(xué)版);2012年03期
6 石陸魁;張軍;宮曉騰;;基于鄰域保持的流形學(xué)習(xí)算法評(píng)價(jià)模型[J];計(jì)算機(jī)應(yīng)用;2012年09期
7 談超;關(guān)佶紅;周水庚;;增量與演化流形學(xué)習(xí)綜述[J];智能系統(tǒng)學(xué)報(bào);2012年05期
8 徐蓉;姜峰;姚鴻勛;;流形學(xué)習(xí)概述[J];智能系統(tǒng)學(xué)報(bào);2006年01期
9 羅四維;趙連偉;;基于譜圖理論的流形學(xué)習(xí)算法[J];計(jì)算機(jī)研究與發(fā)展;2006年07期
10 周紅;吳煒;滕奇志;楊曉敏;李e,
本文編號(hào):913817
本文鏈接:http://sikaile.net/kejilunwen/zidonghuakongzhilunwen/913817.html