基于分布保持的特征提取方法研究
發(fā)布時間:2021-04-17 07:45
隨著社會的快速發(fā)展,模式識別已在各行各業(yè)受到了廣泛地關注,并已成為當今社會生活中的實際應用。模式識別研究內容包括了數(shù)學、機器學習、計算機視覺、人工智能、神經科學以及認知科學等多門學科,是一個具有挑戰(zhàn)性的理論研究難點,也是一個快速發(fā)展的挑戰(zhàn)性應用問題。作為模式識別的核心內容,特征提取主要研究如何從高維觀測數(shù)據(jù)中學習到有利于識別任務的判別屬性,特征提取模型的質量直接決定著模式識別的性能。特征提取研究是當前模式識別領域的熱點問題之一。現(xiàn)有模型基本是在歐式距離下取得數(shù)據(jù)的最優(yōu)低維表示,沒有考慮隱藏在高維數(shù)據(jù)中的非線性流形結構。而且基于歐式距離的模型不能保證把具有較大內在曲率的流形結構映射到本征維嵌入空間中。本文采用核密度估計方法來近似隱藏在高維數(shù)據(jù)空間中的本征維流形結構,提出了多個基于分布保持嵌入學習的非線性特征提取模型來消除數(shù)據(jù)較大內在曲率,并分別從監(jiān)督分類,無監(jiān)督聚類,半監(jiān)督分類的角度來驗證這些特征提取模型性能。論文的主要內容和創(chuàng)新點可歸納如下:(1)基于邊緣平滑的分布保持超球嵌入學習提出了一種基于邊緣平滑的分布保持超球面嵌入模型,并應用于高光譜數(shù)據(jù)特征提取中。具體是在用光譜特征向量估計每...
【文章來源】:重慶大學重慶市 211工程院校 985工程院校 教育部直屬院校
【文章頁數(shù)】:115 頁
【學位級別】:博士
【部分圖文】:
典型的模式識別系統(tǒng)
褂成淶揭桓鯠維空間中[29]。顯然,內在曲率的存在給基于距離的特征提取模型帶來了極大的挑戰(zhàn)。J.K.Mose在研究[30]中表明:滿足一定條件的兩個流形之間存在著一個同胚變換(homeomorphictransformation),該變換可保持二者局部體積不變。同胚變換可消除較大的內在曲率,并找到嵌入在高維數(shù)據(jù)空間中的低維流形結構,在不破壞數(shù)據(jù)流形拓撲結構的情況下使得樣本在低維嵌入空間中具有非常簡潔的幾何結構。雖然同胚變換整個過程可通過旋轉、拉伸、壓縮等操作來達到近似的目的,然而如何代數(shù)化這一抽象變換過程卻顯得比較困難。圖1.2給出了一個簡單的示意圖,三維觀測空間中的瑞士卷(Swissroll)表現(xiàn)出了較大內在曲率,同胚變換可消除這些復雜內在曲率,并把三維觀測數(shù)據(jù)映射到具有清晰幾何平面結構的本征維流形空間中。圖1.2同胚變換示意圖。Fig.1.2Theschematicdiagramofhomeomorphictransformation.在低維嵌入空間中保持高維數(shù)據(jù)流形結構是特征提取的重要目的,而同胚變換是能夠使得拓撲結構不變的連續(xù)映射。Moser定理及其推論給出了實現(xiàn)同胚變換的代數(shù)化方案,即通過使得原始觀測數(shù)據(jù)空間和低維嵌入空間中的數(shù)據(jù)分布保持一
重慶大學博士學位論文20(|)()DijijDhhchhghhbb(2.24)圖2.3基于邊緣平滑的分布保持超球面嵌入框架的示意圖。(b)和(c)中的垂直坐標軸表示條件密度。其中,(b)和(c)中的條件密度(|)是0,非零值只是為了便于顯示。Fig.2.3.Schematicdiagramoftheproposededgesmoothing-baseddistributionpreservinghypersphericalembeddingframework.Theverticalaxisin(b)and(c)denotetheconditionaldensity.Notethattheconditionaldensities(|)in(b)and(c)are0andthenonzerovaluesarejustforeasytodisplay.2.3.4優(yōu)化設計最小化任意點對i,j在兩個空間中條件密度的不一致性有助于保持原始數(shù)據(jù)的流形結構不變,為了在低維空間中呈現(xiàn)高光譜數(shù)據(jù)的曲線和非線性結構,需給最后求得的低維嵌入施加一個超球限制,最終,本章方法的目標函數(shù)表達式如下,2((|)(|))ijijijOghhfxx2..1isth(2.25)實際上,上述約束目標函數(shù)是一個非凸問題,因此難以實現(xiàn)全局優(yōu)化。拉格朗日乘子法,系數(shù)歸一化法,切線梯度法等都適用于最小化上述約束目標函數(shù)[46]。目標函數(shù)O相對于ih的偏導數(shù)為,1212((|)(|))"()DNDijijijDijijhhODchhghhfxxhhhbb(2.26)
本文編號:3143074
【文章來源】:重慶大學重慶市 211工程院校 985工程院校 教育部直屬院校
【文章頁數(shù)】:115 頁
【學位級別】:博士
【部分圖文】:
典型的模式識別系統(tǒng)
褂成淶揭桓鯠維空間中[29]。顯然,內在曲率的存在給基于距離的特征提取模型帶來了極大的挑戰(zhàn)。J.K.Mose在研究[30]中表明:滿足一定條件的兩個流形之間存在著一個同胚變換(homeomorphictransformation),該變換可保持二者局部體積不變。同胚變換可消除較大的內在曲率,并找到嵌入在高維數(shù)據(jù)空間中的低維流形結構,在不破壞數(shù)據(jù)流形拓撲結構的情況下使得樣本在低維嵌入空間中具有非常簡潔的幾何結構。雖然同胚變換整個過程可通過旋轉、拉伸、壓縮等操作來達到近似的目的,然而如何代數(shù)化這一抽象變換過程卻顯得比較困難。圖1.2給出了一個簡單的示意圖,三維觀測空間中的瑞士卷(Swissroll)表現(xiàn)出了較大內在曲率,同胚變換可消除這些復雜內在曲率,并把三維觀測數(shù)據(jù)映射到具有清晰幾何平面結構的本征維流形空間中。圖1.2同胚變換示意圖。Fig.1.2Theschematicdiagramofhomeomorphictransformation.在低維嵌入空間中保持高維數(shù)據(jù)流形結構是特征提取的重要目的,而同胚變換是能夠使得拓撲結構不變的連續(xù)映射。Moser定理及其推論給出了實現(xiàn)同胚變換的代數(shù)化方案,即通過使得原始觀測數(shù)據(jù)空間和低維嵌入空間中的數(shù)據(jù)分布保持一
重慶大學博士學位論文20(|)()DijijDhhchhghhbb(2.24)圖2.3基于邊緣平滑的分布保持超球面嵌入框架的示意圖。(b)和(c)中的垂直坐標軸表示條件密度。其中,(b)和(c)中的條件密度(|)是0,非零值只是為了便于顯示。Fig.2.3.Schematicdiagramoftheproposededgesmoothing-baseddistributionpreservinghypersphericalembeddingframework.Theverticalaxisin(b)and(c)denotetheconditionaldensity.Notethattheconditionaldensities(|)in(b)and(c)are0andthenonzerovaluesarejustforeasytodisplay.2.3.4優(yōu)化設計最小化任意點對i,j在兩個空間中條件密度的不一致性有助于保持原始數(shù)據(jù)的流形結構不變,為了在低維空間中呈現(xiàn)高光譜數(shù)據(jù)的曲線和非線性結構,需給最后求得的低維嵌入施加一個超球限制,最終,本章方法的目標函數(shù)表達式如下,2((|)(|))ijijijOghhfxx2..1isth(2.25)實際上,上述約束目標函數(shù)是一個非凸問題,因此難以實現(xiàn)全局優(yōu)化。拉格朗日乘子法,系數(shù)歸一化法,切線梯度法等都適用于最小化上述約束目標函數(shù)[46]。目標函數(shù)O相對于ih的偏導數(shù)為,1212((|)(|))"()DNDijijijDijijhhODchhghhfxxhhhbb(2.26)
本文編號:3143074
本文鏈接:http://sikaile.net/kejilunwen/shengwushengchang/3143074.html
最近更新
教材專著