面向多視圖數(shù)據(jù)的降維與聚類算法研究
發(fā)布時間:2021-06-11 04:18
隨著數(shù)據(jù)來源的多樣化,擁有多種表達方式的多視圖數(shù)據(jù)出現(xiàn)在各個應用場景中。這些多視圖數(shù)據(jù)普遍維數(shù)較高,數(shù)據(jù)量較大,并且常常缺失標簽信息,因此,對多視圖數(shù)據(jù)以無監(jiān)督方式進行學習,分析和挖掘其中潛藏的價值信息顯得頗為重要。本文在大量閱讀和理解前人工作的基礎上,提出了幾種面向多視圖數(shù)據(jù)的降維與聚類算法,具體內容如下:(1)提出了一種面向多視圖數(shù)據(jù)的近鄰結構保持降維算法。該算法在每個視圖上構造帶權鄰接圖來反映樣本之間的近鄰關系,并構造任意兩個視圖間結構相似性約束表達。在此基礎上,尋找聯(lián)合嵌入低維子空間,使得原高維空間樣本近鄰關系在子空間內能夠得到保持,并且視圖間的結構具有相似性的約束。(2)提出了一種基于多核學習的在線加權多視圖模糊聚類算法。該算法采用批處理形式,將整個數(shù)據(jù)集分割成多個數(shù)據(jù)塊進行處理,并將前一個數(shù)據(jù)塊的聚類結果帶入下一個數(shù)據(jù)塊中作為初始值,由最后一個數(shù)據(jù)塊得到最終的聚類結果。針對每個數(shù)據(jù)塊,算法借鑒多核學習方法,充分利用不同視圖間的結構一致性和信息互補性原則,同時,設計出了聚類中心和聚類隸屬度的在線更新模型,為多視圖數(shù)據(jù)提供聚類劃分和視圖權重。(3)提出了兩種基于多視圖降維策略的...
【文章來源】:南京師范大學江蘇省 211工程院校
【文章頁數(shù)】:81 頁
【學位級別】:碩士
【部分圖文】:
圖1.1多視圖數(shù)據(jù)??對多視圖數(shù)據(jù)進行降維是多視圖研究方法中的一個層面
?是課程、教員、學生、項目以及職工。??在多視圖Wine數(shù)據(jù)集和Texas數(shù)據(jù)集的視圖1上,隨機選定原空間中某一??樣本點并用藍色矩形表示,其最近鄰居節(jié)點用紅色菱形表示,剩余樣本均用綠色??表示,子空間中同樣如此。為了增強實驗效果,對樣本點以及鄰居節(jié)點尺寸進行??了放大處理。首先,取兩個數(shù)據(jù)集原始空間視圖1上前兩個維度在二維空間下的??可視化結果,如圖3.1a和3.2a所示。其次,在數(shù)據(jù)集視圖1上運行MPVD算法,??將子空間維數(shù)設置為2后,得到二維空間下的可視化結果,如圖3.1b和3.2b所??/Jn?〇???5-??-e-????卜.?、.,,、>?*?.7-?'?丫、???lr?-8?-??!:?H..,?^??|卜?*?-10-??>11 ̄iti^ ̄^ ̄ ̄ ̄^^.05?0?0.06?0.1?0.1S?0.2?0.25?0.3?0.35?0.4??(3)原視圖1中某鄰近兩點?(b>子空間內分布??圖3.1?Wine數(shù)據(jù)集上某樣本點近鄰結構分布示意圖??由圖3.1a可以觀察到
子空間中同樣如此。為了增強實驗效果,對樣本點以及鄰居節(jié)點尺寸進行??了放大處理。首先,取兩個數(shù)據(jù)集原始空間視圖1上前兩個維度在二維空間下的??可視化結果,如圖3.1a和3.2a所示。其次,在數(shù)據(jù)集視圖1上運行MPVD算法,??將子空間維數(shù)設置為2后,得到二維空間下的可視化結果,如圖3.1b和3.2b所??/Jn?〇???5-??-e-????卜.?、.,,、>?*?.7-?'?丫、???lr?-8?-??!:?H..,?^??|卜?*?-10-??>11 ̄iti^ ̄^ ̄ ̄ ̄^^.05?0?0.06?0.1?0.1S?0.2?0.25?0.3?0.35?0.4??(3)原視圖1中某鄰近兩點?(b>子空間內分布??圖3.1?Wine數(shù)據(jù)集上某樣本點近鄰結構分布示意圖??由圖3.1a可以觀察到,原始空間Wine數(shù)據(jù)集視圖1上,用藍色矩形表示的??某樣本點與紅色菱形表示的最近鄰居節(jié)點其相對位置比較接近。在運行MPVD??算法后的子空間內,由圖3.1b可以觀察到,藍色矩形表示的某樣本點與紅色菱??形表示的最近鄰居節(jié)點其相對位置也十分貼近。由于樣本點是隨機選取的,因此??可以判定在Wine數(shù)據(jù)集上,原空間中樣本點的近鄰關系在子空間中得到了保持。??4廠??3??3??2??2?jj:.??11?”?
【參考文獻】:
期刊論文
[1]利用正則化矩陣分解技術的多視圖聚類方法[J]. 徐霜,余琍. 計算機工程與應用. 2019(14)
[2]Locality preserving projection on SPD matrix Lie group: algorithm and analysis[J]. Yangyang LI,Ruqian LU. Science China(Information Sciences). 2018(09)
[3]基于在線聚類的協(xié)同作弊團體識別方法[J]. 孫勇,譚文安,金婷,周亮廣. 計算機研究與發(fā)展. 2018(06)
[4]基于滑動窗口的分布式軌跡流聚類[J]. 毛嘉莉,陳鶴,宋秋革,金澈清,周傲英. 計算機學報. 2018(09)
[5]一種改進的多視圖聚類集成算法[J]. 鄧強,楊燕,王浩. 計算機科學. 2017(01)
[6]基于多視圖融合的蛋白質功能模塊檢測方法[J]. 張媛,賈克斌,ZHANG Aidong. 電子學報. 2014(12)
[7]聯(lián)機核模糊C均值聚類方法[J]. 吳小燕,陳松燦. 系統(tǒng)工程與電子技術. 2012(12)
[8]MVP:基于CCA的多視圖數(shù)據(jù)相關性預測方法[J]. 卜道成,陳飛,紀傳舜. 計算機應用與軟件. 2011(08)
博士論文
[1]基于多視圖鑒別特征學習的分類算法[D]. 李晉.中國礦業(yè)大學(北京) 2016
碩士論文
[1]基于不完整視圖的多核譜聚類算法及分布式實現(xiàn)[D]. 張薇.西南交通大學 2018
[2]基于劃分模型的多視圖聚類算法研究[D]. 張屹然.南京師范大學 2018
[3]基于矩陣分解的多視圖降維方法研究[D]. 張曉語.西安電子科技大學 2017
[4]基于多核學習的多視圖增量聚類模型研究[D]. 張佩瑞.西南交通大學 2017
[5]基于非負矩陣分解的多視圖聚類方法研究[D]. 石錦輝.蘭州大學 2017
[6]多視圖學習研究及其算法改進[D]. 劉彥勛.西安電子科技大學 2015
本文編號:3223800
【文章來源】:南京師范大學江蘇省 211工程院校
【文章頁數(shù)】:81 頁
【學位級別】:碩士
【部分圖文】:
圖1.1多視圖數(shù)據(jù)??對多視圖數(shù)據(jù)進行降維是多視圖研究方法中的一個層面
?是課程、教員、學生、項目以及職工。??在多視圖Wine數(shù)據(jù)集和Texas數(shù)據(jù)集的視圖1上,隨機選定原空間中某一??樣本點并用藍色矩形表示,其最近鄰居節(jié)點用紅色菱形表示,剩余樣本均用綠色??表示,子空間中同樣如此。為了增強實驗效果,對樣本點以及鄰居節(jié)點尺寸進行??了放大處理。首先,取兩個數(shù)據(jù)集原始空間視圖1上前兩個維度在二維空間下的??可視化結果,如圖3.1a和3.2a所示。其次,在數(shù)據(jù)集視圖1上運行MPVD算法,??將子空間維數(shù)設置為2后,得到二維空間下的可視化結果,如圖3.1b和3.2b所??/Jn?〇???5-??-e-????卜.?、.,,、>?*?.7-?'?丫、???lr?-8?-??!:?H..,?^??|卜?*?-10-??>11 ̄iti^ ̄^ ̄ ̄ ̄^^.05?0?0.06?0.1?0.1S?0.2?0.25?0.3?0.35?0.4??(3)原視圖1中某鄰近兩點?(b>子空間內分布??圖3.1?Wine數(shù)據(jù)集上某樣本點近鄰結構分布示意圖??由圖3.1a可以觀察到
子空間中同樣如此。為了增強實驗效果,對樣本點以及鄰居節(jié)點尺寸進行??了放大處理。首先,取兩個數(shù)據(jù)集原始空間視圖1上前兩個維度在二維空間下的??可視化結果,如圖3.1a和3.2a所示。其次,在數(shù)據(jù)集視圖1上運行MPVD算法,??將子空間維數(shù)設置為2后,得到二維空間下的可視化結果,如圖3.1b和3.2b所??/Jn?〇???5-??-e-????卜.?、.,,、>?*?.7-?'?丫、???lr?-8?-??!:?H..,?^??|卜?*?-10-??>11 ̄iti^ ̄^ ̄ ̄ ̄^^.05?0?0.06?0.1?0.1S?0.2?0.25?0.3?0.35?0.4??(3)原視圖1中某鄰近兩點?(b>子空間內分布??圖3.1?Wine數(shù)據(jù)集上某樣本點近鄰結構分布示意圖??由圖3.1a可以觀察到,原始空間Wine數(shù)據(jù)集視圖1上,用藍色矩形表示的??某樣本點與紅色菱形表示的最近鄰居節(jié)點其相對位置比較接近。在運行MPVD??算法后的子空間內,由圖3.1b可以觀察到,藍色矩形表示的某樣本點與紅色菱??形表示的最近鄰居節(jié)點其相對位置也十分貼近。由于樣本點是隨機選取的,因此??可以判定在Wine數(shù)據(jù)集上,原空間中樣本點的近鄰關系在子空間中得到了保持。??4廠??3??3??2??2?jj:.??11?”?
【參考文獻】:
期刊論文
[1]利用正則化矩陣分解技術的多視圖聚類方法[J]. 徐霜,余琍. 計算機工程與應用. 2019(14)
[2]Locality preserving projection on SPD matrix Lie group: algorithm and analysis[J]. Yangyang LI,Ruqian LU. Science China(Information Sciences). 2018(09)
[3]基于在線聚類的協(xié)同作弊團體識別方法[J]. 孫勇,譚文安,金婷,周亮廣. 計算機研究與發(fā)展. 2018(06)
[4]基于滑動窗口的分布式軌跡流聚類[J]. 毛嘉莉,陳鶴,宋秋革,金澈清,周傲英. 計算機學報. 2018(09)
[5]一種改進的多視圖聚類集成算法[J]. 鄧強,楊燕,王浩. 計算機科學. 2017(01)
[6]基于多視圖融合的蛋白質功能模塊檢測方法[J]. 張媛,賈克斌,ZHANG Aidong. 電子學報. 2014(12)
[7]聯(lián)機核模糊C均值聚類方法[J]. 吳小燕,陳松燦. 系統(tǒng)工程與電子技術. 2012(12)
[8]MVP:基于CCA的多視圖數(shù)據(jù)相關性預測方法[J]. 卜道成,陳飛,紀傳舜. 計算機應用與軟件. 2011(08)
博士論文
[1]基于多視圖鑒別特征學習的分類算法[D]. 李晉.中國礦業(yè)大學(北京) 2016
碩士論文
[1]基于不完整視圖的多核譜聚類算法及分布式實現(xiàn)[D]. 張薇.西南交通大學 2018
[2]基于劃分模型的多視圖聚類算法研究[D]. 張屹然.南京師范大學 2018
[3]基于矩陣分解的多視圖降維方法研究[D]. 張曉語.西安電子科技大學 2017
[4]基于多核學習的多視圖增量聚類模型研究[D]. 張佩瑞.西南交通大學 2017
[5]基于非負矩陣分解的多視圖聚類方法研究[D]. 石錦輝.蘭州大學 2017
[6]多視圖學習研究及其算法改進[D]. 劉彥勛.西安電子科技大學 2015
本文編號:3223800
本文鏈接:http://sikaile.net/kejilunwen/ruanjiangongchenglunwen/3223800.html
最近更新
教材專著