稀疏樣本自表達的子空間聚類算法
本文選題:子空間聚類 + 自表示 ; 參考:《廣西師范大學(xué)》2016年碩士論文
【摘要】:實際應(yīng)用中,子空間聚類方法可以從高維數(shù)據(jù)中尋找一個低維表示,用少量的數(shù)據(jù)就能去描述整個數(shù)據(jù)空間。這在很大程度上提升了高維數(shù)據(jù)處理的效率。目前已存在不同形式的子空間聚類方法有不同的適用環(huán)境。其中基于譜聚類的子空間聚類算法是應(yīng)用較為普遍的一類處理高維數(shù)據(jù)的聚類方法,F(xiàn)有的基于譜聚類的子空間聚類算法通常圍繞數(shù)據(jù)的局部或全局信息去構(gòu)建數(shù)據(jù)的相似度矩陣,然后通過譜聚類對該相似度矩陣進行處理獲得最后的聚類結(jié)果。這些算法主要的差異在于構(gòu)建相似度矩陣的方法。一個好的相似度矩陣往往可以更好的體現(xiàn)數(shù)據(jù)子空間結(jié)構(gòu),而有利于處理高維數(shù)據(jù)中數(shù)據(jù)可能來自多個不同子空間的復(fù)雜情況。因此,本文給出了一種基于稀疏樣本自表達模型的算法去構(gòu)建相似度矩陣。該算法主要有以下幾個創(chuàng)新點:1.該算法利用樣本之間固有相關(guān)性找出一組與待測樣本相關(guān)性強的樣本去度量樣本之間的相似度,以便更好的體現(xiàn)樣本之間的相似關(guān)系。2.該算法首先通過l1-范數(shù)對自表達矩陣進行全局稀疏,使其更能體現(xiàn)出樣本空間的低維子空間屬性。然后進一步通過l2,1-范數(shù)對自表達系數(shù)矩陣進行行稀疏,使其對噪音和離群點更具魯棒性。3.該算法提出了一種求解稀疏自表達模型的優(yōu)化算法,該優(yōu)化算法可以在處理高維數(shù)據(jù)時快速收斂到最優(yōu)解,極大的減少了計算的復(fù)雜度,提高了子空間聚類的效率。
[Abstract]:In practical application, the subspace clustering method can find a low-dimensional representation from the high-dimensional data, and the whole data space can be described with a small amount of data. This greatly improves the efficiency of high dimensional data processing. There are different subspace clustering methods in different environments. The subspace clustering algorithm based on spectral clustering is a kind of clustering method which is widely used to deal with high dimensional data. The existing subspace clustering algorithms based on spectral clustering usually construct the similarity matrix around the local or global information of the data, and then process the similarity matrix by spectral clustering to obtain the final clustering results. The main difference of these algorithms is the method of constructing similarity matrix. A good similarity matrix can better reflect the structure of the data subspace, and it is helpful to deal with the complex situation that the data in the high-dimensional data may come from many different subspaces. Therefore, this paper presents an algorithm based on sparse sample self-representation model to construct similarity matrix. The algorithm has the following innovations: 1. The algorithm uses the inherent correlation between samples to find a group of samples with strong correlation to measure the similarity between samples, in order to better reflect the similarity between samples. The algorithm firstly sparse the self-representation matrix globally by using l _ 1-norm, so that it can reflect the low-dimensional subspace attributes of the sample space more effectively. Then the self-expression coefficient matrix is sparse by L _ 2N _ 1-norm to make it more robust to noise and outliers. This algorithm proposes an optimization algorithm for sparse self-representation model. The algorithm can quickly converge to the optimal solution when processing high-dimensional data, greatly reduces the computational complexity and improves the efficiency of subspace clustering.
【學(xué)位授予單位】:廣西師范大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2016
【分類號】:TP311.13
【相似文獻】
相關(guān)期刊論文 前10條
1 柳盛;吉根林;;空間聚類技術(shù)研究綜述[J];南京師范大學(xué)學(xué)報(工程技術(shù)版);2010年02期
2 馬程;楊詩琴;;基于量子粒子群的帶障礙約束的空間聚類[J];安慶師范學(xué)院學(xué)報(自然科學(xué)版);2010年03期
3 殷俊華;李光強;陳翼;鄧敏;;基于概念格的空間聚類方法[J];計算機系統(tǒng)應(yīng)用;2011年06期
4 李霞;徐樹維;;子空間聚類改進算法研究綜述[J];計算機仿真;2010年05期
5 陳銘;吉根林;;一種基于相似維的高維子空間聚類算法[J];南京師大學(xué)報(自然科學(xué)版);2010年04期
6 馬程;陳杰;;障礙約束下的空間聚類算法分析[J];宜春學(xué)院學(xué)報;2012年12期
7 張思亮;李廣霞;;子空間聚類在入侵檢測中的應(yīng)用[J];計算機安全;2013年12期
8 何彬彬;方濤;郭達志;;基于不確定性的空間聚類[J];計算機科學(xué);2004年11期
9 楊楊;孫志偉;趙政;;一種處理障礙約束的基于密度的空間聚類算法[J];計算機應(yīng)用;2007年07期
10 李光強;鄧敏;程濤;朱建軍;;一種基于雙重距離的空間聚類方法[J];測繪學(xué)報;2008年04期
相關(guān)會議論文 前6條
1 劉啟亮;鄧敏;彭東亮;徐震;;基于場論的空間聚類有效性評價方法研究[A];2009`中國地理信息產(chǎn)業(yè)論壇暨第二屆教育論壇就業(yè)洽談會論文集[C];2009年
2 鄧羽;;廣義多維云模型在空間聚類中的應(yīng)用[A];地理學(xué)與生態(tài)文明建設(shè)——中國地理學(xué)會2008年學(xué)術(shù)年會論文摘要集[C];2008年
3 鄧敏;劉啟亮;李光強;程濤;;一種基于場模型的空間聚類算法[A];現(xiàn)代測量技術(shù)與地理信息系統(tǒng)科技創(chuàng)新及產(chǎn)業(yè)發(fā)展研討會論文集[C];2009年
4 徐玉峰;周麗華;肖清;;一種基于數(shù)據(jù)分布差異度的子空間聚類算法[A];第二十五屆中國數(shù)據(jù)庫學(xué)術(shù)會議論文集(一)[C];2008年
5 張燕萍;姜青山;;k-means型軟子空間聚類算法[A];NDBC2010第27屆中國數(shù)據(jù)庫學(xué)術(shù)會議論文集A輯二[C];2010年
6 任家東;周瑋瑋;何海濤;;高維數(shù)據(jù)流的自適應(yīng)子空間聚類算法[A];NDBC2010第27屆中國數(shù)據(jù)庫學(xué)術(shù)會議論文集A輯二[C];2010年
相關(guān)博士學(xué)位論文 前3條
1 孫麗萍;半監(jiān)督空間聚類方法及其在城市公共設(shè)施區(qū)位規(guī)劃中的應(yīng)用研究[D];安徽師范大學(xué);2015年
2 黃明;基于空間分區(qū)的空間聚類研究[D];武漢大學(xué);2010年
3 王劍亭;面向量子密鑰分發(fā)安全性分析的子空間聚類算法研究[D];中國科學(xué)技術(shù)大學(xué);2015年
相關(guān)碩士學(xué)位論文 前10條
1 魏海洋;城市案件空間聚類技術(shù)研究[D];北京建筑大學(xué);2015年
2 張洋;基于空間聚類的公路交通運力態(tài)勢可視化方法研究[D];國防科學(xué)技術(shù)大學(xué);2013年
3 歐陽佩佩;改進的稀疏子空間聚類算法研究[D];青島大學(xué);2015年
4 孫素敏;子空間聚類及其應(yīng)用[D];西安建筑科技大學(xué);2016年
5 許亞駿;子空間聚類算法研究及應(yīng)用[D];江南大學(xué);2016年
6 凌曉蔚;基于子空間聚類的多關(guān)系社交網(wǎng)絡(luò)挖掘研究[D];電子科技大學(xué);2016年
7 吳飛;面向序列數(shù)據(jù)的稀疏低秩子空間聚類方法研究[D];北京工業(yè)大學(xué);2016年
8 鄧振云;稀疏樣本自表達的子空間聚類算法[D];廣西師范大學(xué);2016年
9 齊緒停;基于子空間聚類的文本相關(guān)性研究[D];山東師范大學(xué);2016年
10 楊楊;基于約束的空間聚類的研究[D];天津大學(xué);2007年
,本文編號:1925183
本文鏈接:http://sikaile.net/kejilunwen/ruanjiangongchenglunwen/1925183.html