基于魯棒子空間表示的多視角子空間聚類與社區(qū)發(fā)現(xiàn)的研究
發(fā)布時間:2021-07-23 01:37
隨著科學技術的日新月異,現(xiàn)今人們獲取數(shù)據(jù)的能力也越來越強,所獲取的數(shù)據(jù)往往具有規(guī)模大、維度高、多視角和多樣化等特征,如何從數(shù)據(jù)中分析出有意義、有價值的信息尤為顯得重要。對數(shù)據(jù)的分析,需要揭示數(shù)據(jù)中內(nèi)在的復雜性和真實維度,并且能覆蓋數(shù)據(jù)的全局和局部結(jié)構特征,而子空間表示算法恰好能夠從高維數(shù)據(jù)中挖掘出數(shù)據(jù)潛在的低維數(shù)據(jù)結(jié)構特征,是一種有效的處理高維數(shù)據(jù)的方法。近年來,子空間表示的相關問題已成為學者們的研究熱點,比如基于稀疏表示、低秩表示和Frobenius范數(shù)約束的子空間表示算法等,在分析高維和多視角數(shù)據(jù)時都取得了一定的成效,但是,該類算法仍然存在對數(shù)據(jù)的挖掘不夠深入和應用不夠廣泛的問題。對于多視角數(shù)據(jù),現(xiàn)有的多視角子空間聚類算法,在協(xié)調(diào)利用所有視角的數(shù)據(jù)信息時,仍然存在不足,從而,造成算法的性能不夠好。此外,社區(qū)網(wǎng)絡數(shù)據(jù)也是一種復雜的高維數(shù)據(jù),在本文中進一步將子空間表示應用于分析社區(qū)網(wǎng)絡數(shù)據(jù)。在每個社區(qū)中的節(jié)點可以看成是在測地線空間中張成的一個子空間,目前對基于子空間表示的社區(qū)檢測算法研究依然不夠充分,而已有的相關算法對網(wǎng)絡中的噪聲很敏感,缺乏準確學習社區(qū)結(jié)構的能力。針對上述問題,本文的...
【文章來源】:安徽大學安徽省 211工程院校
【文章頁數(shù)】:72 頁
【學位級別】:碩士
【部分圖文】:
LRR算法自動糾正數(shù)據(jù)中錯誤的能力驗證Fig2.2TheabilityofLRRalgorithmtoautomaticallycorrecterrorsindata
安徽大學碩士學位論文37第五,驗證參數(shù)設置對算法性能的影響。MVSS用參數(shù)和平衡數(shù)據(jù)表示矩陣和相似性矩陣。我們測試隨著兩個參數(shù)的變化,用S和Z*構建的兩個圖的聚類性能。為了方便起見,我們隨機的選取了在數(shù)據(jù)集Handwrittennumerals(HW)上實驗,近鄰數(shù)k根據(jù)之前做實驗的經(jīng)驗設置為6,參數(shù)和設置的范圍為{0.1,5,10,20,50}。在圖3.3,(a)和(b)展示了用圖G1聚類,其評價指標ACC和NMI的隨著參數(shù)變化而變化的情況,(c)和(d)展示了用圖G2聚類,其評價指標ACC和NMI的變化情況。從圖(a)和(b)中可以看出,當用圖G1且參數(shù)=0.1時,評價指標值相對較低,除此之外,當參數(shù)設置在一個較大的范圍變化時,實驗結(jié)果都非常穩(wěn)定。將(a)(b)和(c)(d)相比較,圖(a)(b)對參數(shù)更加敏感,這也證明了我們算法中使用數(shù)據(jù)表示矩陣和相似性矩陣構建的圖更加魯棒,對于高維數(shù)據(jù)中潛在的低維數(shù)據(jù)結(jié)構學習的效果更好。圖3.3MVSC算法參數(shù)的變化對聚類結(jié)果的影響Fig3.3TheinfluenceofMVSCalgorithmparametersonclusteringresults
第四章基于魯棒子空間表示的社區(qū)檢測40高的節(jié)點更傾向于聚類到同一個社區(qū)中;第二步,用S作為數(shù)據(jù)輸入,應用于子空間表示的相關聚類模型中,學習網(wǎng)絡的低維數(shù)據(jù)結(jié)構,像SSCF[48]和LRSCD[49]算法就是分別學習數(shù)據(jù)的稀疏和低秩表示;第三步,將子空間表示矩陣和鄰接矩陣A融合,再聚類劃分出網(wǎng)絡中的社區(qū)。圖4.1基于子空間聚類的社區(qū)檢測算法概述Fig4.1Anoverviewofcommunitydetectionalgorithmbasedonsubspaceclustering4.3算法實現(xiàn)這部分將介紹我們提出的算法的具體實現(xiàn),首先是對原始網(wǎng)絡數(shù)據(jù)的處理,接著,將網(wǎng)絡社區(qū)數(shù)據(jù)表示應用到自加權的魯棒子空間表示算法中,學習數(shù)據(jù)的低維子空間表示,最后,總結(jié)算法實現(xiàn)的關鍵步驟。4.3.1網(wǎng)絡數(shù)據(jù)處理已知給定網(wǎng)絡G,共有n個節(jié)點,m個連接,則其可用鄰接矩陣Ann表示,如果兩個節(jié)點iv和jv之間有邊連接,則對應鄰接矩陣A(i,j)1,否則,A(i,j)0。鄰接矩陣A的每一列都記錄著相應節(jié)點與其他節(jié)點之間的關系,比如,鄰接矩陣A中第i列向量Ai表示:第i個節(jié)點vi與其他所有節(jié)點是否有聯(lián)系。很好的刻畫了iv這個節(jié)點的與其他節(jié)點的直接關系,但對于距離超過一個連接的節(jié)點數(shù)據(jù)來說,用鄰接矩陣A就不能描述它們之間的聯(lián)系了。如果單純的用鄰接矩陣來刻畫數(shù)據(jù)的結(jié)構,對于有直接連線數(shù)據(jù)對來說是很準確的,但是如果想要刻畫整體數(shù)據(jù)的結(jié)構,還需要進一步的進行轉(zhuǎn)換;谝呀(jīng)獲得的網(wǎng)絡數(shù)據(jù)的鄰接矩陣,計算節(jié)點間的測地線距離。測地線距離是表示兩個節(jié)點間的最短路徑,因為這里我們用的是不加權的網(wǎng)絡,所以,測地線距離就是兩個節(jié)點間的最短路徑上的連接數(shù)。目前有許多快速計算測地線距離的算法[23],能高效地進行計算。用矩陣Pnn表示我們計算得到的測地線距離矩陣,對于矩陣P的第i列
本文編號:3298321
【文章來源】:安徽大學安徽省 211工程院校
【文章頁數(shù)】:72 頁
【學位級別】:碩士
【部分圖文】:
LRR算法自動糾正數(shù)據(jù)中錯誤的能力驗證Fig2.2TheabilityofLRRalgorithmtoautomaticallycorrecterrorsindata
安徽大學碩士學位論文37第五,驗證參數(shù)設置對算法性能的影響。MVSS用參數(shù)和平衡數(shù)據(jù)表示矩陣和相似性矩陣。我們測試隨著兩個參數(shù)的變化,用S和Z*構建的兩個圖的聚類性能。為了方便起見,我們隨機的選取了在數(shù)據(jù)集Handwrittennumerals(HW)上實驗,近鄰數(shù)k根據(jù)之前做實驗的經(jīng)驗設置為6,參數(shù)和設置的范圍為{0.1,5,10,20,50}。在圖3.3,(a)和(b)展示了用圖G1聚類,其評價指標ACC和NMI的隨著參數(shù)變化而變化的情況,(c)和(d)展示了用圖G2聚類,其評價指標ACC和NMI的變化情況。從圖(a)和(b)中可以看出,當用圖G1且參數(shù)=0.1時,評價指標值相對較低,除此之外,當參數(shù)設置在一個較大的范圍變化時,實驗結(jié)果都非常穩(wěn)定。將(a)(b)和(c)(d)相比較,圖(a)(b)對參數(shù)更加敏感,這也證明了我們算法中使用數(shù)據(jù)表示矩陣和相似性矩陣構建的圖更加魯棒,對于高維數(shù)據(jù)中潛在的低維數(shù)據(jù)結(jié)構學習的效果更好。圖3.3MVSC算法參數(shù)的變化對聚類結(jié)果的影響Fig3.3TheinfluenceofMVSCalgorithmparametersonclusteringresults
第四章基于魯棒子空間表示的社區(qū)檢測40高的節(jié)點更傾向于聚類到同一個社區(qū)中;第二步,用S作為數(shù)據(jù)輸入,應用于子空間表示的相關聚類模型中,學習網(wǎng)絡的低維數(shù)據(jù)結(jié)構,像SSCF[48]和LRSCD[49]算法就是分別學習數(shù)據(jù)的稀疏和低秩表示;第三步,將子空間表示矩陣和鄰接矩陣A融合,再聚類劃分出網(wǎng)絡中的社區(qū)。圖4.1基于子空間聚類的社區(qū)檢測算法概述Fig4.1Anoverviewofcommunitydetectionalgorithmbasedonsubspaceclustering4.3算法實現(xiàn)這部分將介紹我們提出的算法的具體實現(xiàn),首先是對原始網(wǎng)絡數(shù)據(jù)的處理,接著,將網(wǎng)絡社區(qū)數(shù)據(jù)表示應用到自加權的魯棒子空間表示算法中,學習數(shù)據(jù)的低維子空間表示,最后,總結(jié)算法實現(xiàn)的關鍵步驟。4.3.1網(wǎng)絡數(shù)據(jù)處理已知給定網(wǎng)絡G,共有n個節(jié)點,m個連接,則其可用鄰接矩陣Ann表示,如果兩個節(jié)點iv和jv之間有邊連接,則對應鄰接矩陣A(i,j)1,否則,A(i,j)0。鄰接矩陣A的每一列都記錄著相應節(jié)點與其他節(jié)點之間的關系,比如,鄰接矩陣A中第i列向量Ai表示:第i個節(jié)點vi與其他所有節(jié)點是否有聯(lián)系。很好的刻畫了iv這個節(jié)點的與其他節(jié)點的直接關系,但對于距離超過一個連接的節(jié)點數(shù)據(jù)來說,用鄰接矩陣A就不能描述它們之間的聯(lián)系了。如果單純的用鄰接矩陣來刻畫數(shù)據(jù)的結(jié)構,對于有直接連線數(shù)據(jù)對來說是很準確的,但是如果想要刻畫整體數(shù)據(jù)的結(jié)構,還需要進一步的進行轉(zhuǎn)換;谝呀(jīng)獲得的網(wǎng)絡數(shù)據(jù)的鄰接矩陣,計算節(jié)點間的測地線距離。測地線距離是表示兩個節(jié)點間的最短路徑,因為這里我們用的是不加權的網(wǎng)絡,所以,測地線距離就是兩個節(jié)點間的最短路徑上的連接數(shù)。目前有許多快速計算測地線距離的算法[23],能高效地進行計算。用矩陣Pnn表示我們計算得到的測地線距離矩陣,對于矩陣P的第i列
本文編號:3298321
本文鏈接:http://sikaile.net/kejilunwen/shengwushengchang/3298321.html
最近更新
教材專著