基于圖模型的高效聚類(lèi)算法研究
本文關(guān)鍵詞:基于圖模型的高效聚類(lèi)算法研究,由筆耕文化傳播整理發(fā)布。
【摘要】:近年來(lái),隨著社會(huì)網(wǎng)絡(luò)、通信網(wǎng)絡(luò)、生物網(wǎng)絡(luò)等在各領(lǐng)域應(yīng)用的快速發(fā)展,其產(chǎn)生的圖模型數(shù)據(jù)更是呈現(xiàn)出快速增長(zhǎng)的態(tài)勢(shì)。圖作為一種數(shù)據(jù)結(jié)構(gòu)具有本身其特有的表示方法和信息,一個(gè)圖模型可能包含幾百到幾百萬(wàn)的頂點(diǎn),而這些頂點(diǎn)及其連接的邊構(gòu)成的關(guān)聯(lián)信息在不同領(lǐng)域中都具有不同的意義,隨著數(shù)據(jù)規(guī)模的不斷增長(zhǎng),如何有效的對(duì)這些信息進(jìn)行綜合分析并從中獲取有用的信息進(jìn)行應(yīng)用,是非常必要的,也是本文研究的主要的方向。聚類(lèi)分析作為機(jī)器學(xué)習(xí)的一個(gè)重要工具目前已經(jīng)被廣泛應(yīng)用于文本挖掘、生物信息學(xué)、模式識(shí)別等領(lǐng)域的科學(xué)研究,隨著圖模型數(shù)據(jù)的廣泛應(yīng)用,圖聚類(lèi)也成為了一類(lèi)較為重要的聚類(lèi)分析方法,圖聚類(lèi)是圖數(shù)據(jù)分析的有效技術(shù)之一。在構(gòu)造節(jié)點(diǎn)的相似矩陣時(shí)經(jīng)常采用距離作為評(píng)價(jià)標(biāo)準(zhǔn),而節(jié)點(diǎn)間存在多條等長(zhǎng)路徑及k短路徑,這些路徑間的關(guān)系都會(huì)對(duì)節(jié)點(diǎn)間相似性產(chǎn)生影響,因此綜合考慮節(jié)點(diǎn)間的距離關(guān)系有助于更好的衡量節(jié)點(diǎn)間的相似性。針對(duì)這一問(wèn)題,本文提出一個(gè)基于前k短路徑的圖聚類(lèi)算法(DRGC),該算法參照譜聚類(lèi)算法的思想,使用前k短路徑模型構(gòu)造相似矩陣,利用多層自動(dòng)編碼器代替譜聚類(lèi)算法中的特征分解實(shí)現(xiàn)對(duì)數(shù)據(jù)的重構(gòu),并且可以大大減少特征分解所用時(shí)間,最后利用非參數(shù)貝葉斯模型進(jìn)行聚類(lèi),因狄利克雷過(guò)程具有很好的聚類(lèi)性質(zhì)并且可以實(shí)現(xiàn)對(duì)數(shù)據(jù)的自動(dòng)劃分,因此該算法可以在不預(yù)先指定聚類(lèi)數(shù)目的情況下得到數(shù)據(jù)集的正確合理劃分。為了克服單一聚類(lèi)算法對(duì)數(shù)據(jù)集敏感的問(wèn)題,本文提出了一個(gè)基于多數(shù)投票的聚類(lèi)集成算法,該算法利用前k短路徑的圖聚類(lèi)算法、k均值算法、譜聚類(lèi)算法作為基聚類(lèi)算法,以模塊度最高的一組聚類(lèi)結(jié)果的標(biāo)簽作為基準(zhǔn)標(biāo)簽,,分析與其他聚類(lèi)結(jié)果的標(biāo)簽之間的關(guān)系,并通過(guò)計(jì)算對(duì)其進(jìn)行統(tǒng)一,最后通過(guò)投票計(jì)算出數(shù)據(jù)集最終的聚類(lèi)劃分結(jié)果。最后,本文對(duì)所提出的兩個(gè)算法進(jìn)行了仿真實(shí)驗(yàn),實(shí)驗(yàn)證明,本文所提出的算法具有良好的聚類(lèi)性質(zhì),可以得到較為準(zhǔn)確的聚類(lèi)劃分結(jié)果。
【關(guān)鍵詞】:圖聚類(lèi) k最短路徑 聚類(lèi)集成
【學(xué)位授予單位】:北京交通大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2016
【分類(lèi)號(hào)】:O157.5;TP311.13
【目錄】:
- 致謝5-6
- 摘要6-7
- ABSTRACT7-11
- 1 引言11-14
- 1.1 研究背景及意義11-12
- 1.2 本文研究的主要內(nèi)容12-13
- 1.3 論文的組織安排13-14
- 2 圖聚類(lèi)研究理論基礎(chǔ)14-25
- 2.1 圖聚類(lèi)研究概述14-20
- 2.1.1 圖模型相關(guān)概念14-15
- 2.1.2 圖聚類(lèi)主要方法概述15-20
- 2.2 聚類(lèi)集成20-24
- 2.2.1 聚類(lèi)集成基本概念20-21
- 2.2.2 聚類(lèi)成員的構(gòu)造21-22
- 2.2.3 合并策略22-24
- 2.3 本章小結(jié)24-25
- 3 基于前k短路徑的圖聚類(lèi)算法25-45
- 3.1 問(wèn)題提出25
- 3.2 前K短路徑的圖聚類(lèi)算法25-33
- 3.2.1 相似矩陣構(gòu)造25-27
- 3.2.2 數(shù)據(jù)重構(gòu)表達(dá)27-29
- 3.2.3 聚類(lèi)階段29-31
- 3.2.4 算法流程31-33
- 3.3 算法仿真及結(jié)果分析33-44
- 3.3.1 實(shí)驗(yàn)數(shù)據(jù)集33-34
- 3.3.2 實(shí)驗(yàn)評(píng)價(jià)標(biāo)準(zhǔn)34-35
- 3.3.3 實(shí)驗(yàn)結(jié)果分析35-44
- 3.4 本章小結(jié)44-45
- 4 基于多數(shù)投票的圖聚類(lèi)集成算法45-57
- 4.1 問(wèn)題提出45
- 4.2 算法設(shè)計(jì)與分析45-51
- 4.2.1 標(biāo)簽統(tǒng)一策略45-47
- 4.2.2 合并策略47-48
- 4.2.3 算法流程48-51
- 4.3 算法仿真及結(jié)果分析51-55
- 4.4 本章小結(jié)55-57
- 5 結(jié)論與展望57-59
- 5.1 本文總結(jié)57
- 5.2 未來(lái)展望57-59
- 參考文獻(xiàn)59-63
- 作者簡(jiǎn)歷及攻讀碩士學(xué)位期間取得的研究成果63-65
- 學(xué)位論文數(shù)據(jù)集65
【相似文獻(xiàn)】
中國(guó)期刊全文數(shù)據(jù)庫(kù) 前10條
1 田彥山;;基于山峰聚類(lèi)的聚類(lèi)上限確定方法[J];江西師范大學(xué)學(xué)報(bào)(自然科學(xué)版);2007年02期
2 趙超;舒紅;朱欣焰;戴上平;;氣象數(shù)據(jù)概化中的最佳聚類(lèi)數(shù)研究[J];華中師范大學(xué)學(xué)報(bào)(自然科學(xué)版);2008年03期
3 高翠芳;吳小俊;;復(fù)雜生物數(shù)據(jù)集的聚類(lèi)數(shù)自動(dòng)確定方法[J];生物信息學(xué);2010年04期
4 謝娟英;馬箐;謝維信;;一種確定最佳聚類(lèi)數(shù)的新算法[J];陜西師范大學(xué)學(xué)報(bào)(自然科學(xué)版);2012年01期
5 王凌峰;;基于構(gòu)成要素的聚類(lèi)算法[J];統(tǒng)計(jì)與決策;2007年19期
6 程慈;柴瑞敏;;聚類(lèi)數(shù)的自動(dòng)確定[J];科技信息(科學(xué)教研);2008年14期
7 方世良;一個(gè)聚類(lèi)數(shù)動(dòng)態(tài)可調(diào)的水聲信號(hào)聚類(lèi)算法[J];聲學(xué)學(xué)報(bào);1996年S1期
8 李闖;端木京順;蔡忠義;高建國(guó);;基于判斷矩陣的專(zhuān)家模糊核聚類(lèi)組合賦權(quán)方法[J];控制與決策;2012年09期
9 田娟,王崇駿,李靜,陳兆乾;一個(gè)基于譜圖分割的簡(jiǎn)單聚類(lèi)算法[J];復(fù)旦學(xué)報(bào)(自然科學(xué)版);2004年05期
10 張李軍;;改進(jìn)的FCM聚類(lèi)算法的實(shí)現(xiàn)和有效性研究[J];硅谷;2009年10期
中國(guó)重要會(huì)議論文全文數(shù)據(jù)庫(kù) 前9條
1 高翠芳;吳小俊;;基于二階差分的聚類(lèi)數(shù)自動(dòng)確定方法[A];江蘇省系統(tǒng)工程學(xué)會(huì)第十一屆學(xué)術(shù)年會(huì)論文集[C];2009年
2 劉洋;江志綱;丁增喜;王大玲;鮑玉斌;于戈;;一種基于圖的聚類(lèi)算法GB-Cluster[A];第十九屆全國(guó)數(shù)據(jù)庫(kù)學(xué)術(shù)會(huì)議論文集(技術(shù)報(bào)告篇)[C];2002年
3 李浪波;傅彥;劉紅;;基于范例推理的網(wǎng)格和密度聚類(lèi)算法[A];第二十二屆中國(guó)數(shù)據(jù)庫(kù)學(xué)術(shù)會(huì)議論文集(技術(shù)報(bào)告篇)[C];2005年
4 婁冬梅;陳明;朱有娜;;一種基于密度的無(wú)參數(shù)聚類(lèi)算法[A];第二十三屆中國(guó)數(shù)據(jù)庫(kù)學(xué)術(shù)會(huì)議論文集(研究報(bào)告篇)[C];2006年
5 魏昕路;洪志令;姜青山;;一種基于樣本縮減策略的新窗口式聚類(lèi)算法[A];第二十四屆中國(guó)數(shù)據(jù)庫(kù)學(xué)術(shù)會(huì)議論文集(研究報(bào)告篇)[C];2007年
6 程尊平;周鼎;王晨;周皓峰;汪衛(wèi);施伯樂(lè);;SDPHC——基于密度的分割和分層的自校聚類(lèi)算法[A];第二十一屆中國(guó)數(shù)據(jù)庫(kù)學(xué)術(shù)會(huì)議論文集(研究報(bào)告篇)[C];2004年
7 張曉峰;王麗珍;陸葉;;一種基于屬性加權(quán)的不確定K-means聚類(lèi)算法[A];第26屆中國(guó)數(shù)據(jù)庫(kù)學(xué)術(shù)會(huì)議論文集(B輯)[C];2009年
8 蔡軍;袁華鵬;陳金海;施伯樂(lè);;一種基于相似性分析的聚類(lèi)新算法:PDS算法[A];第十八屆全國(guó)數(shù)據(jù)庫(kù)學(xué)術(shù)會(huì)議論文集(研究報(bào)告篇)[C];2001年
9 胡仲義;郭超;王永炎;劉勝航;王宏安;;基于時(shí)間衰減和特征變量的數(shù)據(jù)流聚類(lèi)算法[A];第29屆中國(guó)數(shù)據(jù)庫(kù)學(xué)術(shù)會(huì)議論文集(B輯)(NDBC2012)[C];2012年
中國(guó)博士學(xué)位論文全文數(shù)據(jù)庫(kù) 前10條
1 胡雅婷;可能性聚類(lèi)方法研究及應(yīng)用[D];吉林大學(xué);2012年
2 王縱虎;聚類(lèi)分析優(yōu)化關(guān)鍵技術(shù)研究[D];西安電子科技大學(xué);2012年
3 周世兵;聚類(lèi)分析中的最佳聚類(lèi)數(shù)確定方法研究及應(yīng)用[D];江南大學(xué);2011年
4 楊燕;基于計(jì)算智能的聚類(lèi)組合算法研究[D];西南交通大學(xué);2006年
5 馮永;基于計(jì)算智能的聚類(lèi)技術(shù)及其應(yīng)用研究[D];重慶大學(xué);2006年
6 劉晨;高伸縮性聚類(lèi)分析方法研究[D];哈爾濱工程大學(xué);2013年
7 王強(qiáng);局部疊加基因表達(dá)模式聚類(lèi)分析方法研究[D];哈爾濱工業(yè)大學(xué);2012年
8 姜磊;混合演化聚類(lèi)算法研究及其應(yīng)用[D];武漢大學(xué);2012年
9 尹學(xué)松;半監(jiān)督聚類(lèi)分析策略設(shè)計(jì)及其拓展性研究[D];南京航空航天大學(xué);2009年
10 白亮;聚類(lèi)學(xué)習(xí)的理論分析與高效算法研究[D];山西大學(xué);2012年
中國(guó)碩士學(xué)位論文全文數(shù)據(jù)庫(kù) 前10條
1 魏建東;K-means初始化算法研究[D];南京理工大學(xué);2015年
2 張依;基于MapReduce的k-means聚類(lèi)算法并行化研究[D];中央民族大學(xué);2015年
3 劉嬋;蟻群與K均值聚類(lèi)算法融合研究及其在用戶(hù)分群中的應(yīng)用[D];西南科技大學(xué);2015年
4 朱琪;基于減法聚類(lèi)的混合算法研究[D];湖南科技大學(xué);2015年
5 韓偉森;聚類(lèi)集成研究與應(yīng)用[D];貴州大學(xué);2015年
6 譚浩;K-Means算法改進(jìn)及其在森林健康評(píng)價(jià)中的應(yīng)用[D];中南林業(yè)科技大學(xué);2015年
7 嚴(yán)巍;以KPCA為核心的FCM算法改進(jìn)[D];成都理工大學(xué);2015年
8 汪娟;基于權(quán)重設(shè)計(jì)的聚類(lèi)集成算法研究[D];重慶大學(xué);2015年
9 牛品菽;基于圖模型的高效聚類(lèi)算法研究[D];北京交通大學(xué);2016年
10 喬坤;基于系統(tǒng)能量理論的聚類(lèi)算法及其應(yīng)用研究[D];西安建筑科技大學(xué);2007年
本文關(guān)鍵詞:基于圖模型的高效聚類(lèi)算法研究,,由筆耕文化傳播整理發(fā)布。
本文編號(hào):363430
本文鏈接:http://sikaile.net/kejilunwen/yysx/363430.html