天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

基于最大化模塊度的聯(lián)合聚類(lèi)算法研究

發(fā)布時(shí)間:2022-02-13 21:22
  聯(lián)合聚類(lèi)的目標(biāo)是對(duì)二維列聯(lián)表產(chǎn)生有意義的劃分,可以根據(jù)行列間的對(duì)偶性同時(shí)對(duì)列聯(lián)表的行和列進(jìn)行分組。與傳統(tǒng)的單向聚類(lèi)相比,聯(lián)合聚類(lèi)可以有效識(shí)別子空間并揭示行列之間的隱含關(guān)系,已成為解決高維稀疏數(shù)據(jù)聚類(lèi)問(wèn)題的最重要方法之一。隨著數(shù)據(jù)科學(xué)的飛速發(fā)展,數(shù)據(jù)集形式越來(lái)越豐富,傳統(tǒng)的聯(lián)合聚類(lèi)方法在處理如重疊數(shù)據(jù)、高階異構(gòu)數(shù)據(jù)時(shí)有局限性,如何更好地聯(lián)合聚類(lèi)此類(lèi)數(shù)據(jù)成為具有意義的研究問(wèn)題。模塊度是一種常用的衡量社區(qū)劃分質(zhì)量的標(biāo)準(zhǔn),同時(shí)也是圖聚類(lèi)方法中常見(jiàn)的質(zhì)量評(píng)價(jià)標(biāo)準(zhǔn)。通過(guò)對(duì)現(xiàn)有聯(lián)合聚類(lèi)及模塊度相關(guān)工作的總結(jié)分析,主要在基于模塊度的可重疊聯(lián)合聚類(lèi)和分層高階聯(lián)合聚類(lèi)兩個(gè)方面展開(kāi)了深入的研究,并取得了如下研究成果:第一,針對(duì)傳統(tǒng)的聯(lián)合聚類(lèi)方法無(wú)法挖掘重疊數(shù)據(jù)以及離群點(diǎn)等局限,提出一種最大化模塊度的可重疊聯(lián)合聚類(lèi)方法。該方法允許行、列簇中的數(shù)據(jù)重疊,并能識(shí)別數(shù)據(jù)中的離群點(diǎn)。首先設(shè)計(jì)統(tǒng)一框架,在基于模塊度的目標(biāo)函數(shù)中加入使數(shù)據(jù)可重疊與非窮盡的約束,其中控制重疊程度和非窮盡程度的參數(shù)非常易于理解;然后通過(guò)迭代的行列交替優(yōu)化過(guò)程使目標(biāo)函數(shù)中的模塊度最大化,高效地獲得可重疊且非窮盡的聯(lián)合聚類(lèi)結(jié)果。第二,傳統(tǒng)聯(lián)合聚類(lèi)... 

【文章來(lái)源】:西北師范大學(xué)甘肅省

【文章頁(yè)數(shù)】:46 頁(yè)

【學(xué)位級(jí)別】:碩士

【部分圖文】:

基于最大化模塊度的聯(lián)合聚類(lèi)算法研究


星狀高階異構(gòu)數(shù)據(jù)

流程圖,示例,聚類(lèi),算法


s)(s=1,2,…,N)的聚類(lèi)結(jié)果的集合(s)C(s=1,2,…,N)。樣本集合O的分裂聚類(lèi)結(jié)果集合R={R1,R2,…,Rh,…RH},其中第h次分裂聚類(lèi)結(jié)果為包含h個(gè)樣本簇的集合Rh={rh1,rh2…,rhh};特征空間F(s)的分裂聚類(lèi)結(jié)果集合(s)()()()()12,,,,sssshHCCCCC,其中第h次分裂聚類(lèi)結(jié)果為包含h個(gè)樣本簇的集合()()()()12,,,sssshhhhhCccc。在第h次分裂聚類(lèi)結(jié)果中,樣本簇rhl與第s個(gè)特征空間中相同簇號(hào)的特征簇()hlsc構(gòu)成的聯(lián)合簇記作(s)hlrc;rhl在每個(gè)特征空間中聯(lián)合簇的集合記作(1)(2)(){,,,}hlhlNlhhlRCrcrcrc。圖4-1MHHCC算法流程示例具體的,MHHCC算法使用局部分裂算法(MCC)分別獲得第h次聚類(lèi)結(jié)果中的h個(gè)聯(lián)合簇集合(1)(2)(),,,NhlhllhhlRrcrccCr(l=1,2,…,h)的最優(yōu)劃分并分別計(jì)算獲得的模塊度增長(zhǎng)值ΔQ(Ahl,Chl)(l=1,2,…,h),對(duì)獲得最大模塊度增長(zhǎng)值ΔQ(Ahl*,Chl*)的聯(lián)合簇集合RChl*中的聯(lián)合簇()*shlrc按照最優(yōu)劃分方式真實(shí)地劃分產(chǎn)生第h+1次聚類(lèi)結(jié)果。如此循環(huán)迭代直到達(dá)到指定的簇?cái)?shù)或所有聯(lián)合簇集合被劃分都無(wú)法使模塊度增長(zhǎng)為止。以圖4-1為例描述算法的執(zhí)行過(guò)程。圖4-1示例中的數(shù)據(jù)包含由中心數(shù)據(jù)和三種特征數(shù)據(jù)構(gòu)成的三個(gè)特征空間,MHHCC將樣本集合作為第一層樣本聚類(lèi)結(jié)果R1中唯一的簇r11,并將每個(gè)特征空間中的特征集合作為該特征空間的第一層特征聚類(lèi)結(jié)果()1sC中唯一的簇()11sc,使用MCC處理(1)(2)(3)11111111rc,rc,cRCr,即在三個(gè)特征空間中將聯(lián)合簇()11src(s=1,2,3)劃分生為兩個(gè)子聯(lián)合簇,該劃分使模塊度增長(zhǎng)值ΔQ(A11,C11)最大,生成第二層樣本聚類(lèi)結(jié)果R2={r21,r22}和第二層特征聚類(lèi)結(jié)果()()()22122,sssCcc(s=1,2,3)。在分裂為第三次聯(lián)合聚類(lèi)結(jié)果R3和()3sC(s=1,2,3)時(shí),


本文編號(hào):3623940

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/shoufeilunwen/xixikjs/3623940.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶45101***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com