天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

具有共享近鄰的聚類技術(shù)

發(fā)布時(shí)間:2021-03-19 07:11
  譜聚類目前已經(jīng)成為聚類的主要方法之一,但傳統(tǒng)譜聚類算法的相似度量方法不能很好地揭示未能完全分離的數(shù)據(jù)集的真正聚類,而基于共享近鄰緊密度的譜聚類算法能夠有效地改善該問題,提升聚類質(zhì)量。故本文主要對基于共享近鄰緊密度的譜聚類算法進(jìn)行了研究,具體工作內(nèi)容如下所述:(1)針對因基于共享近鄰緊密度的譜聚類算法的計(jì)算時(shí)間復(fù)雜度和空間復(fù)雜度較高,當(dāng)處理大規(guī)模和高維數(shù)據(jù)時(shí),其時(shí)間開銷較大,代價(jià)太昂貴,算法有可能會因?yàn)橄到y(tǒng)內(nèi)存不足的原因而失效等原因,提出了一種它的增量版本來改進(jìn)聚類的性能。該算法的思想是先將數(shù)據(jù)集分解為若干子集,然后以增量的方式在每個(gè)子集上運(yùn)行,從而保證其具有良好的聚類性能。通過對人工數(shù)據(jù)集和仿真數(shù)據(jù)集進(jìn)行大量的實(shí)驗(yàn)驗(yàn)證了本文的譜聚類算法的有效性。同時(shí),該算法的時(shí)間消耗低,聚類精度高,且能夠有效的對不斷增加的數(shù)據(jù)集進(jìn)行聚類。(2)針對由于傳統(tǒng)的拉普拉斯矩陣通常會受噪音干擾或者來自于底層分布的有些偏頗的樣本,致使計(jì)算出的指示向量不同于真實(shí)的向量值,故在本文算法中特征向量由拉普拉斯矩陣和分區(qū)級副信息算得;此外,將高斯核模糊聚類加入到基于共享近鄰緊密度的約束譜聚類算法中,可以使其具有核函數(shù)和模... 

【文章來源】:江南大學(xué)江蘇省 211工程院校 教育部直屬院校

【文章頁數(shù)】:63 頁

【學(xué)位級別】:碩士

【部分圖文】:

具有共享近鄰的聚類技術(shù)


聚類形象化描述

流程圖,聚類,流程,樣本


第二章聚類算法的相關(guān)理論5第二章聚類算法的相關(guān)理論2.1聚類基礎(chǔ)理論2.1.1聚類概念及相關(guān)定義聚類是根據(jù)所研究的樣本之間存在的程度不同的相似性將這些樣本劃分為不同的簇。通過不斷將一些相似度比較高的樣本聚為一簇,來把所有的樣本聚合完畢,使其滿足簇內(nèi)差異盡可能地小,簇間差異盡可能大的特性,也就是人們常說的“物以類聚”。下面給出聚類的簡單圖像描述:圖2-1聚類形象化描述聚類主要包括四步:1)特征選擇和抽取2)聚類方法的設(shè)計(jì)及選擇3)聚類驗(yàn)證4)結(jié)果解釋其流程圖如下所示:圖2-2聚類流程

歐式距離


江南大學(xué)碩士學(xué)位論文62.1.2聚類算法中的距離度量距離是構(gòu)建聚類算法的基礎(chǔ),通常被用于估算樣本點(diǎn)之間的相異度。給定樣本12{,,,}nXxxx,dist(,ijxx)表示第i個(gè)樣本和第j個(gè)樣本之間的距離。以下是常用的距離度量:1.歐式距離(Euclideandistance)歐式距離源自于歐氏空間中兩點(diǎn)間的距離公式,就是計(jì)算兩點(diǎn)間的直線距離。傳統(tǒng)的聚類方法通常是為歐氏空間中的假設(shè)分布而設(shè)計(jì)的。圖2-3兩點(diǎn)間的歐式距離(1)二維平面上點(diǎn)A(,iixy)和點(diǎn)B(,jjxy)之間的歐式距離公式為:22(,)()()ijijdistABxxyy(2.1)(2)高維空間中點(diǎn)A(12,,,iiinxxx)和點(diǎn)B(12,,,jjjnxxx)之間的歐式距離公式為:222112221(,)()()()()ijijinjnnikjkkdistABxxxxxxxx(2.2)2.標(biāo)準(zhǔn)歐式距離(StandardizedEuclideandistance)標(biāo)準(zhǔn)歐式距離是針對簡單歐式距離的缺點(diǎn)而提出的一種改進(jìn)方法,高維空間中點(diǎn)A(12,,,iiinxxx)和點(diǎn)B(12,,,jjjnxxx)之間的標(biāo)準(zhǔn)歐式距離公式為:21()(,)nikjkkkxxdistABs(2.3)其中s為標(biāo)準(zhǔn)差。3.曼哈頓距離(Manhattandistance)曼哈頓距離是計(jì)算從起點(diǎn)到終點(diǎn)之間實(shí)際經(jīng)過的距離,可以形象的稱之為城市街區(qū)距離(CityBlockdistance)。(1)二維平面上點(diǎn)A(,iixy)和點(diǎn)B(,jjxy)之間的歐式距離公式為:(,)+ijijdistABxxyy(2.4)(2)高維空間中點(diǎn)A(12,,,iiinxxx)和點(diǎn)B(12,,,jjjnxxx)之間的歐式距離公式為:

【參考文獻(xiàn)】:
期刊論文
[1]域間F-范數(shù)正則化遷移譜聚類方法[J]. 魏彩娜,錢鵬江,奚臣.  計(jì)算機(jī)科學(xué)與探索. 2018(03)
[2]隱子空間聚類算法的改進(jìn)及其增量式算法[J]. 董琪,王士同.  計(jì)算機(jī)科學(xué)與探索. 2017(05)
[3]基于用戶譜聚類的Top-N協(xié)同過濾推薦算法[J]. 肖文強(qiáng),姚世軍,吳善明.  計(jì)算機(jī)工程與應(yīng)用. 2018(07)
[4]適合大規(guī)模數(shù)據(jù)集的增量式模糊聚類算法[J]. 李滔,王士同.  智能系統(tǒng)學(xué)報(bào). 2016(02)
[5]一種基于增量式譜聚類的動(dòng)態(tài)社區(qū)自適應(yīng)發(fā)現(xiàn)算法[J]. 蔣盛益,楊博泓,王連喜.  自動(dòng)化學(xué)報(bào). 2015(12)
[6]密度敏感的譜聚類[J]. 王玲,薄列峰,焦李成.  電子學(xué)報(bào). 2007(08)



本文編號:3089186

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/shengwushengchang/3089186.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶06088***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請E-mail郵箱bigeng88@qq.com