密度峰值優(yōu)化初始中心的K-medoids聚類(lèi)算法
發(fā)布時(shí)間:2017-07-01 09:06
本文關(guān)鍵詞:密度峰值優(yōu)化初始中心的K-medoids聚類(lèi)算法,,由筆耕文化傳播整理發(fā)布。
【摘要】:針對(duì)快速K-medoids聚類(lèi)算法和方差優(yōu)化初始中心的K-medoids聚類(lèi)算法存在需要人為給定類(lèi)簇?cái)?shù),初始聚類(lèi)中心可能位于同一類(lèi)簇,或無(wú)法完全確定數(shù)據(jù)集初始類(lèi)簇中心等缺陷,受密度峰值聚類(lèi)算法啟發(fā),提出了兩種自適應(yīng)確定類(lèi)簇?cái)?shù)的K-medoids算法。算法采用樣本x i的t最近鄰距離之和倒數(shù)度量其局部密度ρi,并定義樣本x i的新距離δi,構(gòu)造樣本距離相對(duì)于樣本密度的決策圖。局部密度較高且相距較遠(yuǎn)的樣本位于決策圖的右上角區(qū)域,且遠(yuǎn)離數(shù)據(jù)集的大部分樣本。選擇這些樣本作為初始聚類(lèi)中心,使得初始聚類(lèi)中心位于不同類(lèi)簇,并自動(dòng)得到數(shù)據(jù)集類(lèi)簇?cái)?shù)。為進(jìn)一步優(yōu)化聚類(lèi)結(jié)果,提出采用類(lèi)內(nèi)距離與類(lèi)間距離之比作為聚類(lèi)準(zhǔn)則函數(shù)。在UCI數(shù)據(jù)集和人工模擬數(shù)據(jù)集上進(jìn)行了實(shí)驗(yàn)測(cè)試,并對(duì)初始聚類(lèi)中心、迭代次數(shù)、聚類(lèi)時(shí)間、Rand指數(shù)、Jaccard系數(shù)、Adjusted Rand index和聚類(lèi)準(zhǔn)確率等經(jīng)典聚類(lèi)有效性評(píng)價(jià)指標(biāo)進(jìn)行了比較,結(jié)果表明提出的K-medoids算法能有效識(shí)別數(shù)據(jù)集的真實(shí)類(lèi)簇?cái)?shù)和合理初始類(lèi)簇中心,減少聚類(lèi)迭代次數(shù),縮短聚類(lèi)時(shí)間,提高聚類(lèi)準(zhǔn)確率,并對(duì)噪音數(shù)據(jù)具有很好的魯棒性。
【作者單位】: 陜西師范大學(xué)計(jì)算機(jī)科學(xué)學(xué)院;
【關(guān)鍵詞】: 聚類(lèi) K-medoids算法 初始聚類(lèi)中心 密度峰值 準(zhǔn)則函數(shù)
【基金】:國(guó)家自然科學(xué)基金No.31372250 陜西省科技攻關(guān)項(xiàng)目No.2013K12-03-24 中央高;究蒲袠I(yè)務(wù)費(fèi)專(zhuān)項(xiàng)資金No.GK201503067~~
【分類(lèi)號(hào)】:TP311.13
【正文快照】: K-medoids Clustering Algorithms with Optimized Initial Seeds by Density PeaksXIE Juanying+,QU YananSchool of Computer Science,Shaanxi Normal University,Xi’an 710062,ChinaXIE Juanying,QU Yanan.K-medoids clustering algorithms with optimized initial seeds
【相似文獻(xiàn)】
中國(guó)期刊全文數(shù)據(jù)庫(kù) 前3條
1 馬箐;謝娟英;;基于粒計(jì)算的K-medoids聚類(lèi)算法[J];計(jì)算機(jī)應(yīng)用;2012年07期
2 王忠強(qiáng);李貴;韓子揚(yáng);鄭新錄;;基于K-medoids聚類(lèi)算法的研究與實(shí)現(xiàn)[J];硅谷;2011年02期
3 ;[J];;年期
本文關(guān)鍵詞:密度峰值優(yōu)化初始中心的K-medoids聚類(lèi)算法,由筆耕文化傳播整理發(fā)布。
本文編號(hào):505291
本文鏈接:http://sikaile.net/kejilunwen/ruanjiangongchenglunwen/505291.html
最近更新
教材專(zhuān)著