快速搜索與發(fā)現(xiàn)密度峰值聚類算法的優(yōu)化研究
發(fā)布時(shí)間:2017-09-28 05:38
本文關(guān)鍵詞:快速搜索與發(fā)現(xiàn)密度峰值聚類算法的優(yōu)化研究
更多相關(guān)文章: 聚類 密度峰值 近鄰距離曲線 類合并
【摘要】:CFSFDP是基于密度的新聚類算法,可聚類非球形數(shù)據(jù)集,具有聚類速度快、實(shí)現(xiàn)簡單等優(yōu)點(diǎn)。CFSFDP需人工嘗試確定密度閾值dc,且對(duì)一個(gè)類中存在多密度峰值的數(shù)據(jù)無法進(jìn)行準(zhǔn)確聚類。為解決該缺點(diǎn),提出基于近鄰距離曲線和類合并優(yōu)化CFSFDP(簡稱NM-CFSFDP)的聚類算法。算法用近鄰距離曲線變化情況自動(dòng)確定密度閾值dc,采用確定dc的CFSFDP對(duì)數(shù)據(jù)聚類,并利用計(jì)算dc值的方法指導(dǎo)類的合并,引入內(nèi)聚程度衡量參數(shù)解決了類合并后不能撤銷的難題,從而實(shí)現(xiàn)對(duì)多密度峰值數(shù)據(jù)的正確聚類。通過實(shí)驗(yàn)對(duì)比,NM-CFSFDP算法確實(shí)比CFSFDP算法具有更加精確的聚類效果。
【作者單位】: 中國礦業(yè)大學(xué)計(jì)算機(jī)科學(xué)與技術(shù)學(xué)院;常熟理工學(xué)院計(jì)算機(jī)科學(xué)與工程學(xué)院;重慶大學(xué)計(jì)算機(jī)科學(xué)與技術(shù)學(xué)院;
【關(guān)鍵詞】: 聚類 密度峰值 近鄰距離曲線 類合并
【基金】:國家自然科學(xué)基金資助項(xiàng)目(61173130)
【分類號(hào)】:TP311.13
【正文快照】: 0引言聚類分析(cluster analysis)簡稱聚類(clustering),是一個(gè)將數(shù)據(jù)對(duì)象(或觀測)劃分成子集的過程,也稱做無監(jiān)督分類。聚類分析已經(jīng)廣泛用于許多領(lǐng)域[1],許多不同的聚類策略被提出,但都具有非一致性的缺點(diǎn)。K-means和K-中心點(diǎn)算法,數(shù)據(jù)點(diǎn)通常分配到最近距離中心點(diǎn),該類方法
【相似文獻(xiàn)】
中國期刊全文數(shù)據(jù)庫 前1條
1 陰晉嶺;;解決詞義分類合并問題的一種方法[J];中國科教創(chuàng)新導(dǎo)刊;2009年02期
,本文編號(hào):934098
本文鏈接:http://sikaile.net/kejilunwen/ruanjiangongchenglunwen/934098.html
最近更新
教材專著