引入信息熵的CURE聚類算法
發(fā)布時(shí)間:2018-02-22 23:22
本文關(guān)鍵詞: 層次聚類 CURE算法 信息熵 代表點(diǎn)選取 出處:《計(jì)算機(jī)應(yīng)用研究》2017年08期 論文類型:期刊論文
【摘要】:為了提高傳統(tǒng)CURE(clustering using representatives)聚類算法的質(zhì)量,引入信息熵對(duì)其進(jìn)行改進(jìn)。該算法使用K-means算法對(duì)樣本數(shù)據(jù)集進(jìn)行預(yù)聚類;采用基于信息熵的相似性度量,利用簇中元素提供的信息度量不同簇之間的相互關(guān)系,并描述數(shù)據(jù)的分布;在高、低層聚類階段,采取不同的選取策略,分別選取相應(yīng)的代表點(diǎn)。在UCI和人造數(shù)據(jù)集上的實(shí)驗(yàn)結(jié)果表明,提出的算法在一定程度上提高了聚類的準(zhǔn)確率,且在大型數(shù)據(jù)集上比傳統(tǒng)CURE算法有著更高的聚類效率。
[Abstract]:In order to improve the quality of traditional CURE(clustering using representatives-based clustering algorithm, information entropy is introduced to improve it. The information provided by the elements in the cluster is used to measure the relationship between different clusters and to describe the distribution of data. The experimental results on UCI and artificial datasets show that the proposed algorithm improves the clustering accuracy to some extent and has a higher clustering efficiency than the traditional CURE algorithm in large datasets.
【作者單位】: 武漢科技大學(xué)計(jì)算機(jī)科學(xué)與技術(shù)學(xué)院;武漢科技大學(xué)智能信息處理與實(shí)時(shí)工業(yè)系統(tǒng)湖北省重點(diǎn)實(shí)驗(yàn)室;
【基金】:國(guó)家自然科學(xué)基金資助項(xiàng)目(41571396)
【分類號(hào)】:TP311.13
【相似文獻(xiàn)】
相關(guān)期刊論文 前2條
1 劉明輝;周磊;謝婷婷;霍爍爍;;基于CURE算法的電子裝備時(shí)變誤差分析[J];無線電工程;2012年07期
2 ;[J];;年期
相關(guān)重要報(bào)紙文章 前1條
1 ;CURE研究中氯吡格雷的成本-效果分析[N];醫(yī)藥經(jīng)濟(jì)報(bào);2003年
,本文編號(hào):1525563
本文鏈接:http://sikaile.net/kejilunwen/ruanjiangongchenglunwen/1525563.html
最近更新
教材專著