一種優(yōu)化初始聚類中心的k-means算法
本文關(guān)鍵詞:一種優(yōu)化初始聚類中心的k-means算法,由筆耕文化傳播整理發(fā)布。
【摘要】:隨機(jī)選擇初始聚類中心的k-means算法易使聚類陷入局部最優(yōu)解、聚類結(jié)果不穩(wěn)定且受孤立點(diǎn)影響大等問題.針對(duì)這些問題,提出了一種優(yōu)化初始聚類中心的方法及孤立點(diǎn)排除法.該算法首先選擇距離最遠(yuǎn)的兩點(diǎn)加入初始化中心,再根據(jù)這兩點(diǎn)將原始簇分成兩個(gè)聚簇,在這兩個(gè)簇中挑選方差較大的簇按照一定的規(guī)則進(jìn)行分裂直至找到k個(gè)中心,初始中心的選擇過程中用到孤立點(diǎn)排除法.在UCI數(shù)據(jù)集及人造含一定比例的噪音數(shù)據(jù)集下,通過實(shí)驗(yàn)比較了改進(jìn)算法與其他算法的優(yōu)劣.實(shí)驗(yàn)表明,改進(jìn)后的算法不僅受孤立點(diǎn)的影響小、穩(wěn)定性好而且準(zhǔn)確度也高.
【作者單位】: 上海師范大學(xué)信息與機(jī)電工程學(xué)院;
【關(guān)鍵詞】: 初始聚類中心 k-means算法 孤立點(diǎn)排除法 聚簇 UCI數(shù)據(jù)集
【分類號(hào)】:TP311.13
【正文快照】: 0引言聚類分析是數(shù)據(jù)挖掘研究的一項(xiàng)重要技術(shù),它的誕生為從大量的數(shù)據(jù)中獲取有價(jià)值的知識(shí)提供了一種有效的方法.它廣泛地應(yīng)用于文本搜索、模式識(shí)別人工智能、圖像分析等領(lǐng)域[1].常用的聚類分析方法包括基于劃分、基于層次、基于密度、基于網(wǎng)格和基于模型等算法[2].k-means是劃
【相似文獻(xiàn)】
中國期刊全文數(shù)據(jù)庫 前10條
1 李瑋;薛惠鋒;詹海亮;;基于劃分采樣的初始聚類中心算法[J];太原理工大學(xué)學(xué)報(bào);2011年04期
2 孟子健;馬江洪;;一種可選初始聚類中心的改進(jìn)k均值算法[J];統(tǒng)計(jì)與決策;2014年12期
3 顧洪博;張繼懷;;聚類算法初始聚類中心的優(yōu)化[J];西安工程大學(xué)學(xué)報(bào);2010年02期
4 沈國珍;;依賴數(shù)據(jù)密度的K均值初始化調(diào)優(yōu)[J];計(jì)算機(jī)工程與應(yīng)用;2014年11期
5 王漢芝;劉振全;;一種新的確定K-均值算法初始聚類中心的方法[J];天津科技大學(xué)學(xué)報(bào);2005年04期
6 劉峰,孫超,李斌;一種改進(jìn)的C均值法初始類劃分方法[J];計(jì)算機(jī)工程與設(shè)計(jì);2005年02期
7 謝娟英;郭文娟;謝維信;高新波;;基于樣本空間分布密度的初始聚類中心優(yōu)化K-均值算法[J];計(jì)算機(jī)應(yīng)用研究;2012年03期
8 蘇錦旗;薛惠鋒;詹海亮;;基于劃分的K-均值初始聚類中心優(yōu)化算法[J];微電子學(xué)與計(jì)算機(jī);2009年01期
9 王賽芳;戴芳;王萬斌;張曉宇;;基于初始聚類中心優(yōu)化的K-均值算法[J];計(jì)算機(jī)工程與科學(xué);2010年10期
10 韓凌波;王強(qiáng);蔣正鋒;郝志強(qiáng);;一種改進(jìn)的k-means初始聚類中心選取算法[J];計(jì)算機(jī)工程與應(yīng)用;2010年17期
中國碩士學(xué)位論文全文數(shù)據(jù)庫 前1條
1 張永晶;初始聚類中心優(yōu)化的K-means改進(jìn)算法[D];東北師范大學(xué);2013年
本文關(guān)鍵詞:一種優(yōu)化初始聚類中心的k-means算法,,由筆耕文化傳播整理發(fā)布。
本文編號(hào):458780
本文鏈接:http://sikaile.net/kejilunwen/ruanjiangongchenglunwen/458780.html