針對多聚類中心大數(shù)據(jù)集的加速K-means聚類算法
本文關鍵詞:針對多聚類中心大數(shù)據(jù)集的加速K-means聚類算法
更多相關文章: DIACK 加速K-means 聚類 三角定理
【摘要】:隨著數(shù)據(jù)量、數(shù)據(jù)維度呈指數(shù)發(fā)展以及實際應用中聚類中心個數(shù)的增多,傳統(tǒng)的K-means聚類算法已經(jīng)不能滿足實際應用中的時間和內(nèi)存要求。針對該問題提出了一種基于動態(tài)類中心調(diào)整和Elkan三角判定思想的加速K-means聚類算法。實驗結果證明,當數(shù)據(jù)規(guī)模達到10萬條,聚類個數(shù)達到20個以上時,本算法相比Elkan算法具有更快的收斂速度和更低的內(nèi)存開銷。
【作者單位】: 中國科學院沈陽自動化研究所;中國科學院大學;吉化集團吉林市軟信技術有限公司;
【關鍵詞】: DIACK 加速K-means 聚類 三角定理
【基金】:國家科技支持計劃資助項目(2012BAH15F05) 吉林省科技型中小企業(yè)技術創(chuàng)新基金資助項目(12C26212201399) 國家自然科學基金資助項目(612033161,51205389)
【分類號】:TP311.13
【正文快照】: 0引言聚類是一種典型的數(shù)據(jù)挖掘方法,在識別數(shù)據(jù)內(nèi)部結構方面有重要的作用。Mac Queen[1]在1967年提出的K-means算法是最經(jīng)典的聚類算法,其目標是將數(shù)據(jù)集劃分成多個類,使類中各點的相似性盡可能大而類間的相似性盡可能小。由于其方法簡單,對球狀類有很好的聚類效果,在圖像處
【相似文獻】
中國期刊全文數(shù)據(jù)庫 前10條
1 黃旭;呂強;錢培德;;一種用于蛋白質結構聚類的聚類中心選擇算法[J];自動化學報;2011年06期
2 樊曉光;路釗;王久崇;李國棟;謝朝政;;基于密度和距離積的聚類中心選取方法[J];測控技術;2013年10期
3 趙峰;張軍英;劉敬;;核最優(yōu)變換與聚類中心的算法[J];西安電子科技大學學報;2009年01期
4 朱云賀;張春海;張博;;基于數(shù)據(jù)分段的K-means的優(yōu)化研究[J];計算機技術與發(fā)展;2010年11期
5 李春生;王耀南;;聚類中心初始化的新方法[J];控制理論與應用;2010年10期
6 陳侃;李彬;田聯(lián)房;;基于局部閾值和聚類中心迭代的肺結節(jié)檢測算法[J];計算機科學;2012年02期
7 關學忠,韓彩霞,韓振洲;神經(jīng)模糊系統(tǒng)中模糊規(guī)則的優(yōu)化[J];大慶石油學院學報;2005年01期
8 劉舒野;林和平;楊晨;;基于歸并聚類中心思想的模糊聚類分析方法研究[J];航空計算技術;2007年04期
9 寧永恒;楊小兵;王康健;;一種多聚類中心的劃分方法[J];中國計量學院學報;2014年02期
10 高潮;田翠翠;郭永彩;;基于改進聚類中心分析法的紅外行人分割[J];計算機工程;2011年06期
中國重要會議論文全文數(shù)據(jù)庫 前1條
1 吳繼兵;李心科;;基于K-最近鄰居圖劃分的聚類中心初始化算法[A];全國第20屆計算機技術與應用學術會議(CACIS·2009)暨全國第1屆安全關鍵技術與應用學術會議論文集(上冊)[C];2009年
中國碩士學位論文全文數(shù)據(jù)庫 前2條
1 徐祥;多中心聚類算法的研究與改進[D];安徽大學;2015年
2 邱榮太;基于Hadoop平臺的Map-Reduce應用研究[D];河南理工大學;2009年
,本文編號:1085102
本文鏈接:http://sikaile.net/kejilunwen/ruanjiangongchenglunwen/1085102.html