基于MapReduce的FCM聚類集成算法
本文關(guān)鍵詞:基于MapReduce的FCM聚類集成算法
更多相關(guān)文章: MapReduce 聚類集成 模糊C-均值 并行聚類算法
【摘要】:模糊C-均值(FCM)聚類集成算法是一種利用集成思想提高聚類質(zhì)量的方法。針對FCM聚類集成算法隨著數(shù)據(jù)量的增加時間復(fù)雜度過高的問題,提出一種基于MapReduce框架的并行FCM聚類集成算法。首先利用多組隨機的初始聚類中心分別進行聚類來獲取具有差異化的聚類成員;然后通過建立聚類成員簇間OVERLAP矩陣來尋找邏輯等價簇,統(tǒng)一所有聚類成員中的簇標記;最后利用投票法共享聚類成員中數(shù)據(jù)對象的聚類情況得出最終的聚類結(jié)果。實驗結(jié)果表明,該算法具有良好的精確度、加速比和擴展性,具有處理較大規(guī)模數(shù)據(jù)集的能力。
【作者單位】: 解放軍信息工程大學(xué)密碼工程學(xué)院;
【關(guān)鍵詞】: MapReduce 聚類集成 模糊C-均值 并行聚類算法
【分類號】:TP311.13
【正文快照】: 0引言聚類就是將事物按照某種規(guī)則劃分成若干個簇,使同一個簇中的元素盡可能地相似,不同簇中的元素盡可能地不同,已廣泛地應(yīng)用于數(shù)據(jù)挖掘、信息檢索、圖像識別等領(lǐng)域[1]。作為一種非監(jiān)督的學(xué)習(xí)方法,聚類一直以來都是機器學(xué)習(xí)研究領(lǐng)域的熱點。目前,主流的聚類算法可根據(jù)聚類思
【相似文獻】
中國期刊全文數(shù)據(jù)庫 前10條
1 羅建宏;陳德釗;;兼顧正確率和差異性的自適應(yīng)集成算法及應(yīng)用[J];浙江大學(xué)學(xué)報(工學(xué)版);2011年03期
2 王芳;楊慧中;;一種改進的支持向量回歸集成算法[J];計算機工程與應(yīng)用;2008年03期
3 盛高斌;姚明海;;基于半監(jiān)督回歸的選擇性集成算法[J];計算機仿真;2009年10期
4 趙強利;蔣艷凰;徐明;;選擇性集成算法分類與比較[J];計算機工程與科學(xué);2012年02期
5 葉云龍;楊明;;一種基于優(yōu)化的隨機子空間分類集成算法[J];微電子學(xué)與計算機;2009年10期
6 王羨慧;覃征;張選平;高洪江;;采用仿射傳播的聚類集成算法[J];西安交通大學(xué)學(xué)報;2011年08期
7 馬超;陳西宏;徐宇亮;王光明;;廣義鄰域粗集下的集成特征選擇及其選擇性集成算法[J];西安交通大學(xué)學(xué)報;2011年06期
8 關(guān)菁華;劉大有;;一種挖掘概念漂移數(shù)據(jù)流的選擇性集成算法[J];計算機科學(xué);2010年01期
9 趙強利;蔣艷凰;徐明;;基于FP-Tree的快速選擇性集成算法[J];軟件學(xué)報;2011年04期
10 張文靜;;基于Mapreduce的權(quán)重集成算法在煤炭行業(yè)數(shù)據(jù)處理中的應(yīng)用[J];煤炭技術(shù);2013年09期
中國博士學(xué)位論文全文數(shù)據(jù)庫 前1條
1 董曉健;基因表達式編程集成算法研究[D];武漢大學(xué);2011年
中國碩士學(xué)位論文全文數(shù)據(jù)庫 前4條
1 孟曉龍;基于時機的模糊譜圖劃分聚類集成算法的研究[D];西南交通大學(xué);2015年
2 朱新榮;徑向基函數(shù)神經(jīng)網(wǎng)絡(luò)集成算法的研究及應(yīng)用[D];大連理工大學(xué);2010年
3 姚沛津;基于樸素貝葉斯的集成算法研究[D];華南理工大學(xué);2013年
4 陳卓;基于DHGF綜合集成算法的企業(yè)并購風(fēng)險評估[D];中央財經(jīng)大學(xué);2013年
,本文編號:684332
本文鏈接:http://sikaile.net/kejilunwen/ruanjiangongchenglunwen/684332.html