xk-split:基于k-medoids的分裂式聚類算法
本文選題:數(shù)據(jù)挖掘 + 聚類; 參考:《華東理工大學(xué)學(xué)報(bào)(自然科學(xué)版)》2017年06期
【摘要】:近年來(lái)互聯(lián)網(wǎng)數(shù)據(jù)規(guī)模呈爆炸式增長(zhǎng),如何對(duì)大數(shù)據(jù)進(jìn)行分析已成為熱門話題。然而,采集的數(shù)據(jù)很難直接用于分析,需要進(jìn)行一定程度的預(yù)處理,以提高大數(shù)據(jù)質(zhì)量。通過(guò)使用分裂式的迭代過(guò)程,可以逐步將數(shù)據(jù)集分裂為子集,避免了傳統(tǒng)聚類算法聚類開始時(shí)需要確定集群數(shù)的限制,并降低了算法的時(shí)間復(fù)雜度。此外,通過(guò)基于閾值的噪聲數(shù)據(jù)過(guò)濾,可以在迭代過(guò)程中剔除噪音數(shù)據(jù),提升了聚類算法對(duì)臟數(shù)據(jù)的忍耐力。
[Abstract]:In recent years, the scale of Internet data has explosive growth, how to analyze big data has become a hot topic. However, the collected data is difficult to be directly used for analysis, and a certain degree of preprocessing is needed to improve big data's quality. By using the split iteration process, the data set can be divided into subsets step by step, which avoids the limitation of the number of clusters at the beginning of the traditional clustering algorithm and reduces the time complexity of the algorithm. In addition, noise data can be eliminated during iteration by filtering noise data based on threshold, which improves the tolerance of clustering algorithm to dirty data.
【作者單位】: 華東理工大學(xué)計(jì)算機(jī)科學(xué)與工程系;上海市計(jì)算機(jī)軟件重點(diǎn)測(cè)評(píng)實(shí)驗(yàn)室;
【分類號(hào)】:TP311.13
【相似文獻(xiàn)】
相關(guān)博士學(xué)位論文 前2條
1 超木日力格;基于雅克比矩陣的軟劃分聚類算法分析[D];北京交通大學(xué);2017年
2 高兵;基于密度的數(shù)據(jù)流聚類方法研究[D];哈爾濱工程大學(xué);2014年
相關(guān)碩士學(xué)位論文 前10條
1 程凱;聚類集成中基聚類器的優(yōu)化研究[D];寧波大學(xué);2017年
2 郭亞銳;面向大規(guī)模數(shù)據(jù)的多視角K-means聚類算法的研究[D];鄭州大學(xué);2017年
3 曹曉鋒;面向維度的高維聚類邊界檢測(cè)技術(shù)研究[D];鄭州大學(xué);2017年
4 栗國(guó)保;基于MapReduce的分布式聚類算法的研究[D];江西理工大學(xué);2017年
5 豆康康;基于改進(jìn)H-K聚類算法的熱點(diǎn)話題發(fā)現(xiàn)方法[D];哈爾濱工程大學(xué);2014年
6 霍佳佳;一種基于聚類的語(yǔ)義WEB服務(wù)發(fā)現(xiàn)方法研究[D];哈爾濱工程大學(xué);2014年
7 邱雪營(yíng);基于圖像視覺(jué)上下文的多元IB聚類算法[D];鄭州大學(xué);2017年
8 郭慧豐;基于多特征信息融合的WEB廣告聚類方法研究[D];哈爾濱工業(yè)大學(xué);2014年
9 張燦龍;不確定DM-chameleon聚類算法在滑坡危險(xiǎn)性預(yù)測(cè)的研究及應(yīng)用[D];江西理工大學(xué);2017年
10 許允棟;K-means聚類算法的改進(jìn)與應(yīng)用[D];廣西師范大學(xué);2015年
,本文編號(hào):1824188
本文鏈接:http://sikaile.net/kejilunwen/ruanjiangongchenglunwen/1824188.html