天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁(yè) > 科技論文 > 軟件論文 >

xk-split:基于k-medoids的分裂式聚類(lèi)算法

發(fā)布時(shí)間:2018-04-30 10:26

  本文選題:數(shù)據(jù)挖掘 + 聚類(lèi); 參考:《華東理工大學(xué)學(xué)報(bào)(自然科學(xué)版)》2017年06期


【摘要】:近年來(lái)互聯(lián)網(wǎng)數(shù)據(jù)規(guī)模呈爆炸式增長(zhǎng),如何對(duì)大數(shù)據(jù)進(jìn)行分析已成為熱門(mén)話(huà)題。然而,采集的數(shù)據(jù)很難直接用于分析,需要進(jìn)行一定程度的預(yù)處理,以提高大數(shù)據(jù)質(zhì)量。通過(guò)使用分裂式的迭代過(guò)程,可以逐步將數(shù)據(jù)集分裂為子集,避免了傳統(tǒng)聚類(lèi)算法聚類(lèi)開(kāi)始時(shí)需要確定集群數(shù)的限制,并降低了算法的時(shí)間復(fù)雜度。此外,通過(guò)基于閾值的噪聲數(shù)據(jù)過(guò)濾,可以在迭代過(guò)程中剔除噪音數(shù)據(jù),提升了聚類(lèi)算法對(duì)臟數(shù)據(jù)的忍耐力。
[Abstract]:In recent years, the scale of Internet data has explosive growth, how to analyze big data has become a hot topic. However, the collected data is difficult to be directly used for analysis, and a certain degree of preprocessing is needed to improve big data's quality. By using the split iteration process, the data set can be divided into subsets step by step, which avoids the limitation of the number of clusters at the beginning of the traditional clustering algorithm and reduces the time complexity of the algorithm. In addition, noise data can be eliminated during iteration by filtering noise data based on threshold, which improves the tolerance of clustering algorithm to dirty data.
【作者單位】: 華東理工大學(xué)計(jì)算機(jī)科學(xué)與工程系;上海市計(jì)算機(jī)軟件重點(diǎn)測(cè)評(píng)實(shí)驗(yàn)室;
【分類(lèi)號(hào)】:TP311.13

【相似文獻(xiàn)】

相關(guān)博士學(xué)位論文 前2條

1 超木日力格;基于雅克比矩陣的軟劃分聚類(lèi)算法分析[D];北京交通大學(xué);2017年

2 高兵;基于密度的數(shù)據(jù)流聚類(lèi)方法研究[D];哈爾濱工程大學(xué);2014年

相關(guān)碩士學(xué)位論文 前10條

1 程凱;聚類(lèi)集成中基聚類(lèi)器的優(yōu)化研究[D];寧波大學(xué);2017年

2 郭亞銳;面向大規(guī)模數(shù)據(jù)的多視角K-means聚類(lèi)算法的研究[D];鄭州大學(xué);2017年

3 曹曉鋒;面向維度的高維聚類(lèi)邊界檢測(cè)技術(shù)研究[D];鄭州大學(xué);2017年

4 栗國(guó)保;基于MapReduce的分布式聚類(lèi)算法的研究[D];江西理工大學(xué);2017年

5 豆康康;基于改進(jìn)H-K聚類(lèi)算法的熱點(diǎn)話(huà)題發(fā)現(xiàn)方法[D];哈爾濱工程大學(xué);2014年

6 霍佳佳;一種基于聚類(lèi)的語(yǔ)義WEB服務(wù)發(fā)現(xiàn)方法研究[D];哈爾濱工程大學(xué);2014年

7 邱雪營(yíng);基于圖像視覺(jué)上下文的多元IB聚類(lèi)算法[D];鄭州大學(xué);2017年

8 郭慧豐;基于多特征信息融合的WEB廣告聚類(lèi)方法研究[D];哈爾濱工業(yè)大學(xué);2014年

9 張燦龍;不確定DM-chameleon聚類(lèi)算法在滑坡危險(xiǎn)性預(yù)測(cè)的研究及應(yīng)用[D];江西理工大學(xué);2017年

10 許允棟;K-means聚類(lèi)算法的改進(jìn)與應(yīng)用[D];廣西師范大學(xué);2015年



本文編號(hào):1824188

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/ruanjiangongchenglunwen/1824188.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶(hù)43383***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com