天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁(yè) > 科技論文 > 軟件論文 >

基于層次和密度的任意形狀聚類(lèi)算法研究

發(fā)布時(shí)間:2018-01-24 16:03

  本文關(guān)鍵詞: 層次聚類(lèi) 密度聚類(lèi) 任意形狀聚類(lèi) 子簇合并 密度峰值點(diǎn) 邊界區(qū)域密度 出處:《河南理工大學(xué)》2016年碩士論文 論文類(lèi)型:學(xué)位論文


【摘要】:聚類(lèi)技術(shù)作為數(shù)據(jù)挖掘領(lǐng)域的一個(gè)重要研究方向,可以有效地幫助人們了解數(shù)據(jù)的分布和特征,以便作進(jìn)一步研究分析。雖然已有的聚類(lèi)算法很多,但聚類(lèi)技術(shù)依然存在很多問(wèn)題和挑戰(zhàn)。結(jié)合層次聚類(lèi)算法和密度聚類(lèi)算法,本文提出一種新的任意形狀聚類(lèi)算法。該算法在層次聚類(lèi)技術(shù)的框架下,使用基于密度聚類(lèi)的思想來(lái)定義子簇和子簇合并方法,論文的主要工作如下:(1)針對(duì)目前層次聚類(lèi)算法的計(jì)算時(shí)間復(fù)雜度較高,并且需要人為輸入聚類(lèi)個(gè)數(shù)或者閾值參數(shù)作為聚類(lèi)終止條件的問(wèn)題,本文提出了一種新穎的基于密度的子簇合并方法,將簇間邊界區(qū)域密度大于等于其中任何一個(gè)簇平均密度的相鄰子簇進(jìn)行合并。該子簇合并準(zhǔn)則使用動(dòng)態(tài)模型的方法,能夠自動(dòng)適應(yīng)被合并簇之間的內(nèi)部特征屬性,可自動(dòng)確定聚類(lèi)個(gè)數(shù)和聚類(lèi)終止點(diǎn),從而發(fā)現(xiàn)任意形狀的聚類(lèi)。(2)針對(duì)密度聚類(lèi)算法容易忽略密度稀疏區(qū)域中的密度峰值點(diǎn)的問(wèn)題,本文找出距離其他高密度點(diǎn)距離較遠(yuǎn)的點(diǎn)作為密度峰值點(diǎn),放寬了對(duì)密度峰值點(diǎn)的選擇范圍。然后,根據(jù)這些密度峰值點(diǎn)將數(shù)據(jù)集切分為大量初始子簇,而且得到的子簇比較正確。(3)針對(duì)密度聚類(lèi)方法使用全局統(tǒng)一的距離參數(shù),不利于密度差異較大數(shù)據(jù)集的問(wèn)題,本文通過(guò)將低密度數(shù)據(jù)集與高密度數(shù)據(jù)集分層,將低密度子簇篩選出來(lái),設(shè)置合適的距離參數(shù)進(jìn)行聚類(lèi)來(lái)解決上述問(wèn)題。在測(cè)試數(shù)據(jù)集以及真實(shí)數(shù)據(jù)集上的對(duì)比實(shí)驗(yàn)表明,本文算法具有能自動(dòng)確定聚類(lèi)個(gè)數(shù),能夠有效地發(fā)現(xiàn)任意形狀、大小的聚類(lèi),對(duì)輸入?yún)?shù)的選擇具有魯棒性,并且適用于密度分布不均勻的數(shù)據(jù)集等優(yōu)點(diǎn)。
[Abstract]:As an important research direction in the field of data mining, clustering technology can effectively help people to understand the distribution and characteristics of data for further research and analysis, although there are many existing clustering algorithms. However, there are still many problems and challenges in clustering technology. Combined with hierarchical clustering algorithm and density clustering algorithm, this paper proposes a new arbitrary shape clustering algorithm, which is based on hierarchical clustering technology. Using the idea of density clustering to define subclusters and sub-cluster merging, the main work of this paper is as follows: 1) the computational time complexity of hierarchical clustering algorithm is high. In addition, it is necessary to input the number of clusters or threshold parameters as the termination condition. In this paper, a novel density-based subcluster merging method is proposed. The adjacent subclusters whose boundary region density is greater than or equal to the average density of any of the clusters are merged. The merging criterion of the subclusters uses the method of dynamic model. It can automatically adapt to the internal characteristic attributes between the merged clusters, and can automatically determine the number of clusters and the cluster termination points. Thus it is found that arbitrary shape clustering algorithm is easy to ignore the density peak point in the sparse density region. In this paper, we find the point which is far away from other high density points as the density peak point. Then, the data set is cut into a large number of initial subclusters according to these density peaks. Moreover, the obtained subcluster is more correct. 3) the global uniform distance parameter is used for the density clustering method, which is not conducive to the problem of large density difference data sets. In this paper, the low density subclusters are filtered out by stratifying the low density data sets and the high density data sets. Set the appropriate distance parameters to cluster to solve the above problem. The experimental results on the test data set and the real data set show that the algorithm can automatically determine the number of clustering. It can find the clustering of arbitrary shape and size effectively and is robust to the selection of input parameters. It is also suitable for data sets with uneven density distribution and so on.
【學(xué)位授予單位】:河南理工大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2016
【分類(lèi)號(hào)】:TP311.13

【相似文獻(xiàn)】

相關(guān)期刊論文 前10條

1 朱永紅;;覆蓋聚類(lèi)算法的應(yīng)用研究[J];計(jì)算機(jī)技術(shù)與發(fā)展;2007年01期

2 蔡元萃;陳立潮;;聚類(lèi)算法研究綜述[J];科技情報(bào)開(kāi)發(fā)與經(jīng)濟(jì);2007年01期

3 楊博;劉大有;金弟;馬海賓;;復(fù)雜網(wǎng)絡(luò)聚類(lèi)方法[J];軟件學(xué)報(bào);2009年01期

4 陳梅蘭;基于網(wǎng)格和密度聚類(lèi)算法研究[J];計(jì)算機(jī)與現(xiàn)代化;2005年02期

5 聞?chuàng)P,苑春法,黃昌寧;基于搭配對(duì)的漢語(yǔ)形容詞-名詞聚類(lèi)[J];中文信息學(xué)報(bào);2000年06期

6 王偉東,蘆金嬋,張講社;基于視覺(jué)原理的密度聚類(lèi)算法[J];工程數(shù)學(xué)學(xué)報(bào);2005年02期

7 彭京;唐常杰;程溫泉;石葆梅;喬少杰;;一種基于層次距離計(jì)算的聚類(lèi)算法[J];計(jì)算機(jī)學(xué)報(bào);2007年05期

8 陳鋼,馮志勇,金輝;基于GT編碼的零件聚類(lèi)樹(shù)的建立[J];中國(guó)制造業(yè)信息化;2003年06期

9 曹慧;;一種基于聚類(lèi)的多數(shù)據(jù)庫(kù)分類(lèi)方法設(shè)計(jì)[J];網(wǎng)絡(luò)安全技術(shù)與應(yīng)用;2010年06期

10 劉芳,何飛;一種基于聚類(lèi)樹(shù)的增量式數(shù)據(jù)清洗算法[J];華中科技大學(xué)學(xué)報(bào)(自然科學(xué)版);2005年03期

相關(guān)會(huì)議論文 前10條

1 錢(qián)衛(wèi)寧;錢(qián)海蕾;周傲英;;構(gòu)造準(zhǔn)確的多粒度聚類(lèi)樹(shù):一種交互式的方法[A];第十七屆全國(guó)數(shù)據(jù)庫(kù)學(xué)術(shù)會(huì)議論文集(研究報(bào)告篇)[C];2000年

2 錢(qián)衛(wèi)寧;錢(qián)海蕾;周傲英;;聚類(lèi)樹(shù)合并——聚類(lèi)超大規(guī)模數(shù)據(jù)庫(kù)[A];第十八屆全國(guó)數(shù)據(jù)庫(kù)學(xué)術(shù)會(huì)議論文集(研究報(bào)告篇)[C];2001年

3 萬(wàn)代紅;齊明;萬(wàn)曉紅;;分類(lèi)技術(shù)DSCM聚類(lèi)算法的C語(yǔ)言實(shí)現(xiàn)[A];增強(qiáng)自主創(chuàng)新能力 促進(jìn)吉林經(jīng)濟(jì)發(fā)展——啟明杯·吉林省第四屆科學(xué)技術(shù)學(xué)術(shù)年會(huì)論文集(上冊(cè))[C];2006年

4 錢(qián)海蕾;錢(qián)衛(wèi)寧;周傲英;;對(duì)于聚合聚類(lèi)終止條件的研究[A];第十八屆全國(guó)數(shù)據(jù)庫(kù)學(xué)術(shù)會(huì)議論文集(研究報(bào)告篇)[C];2001年

5 任家東;孟麗麗;張冬梅;;一種基于網(wǎng)格的改進(jìn)的K-Means聚類(lèi)算法[A];第26屆中國(guó)數(shù)據(jù)庫(kù)學(xué)術(shù)會(huì)議論文集(B輯)[C];2009年

6 馬曉艷;唐雁;;層次聚類(lèi)算法研究[A];2008年計(jì)算機(jī)應(yīng)用技術(shù)交流會(huì)論文集[C];2008年

7 周皓峰;袁晴晴;程尊平;施伯樂(lè);;PHC:一個(gè)基于分層的快速聚類(lèi)算法[A];第十九屆全國(guó)數(shù)據(jù)庫(kù)學(xué)術(shù)會(huì)議論文集(研究報(bào)告篇)[C];2002年

8 饒金通;董槐林;姜青山;;基于孤立因子的層次聚類(lèi)算法與應(yīng)用[A];第二十一屆中國(guó)數(shù)據(jù)庫(kù)學(xué)術(shù)會(huì)議論文集(研究報(bào)告篇)[C];2004年

9 王仲君;莫春玲;;視覺(jué)原理的FCM聚類(lèi)算法在復(fù)雜網(wǎng)絡(luò)中的應(yīng)用[A];2006全國(guó)復(fù)雜網(wǎng)絡(luò)學(xué)術(shù)會(huì)議論文集[C];2006年

10 吳楠楠;史亮;饒金通;姜青山;董槐林;;一種改進(jìn)的高效層次聚類(lèi)算法[A];第二十二屆中國(guó)數(shù)據(jù)庫(kù)學(xué)術(shù)會(huì)議論文集(技術(shù)報(bào)告篇)[C];2005年

相關(guān)博士學(xué)位論文 前5條

1 晏華;交易數(shù)據(jù)的聚類(lèi)分析[D];電子科技大學(xué);2008年

2 王娜;基于客觀聚類(lèi)的模糊建模方法研究[D];上海交通大學(xué);2009年

3 羅會(huì)蘭;聚類(lèi)集成關(guān)鍵技術(shù)研究[D];浙江大學(xué);2007年

4 陳遠(yuǎn)浩;非監(jiān)督的結(jié)構(gòu)學(xué)習(xí)及其應(yīng)用[D];中國(guó)科學(xué)技術(shù)大學(xué);2008年

5 肖宇;聚類(lèi)分析及其在圖像處理中的應(yīng)用[D];北京交通大學(xué);2012年

相關(guān)碩士學(xué)位論文 前10條

1 牛麗君;基于層次和密度的任意形狀聚類(lèi)算法研究[D];河南理工大學(xué);2016年

2 賀勇;基于染色傳播的關(guān)鍵詞聚類(lèi)算法研究[D];華南理工大學(xué);2015年

3 伍藝;面向大數(shù)據(jù)集的遞增聚類(lèi)方法研究[D];北京理工大學(xué);2015年

4 黃燕勤;有關(guān)基于頻譜和聚類(lèi)方法定位故障的實(shí)證研究[D];南京大學(xué);2015年

5 楊志;基于粒子群的粗糙聚類(lèi)算法分析與研究[D];長(zhǎng)沙理工大學(xué);2014年

6 梁堯;分布式海量指紋識(shí)別系統(tǒng)設(shè)計(jì)與實(shí)現(xiàn)[D];電子科技大學(xué);2015年

7 王喜梅;基于多語(yǔ)言話題發(fā)現(xiàn)的聚類(lèi)算法改進(jìn)[D];蘭州大學(xué);2016年

8 程祥;基于負(fù)荷量測(cè)數(shù)據(jù)的電力負(fù)荷聚類(lèi)方法研究[D];浙江大學(xué);2017年

9 陳衡岳;聚類(lèi)分析及聚類(lèi)結(jié)果評(píng)估算法研究[D];東北大學(xué);2006年

10 陳武;多類(lèi)標(biāo)聚類(lèi)樹(shù)分類(lèi)方法優(yōu)化及并行化實(shí)現(xiàn)[D];哈爾濱工業(yè)大學(xué);2013年

,

本文編號(hào):1460436

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/ruanjiangongchenglunwen/1460436.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶(hù)18768***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com
日韩精品一区二区三区四区| 麻豆视传媒短视频免费观看| 九九热这里只有免费精品| 少妇肥臀一区二区三区| 亚洲国产精品国自产拍社区| 大尺度剧情国产在线视频| 久久热在线视频免费观看| 国产精品福利精品福利| 国产亚洲欧美另类久久久| 国产成人精品国产成人亚洲| 国产精品偷拍一区二区| 亚洲精品福利入口在线| 不卡一区二区高清视频| 高清一区二区三区大伊香蕉| 东京热电东京热一区二区三区| 99久久国产综合精品二区| 激情爱爱一区二区三区| 亚洲高清欧美中文字幕| 黄色日韩欧美在线观看| 亚洲国产av在线视频| 最新日韩精品一推荐日韩精品| 国产日韩欧美在线亚洲| 久久精品视频就在久久| 欧美一区二区三区十区| 日韩夫妻午夜性生活视频| 99久热只有精品视频最新| 国产精品丝袜美腿一区二区| 高清免费在线不卡视频| 九九蜜桃视频香蕉视频| 欧美欧美日韩综合一区| 久久99国产精品果冻传媒| 国产一区欧美一区日韩一区| 亚洲欧洲日韩综合二区| 激情内射亚洲一区二区三区| 久久综合狠狠综合久久综合| 亚洲精品欧美精品日韩精品| 午夜国产精品国自产拍av | 亚洲午夜精品视频观看| 日本国产欧美精品视频| 黄色片一区二区在线观看| 四季精品人妻av一区二区三区|