天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁(yè) > 科技論文 > 軟件論文 >

挖掘任意形狀簇的聚類算法研究

發(fā)布時(shí)間:2017-09-30 10:32

  本文關(guān)鍵詞:挖掘任意形狀簇的聚類算法研究


  更多相關(guān)文章: 任意形狀簇 聚類 空間數(shù)據(jù) 相似性度量


【摘要】:數(shù)據(jù)挖掘是一個(gè)能從大規(guī)模數(shù)據(jù)中發(fā)現(xiàn)知識(shí)的強(qiáng)大技術(shù)。聚類分析作為數(shù)據(jù)挖掘中的一個(gè)基礎(chǔ)工具,已經(jīng)被廣泛應(yīng)用于模式識(shí)別、圖像處理、空間數(shù)據(jù)分析、文本分類和信息檢索、市場(chǎng)分析等眾多領(lǐng)域。隨著計(jì)算機(jī)的普及和互聯(lián)網(wǎng)的不斷發(fā)展,數(shù)據(jù)量越來(lái)越大,數(shù)據(jù)的空間分布中大多包含多種不規(guī)則形狀的簇,比如地理信息數(shù)據(jù)、醫(yī)學(xué)圖像數(shù)據(jù)、農(nóng)業(yè)科學(xué)數(shù)據(jù)等,這對(duì)聚類分析提出了挑戰(zhàn)。傳統(tǒng)的聚類算法通常不能很好地挖掘任意形狀的簇,近年來(lái),挖掘任意形狀簇的研究成為聚類分析領(lǐng)域的一個(gè)研究熱點(diǎn)。為了更有效地對(duì)包含有任意形狀簇的數(shù)據(jù)進(jìn)行聚類,本文對(duì)現(xiàn)有的聚類算法進(jìn)行分析和研究,提出了兩個(gè)能挖掘任意形狀簇的聚類算法CMSPC、CFDPm。本文提出的CMSPC算法是為了提高在包含任意形狀簇的數(shù)據(jù)集上的聚類質(zhì)量。CMSPC算法基于點(diǎn)與簇內(nèi)多點(diǎn)的相似性,對(duì)于距離在截?cái)嗑嚯x之內(nèi)的兩個(gè)對(duì)象,考慮其中一個(gè)對(duì)象關(guān)于另外一個(gè)對(duì)象所在簇的歸屬度,對(duì)滿足一定歸屬度的臨時(shí)簇進(jìn)行合并。CMSPC算法基于點(diǎn)與簇內(nèi)多點(diǎn)相似的特點(diǎn)使得聚類結(jié)果與簇形狀無(wú)關(guān),同時(shí)能夠提取出異常點(diǎn)。本文提出的另外一個(gè)聚類算法CFDPm是新型聚類算法CFDP算法的一種改進(jìn)算法。在多峰簇?cái)?shù)據(jù)集中,CFDP算法會(huì)因簇中心點(diǎn)的選取不準(zhǔn)確而導(dǎo)致聚類質(zhì)量的下降。本文通過(guò)綜合考慮聚類結(jié)果中簇之間的距離、簇內(nèi)距離、合并兩簇后對(duì)于整體內(nèi)部評(píng)價(jià)指標(biāo)DBI的影響來(lái)有條件地對(duì)簇進(jìn)行合并,從而改善因選擇簇中心點(diǎn)失效而帶來(lái)的聚類質(zhì)量下降的問(wèn)題。為了驗(yàn)證本文提出的兩種聚類算法的有效性,我們?cè)诙鄠(gè)基準(zhǔn)數(shù)據(jù)集上進(jìn)行了聚類實(shí)驗(yàn)。實(shí)驗(yàn)結(jié)果表明兩點(diǎn):一、CMSPC算法可以對(duì)包含任意形狀簇的數(shù)據(jù)進(jìn)行較好的聚類,同時(shí)識(shí)別出異常點(diǎn),具有較高的聚類質(zhì)量。二、CFDPm算法能夠克服CFDP算法因簇中心選取不準(zhǔn)確而導(dǎo)致的聚類質(zhì)量下降的問(wèn)題。
【關(guān)鍵詞】:任意形狀簇 聚類 空間數(shù)據(jù) 相似性度量
【學(xué)位授予單位】:蘭州大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2016
【分類號(hào)】:TP311.13
【目錄】:
  • 摘要3-4
  • Abstract4-8
  • 第一章 緒論8-13
  • 1.1 研究背景及意義8-10
  • 1.2 國(guó)內(nèi)外研究現(xiàn)狀10-11
  • 1.3 本文的主要研究?jī)?nèi)容11-12
  • 1.4 論文的組織框架12-13
  • 第二章 聚類分析概述13-22
  • 2.1 聚類的相關(guān)概念和定義13-15
  • 2.2 聚類中的距離度量15-17
  • 2.2.1 對(duì)象間的距離15-16
  • 2.2.2 簇間距離16-17
  • 2.3 聚類方法17-18
  • 2.3.1 基于距離的聚類方法17-18
  • 2.3.2 基于密度的聚類18
  • 2.4 聚類評(píng)價(jià)指標(biāo)18-21
  • 2.4.1 外部評(píng)價(jià)指標(biāo)19-21
  • 2.4.2 內(nèi)部評(píng)價(jià)指標(biāo)Davies-Bouldin21
  • 2.5 本章小結(jié)21-22
  • 第三章 基于點(diǎn)與簇內(nèi)多點(diǎn)相似的聚類算法22-37
  • 3.1 基于點(diǎn)與簇內(nèi)多點(diǎn)相似算法的提出22-24
  • 3.2 基于點(diǎn)與簇內(nèi)多點(diǎn)相似的聚類算法CMSPC24-28
  • 3.2.1 相關(guān)概念及定義24-26
  • 3.2.2 基于點(diǎn)與簇內(nèi)多點(diǎn)相似的聚類算法CMSPC26-28
  • 3.2.3 復(fù)雜度分析28
  • 3.3 實(shí)驗(yàn)及結(jié)果分析28-36
  • 3.3.1 實(shí)驗(yàn)環(huán)境及對(duì)比算法參數(shù)設(shè)置28-29
  • 3.3.2 實(shí)驗(yàn)所用數(shù)據(jù)集29-31
  • 3.3.3 CMSPC聚類算法實(shí)驗(yàn)31-36
  • 3.4 本章小結(jié)36-37
  • 第四章 改進(jìn)的聚類算法CFDPm37-49
  • 4.1 CFDP算法介紹37-38
  • 4.2 CFDPm算法38-42
  • 4.2.1 CFDP算法在多峰簇?cái)?shù)據(jù)集上的聚類結(jié)果分析39-40
  • 4.2.2 CFDPm算法思想40
  • 4.2.3 相關(guān)定義及概念40
  • 4.2.4 CFDPm算法詳細(xì)描述40-42
  • 4.3 實(shí)驗(yàn)及結(jié)果分析42-48
  • 4.3.1 實(shí)驗(yàn)數(shù)據(jù)集42-43
  • 4.3.2 CFDPm算法實(shí)驗(yàn)43-48
  • 4.4 本章小結(jié)48-49
  • 第五章 總結(jié)與展望49-51
  • 5.1 本文工作總結(jié)49
  • 5.2 未來(lái)工作展望49-51
  • 參考文獻(xiàn)51-54
  • 在學(xué)期間的研究成果54-55
  • 致謝55

【相似文獻(xiàn)】

中國(guó)期刊全文數(shù)據(jù)庫(kù) 前10條

1 榮波;夏正友;;基于聚類的BBS成員交互網(wǎng)絡(luò)特性研究[J];重慶科技學(xué)院學(xué)報(bào)(自然科學(xué)版);2009年06期

2 靳華中;;基于云模型的聚類特性分析[J];湖北農(nóng)機(jī)化;2011年02期

3 淦文燕,李家福,李德毅;高維聚類中的一種特征篩選方法[J];解放軍理工大學(xué)學(xué)報(bào)(自然科學(xué)版);2003年06期

4 孫志偉;;一種能發(fā)現(xiàn)自然聚類的聚類算法[J];計(jì)算機(jī)應(yīng)用研究;2009年08期

5 陳濤;陳啟買(mǎi);張瑋;郭小林;;聚類算法在學(xué)分制下高校專業(yè)自動(dòng)分類中的應(yīng)用[J];計(jì)算機(jī)應(yīng)用與軟件;2007年05期

6 孟海東;宋飛燕;宋宇辰;;面向復(fù)雜簇的聚類算法研究與實(shí)現(xiàn)[J];計(jì)算機(jī)應(yīng)用與軟件;2008年10期

7 宋宇辰;宋飛燕;孟海東;;基于密度復(fù)雜簇聚類算法研究與實(shí)現(xiàn)[J];計(jì)算機(jī)工程與應(yīng)用;2007年35期

8 孟海東;宋飛燕;郝永寬;;基于密度與劃分方法的聚類算法設(shè)計(jì)與實(shí)現(xiàn)[J];計(jì)算機(jī)工程與應(yīng)用;2007年27期

9 夏勝平;呂小軍;劉建軍;袁振濤;郁文賢;;基于集群的并行分布式聚類及其應(yīng)用(英文)[J];鄭州大學(xué)學(xué)報(bào)(理學(xué)版);2006年04期

10 姚天任,王大有;自組織特征映射神經(jīng)網(wǎng)絡(luò)的聚類特性在語(yǔ)音矢量量化快速搜索中的應(yīng)用[J];通信學(xué)報(bào);1992年05期

中國(guó)重要會(huì)議論文全文數(shù)據(jù)庫(kù) 前1條

1 陸君安;張勇;陳娟;呂金虎;吳曉群;;聚類環(huán)(鏈)基于同步的尺度可變性分析[A];中國(guó)自動(dòng)化學(xué)會(huì)控制理論專業(yè)委員會(huì)B卷[C];2011年

中國(guó)碩士學(xué)位論文全文數(shù)據(jù)庫(kù) 前10條

1 曹佩佩;蟻群覓食模型在共現(xiàn)網(wǎng)絡(luò)聚類中的應(yīng)用[D];大連理工大學(xué);2015年

2 王博;挖掘任意形狀簇的聚類算法研究[D];蘭州大學(xué);2016年

3 朱萌;基于模糊矩陣的聚類融合[D];南京理工大學(xué);2008年

4 侯娟;聚類融合算法及其應(yīng)用研究[D];中南大學(xué);2010年

5 于智航;改進(jìn)的密度聚類算法研究[D];大連理工大學(xué);2007年

6 宋佳;基于熵的聚類算法在蛋白質(zhì)網(wǎng)絡(luò)模塊檢測(cè)中的應(yīng)用[D];西安電子科技大學(xué);2011年

7 陽(yáng)斌;密度影響因子相關(guān)的網(wǎng)格聚類算法研究[D];浙江理工大學(xué);2014年

8 趙慧;基于網(wǎng)絡(luò)方法的聚類算法研究[D];山東師范大學(xué);2010年

9 譚穎;文本挖掘中的聚類算法研究[D];吉林大學(xué);2009年

10 劉敏娟;基于網(wǎng)格的聚類算法分析與研究[D];鄭州大學(xué);2007年



本文編號(hào):947725

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/ruanjiangongchenglunwen/947725.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶d51e6***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com