改進的密度峰值聚類算法研究
發(fā)布時間:2021-01-24 21:41
密度峰值聚類算法是一種通過尋找密度峰值實現(xiàn)快速聚類的新穎算法,具有實現(xiàn)簡單、所需參數(shù)少、能處理非凸數(shù)據(jù)、聚類效果良好等優(yōu)點。憑借以上優(yōu)點,密度峰值聚類算法為很多現(xiàn)實問題提供了新的解決思路,并且被應用到眾多領(lǐng)域,已成為聚類領(lǐng)域的一個研究熱點。然而,由于其還存在無法自動識別聚類中心、對類簇間密度相差較大的數(shù)據(jù)集還不能有效處理等問題,本文設(shè)計了相應的改進算法,提高了密度峰值算法的性能。具體研究內(nèi)容如下:(1)針對密度峰值算法關(guān)于聚類中心的人工識別問題,提出了一種聚類中心自動識別的密度峰值聚類算法。首先,設(shè)計了一種適用于不同規(guī)模數(shù)據(jù)集的基于貢獻度的密度度量方法,以便能精密地度量數(shù)據(jù)點的密度并優(yōu)化決策圖的分布。然后,根據(jù)決策圖上密度與距離的分布特性,設(shè)計了新的聚類中心選取方法,能夠自動地將那些密度與距離均較大的數(shù)據(jù)點選取為局部聚類中心,進而形成局部的聚類結(jié)果。最后,根據(jù)局部類簇之間的共享邊界密度信息,將局部聚類自動地合并為全局聚類。實驗結(jié)果表明,新提出的算法不但能自動地識別出局部聚類中心,并且能夠準確地將局部聚類合并為全局聚類,實現(xiàn)了對數(shù)據(jù)集的自動聚類,解決了密度峰值算法在聚類過程中需要人工選取...
【文章來源】:西安電子科技大學陜西省 211工程院校 教育部直屬院校
【文章頁數(shù)】:79 頁
【學位級別】:碩士
【文章目錄】:
摘要
ABSTRACT
符號對照表
縮略語對照表
第一章 緒論
1.1 研究背景及意義
1.2 國內(nèi)外研究現(xiàn)狀
1.3 密度峰值聚類算法存在的問題
1.4 本文的主要研究內(nèi)容
1.5 本文組織結(jié)構(gòu)
第二章 聚類基礎(chǔ)知識介紹
2.1 聚類分析的基本概念
2.1.1 聚類步驟及形式化描述
2.1.2 常用的相似性度量方法
2.1.3 本文所用的聚類評價指標
2.2 常用的聚類算法
2.2.1 基于劃分的聚類算法
2.2.2 基于層次的聚類算法
2.2.3 基于密度的聚類算法
2.2.4 基于網(wǎng)格的聚類算法
2.2.5 基于模型的聚類算法
2.2.6 近鄰傳播算法
2.3 密度峰值聚類算法
2.3.1 算法思想
2.3.2 算法步驟
2.4 本章小結(jié)
第三章 一種聚類中心自動識別的密度峰值聚類算法
3.1 問題描述
3.2 一種聚類中心自動識別的密度峰值聚類算法
3.2.1 考慮貢獻度的密度度量方法
3.2.2 識別局部聚類中心
3.2.3 合并局部聚類
3.2.4 算法步驟
3.2.5 算法復雜度分析
3.3 實驗結(jié)果及分析
3.3.1 人造數(shù)據(jù)集實驗
3.3.2 UCI數(shù)據(jù)集實驗
3.4 本章小結(jié)
第四章 基于K近鄰的密度峰值聚類算法
4.1 問題描述
4.2 K近鄰算法介紹
4.3 基于K近鄰的密度峰值聚類算法
4.3.1 考慮數(shù)據(jù)點空間分布的密度度量方法
4.3.2 數(shù)據(jù)點分配
4.3.3 算法步驟
4.3.4 算法復雜度分析
4.4 實驗結(jié)果及分析
4.4.1 人造數(shù)據(jù)集實驗
4.4.2 UCI數(shù)據(jù)集實驗
4.5 本章小結(jié)
第五章 總結(jié)與展望
5.1 全文總結(jié)
5.2 工作展望
參考文獻
致謝
作者簡介
【參考文獻】:
期刊論文
[1]基于密度比例的密度峰值聚類算法[J]. 高詩瑩,周曉鋒,李帥. 計算機工程與應用. 2017(16)
[2]一種基于網(wǎng)格的密度峰值聚類算法[J]. 王飛,王國胤,李智星,彭思源. 小型微型計算機系統(tǒng). 2017(05)
[3]基于流形距離的密度峰值快速搜索聚類算法[J]. 張嘉琪,張紅云. 電腦知識與技術(shù). 2017(02)
[4]Clustering by Fast Search and Find of Density Peaks with Data Field[J]. WANG Shuliang,WANG Dakui,LI Caoyuan,LI Yan,DING Gangyi. Chinese Journal of Electronics. 2016(03)
[5]基于點距離和密度峰值聚類的社區(qū)發(fā)現(xiàn)方法[J]. 黃嵐,李玉,王貴參,王巖. 吉林大學學報(工學版). 2016(06)
[6]自動確定聚類中心的密度峰聚類[J]. 李濤,葛洪偉,蘇樹智. 計算機科學與探索. 2016(11)
本文編號:2997982
【文章來源】:西安電子科技大學陜西省 211工程院校 教育部直屬院校
【文章頁數(shù)】:79 頁
【學位級別】:碩士
【文章目錄】:
摘要
ABSTRACT
符號對照表
縮略語對照表
第一章 緒論
1.1 研究背景及意義
1.2 國內(nèi)外研究現(xiàn)狀
1.3 密度峰值聚類算法存在的問題
1.4 本文的主要研究內(nèi)容
1.5 本文組織結(jié)構(gòu)
第二章 聚類基礎(chǔ)知識介紹
2.1 聚類分析的基本概念
2.1.1 聚類步驟及形式化描述
2.1.2 常用的相似性度量方法
2.1.3 本文所用的聚類評價指標
2.2 常用的聚類算法
2.2.1 基于劃分的聚類算法
2.2.2 基于層次的聚類算法
2.2.3 基于密度的聚類算法
2.2.4 基于網(wǎng)格的聚類算法
2.2.5 基于模型的聚類算法
2.2.6 近鄰傳播算法
2.3 密度峰值聚類算法
2.3.1 算法思想
2.3.2 算法步驟
2.4 本章小結(jié)
第三章 一種聚類中心自動識別的密度峰值聚類算法
3.1 問題描述
3.2 一種聚類中心自動識別的密度峰值聚類算法
3.2.1 考慮貢獻度的密度度量方法
3.2.2 識別局部聚類中心
3.2.3 合并局部聚類
3.2.4 算法步驟
3.2.5 算法復雜度分析
3.3 實驗結(jié)果及分析
3.3.1 人造數(shù)據(jù)集實驗
3.3.2 UCI數(shù)據(jù)集實驗
3.4 本章小結(jié)
第四章 基于K近鄰的密度峰值聚類算法
4.1 問題描述
4.2 K近鄰算法介紹
4.3 基于K近鄰的密度峰值聚類算法
4.3.1 考慮數(shù)據(jù)點空間分布的密度度量方法
4.3.2 數(shù)據(jù)點分配
4.3.3 算法步驟
4.3.4 算法復雜度分析
4.4 實驗結(jié)果及分析
4.4.1 人造數(shù)據(jù)集實驗
4.4.2 UCI數(shù)據(jù)集實驗
4.5 本章小結(jié)
第五章 總結(jié)與展望
5.1 全文總結(jié)
5.2 工作展望
參考文獻
致謝
作者簡介
【參考文獻】:
期刊論文
[1]基于密度比例的密度峰值聚類算法[J]. 高詩瑩,周曉鋒,李帥. 計算機工程與應用. 2017(16)
[2]一種基于網(wǎng)格的密度峰值聚類算法[J]. 王飛,王國胤,李智星,彭思源. 小型微型計算機系統(tǒng). 2017(05)
[3]基于流形距離的密度峰值快速搜索聚類算法[J]. 張嘉琪,張紅云. 電腦知識與技術(shù). 2017(02)
[4]Clustering by Fast Search and Find of Density Peaks with Data Field[J]. WANG Shuliang,WANG Dakui,LI Caoyuan,LI Yan,DING Gangyi. Chinese Journal of Electronics. 2016(03)
[5]基于點距離和密度峰值聚類的社區(qū)發(fā)現(xiàn)方法[J]. 黃嵐,李玉,王貴參,王巖. 吉林大學學報(工學版). 2016(06)
[6]自動確定聚類中心的密度峰聚類[J]. 李濤,葛洪偉,蘇樹智. 計算機科學與探索. 2016(11)
本文編號:2997982
本文鏈接:http://sikaile.net/kejilunwen/ruanjiangongchenglunwen/2997982.html
最近更新
教材專著