基于傳遞距離的密度峰值聚類算法研究
發(fā)布時間:2021-06-15 22:16
聚類是一個無監(jiān)督分類技術(shù),根據(jù)數(shù)據(jù)元素間的相似關(guān)系,將數(shù)據(jù)劃分到不同的團簇中。通過分析聚類結(jié)果,觀察不同團簇的分布規(guī)律,能夠發(fā)現(xiàn)數(shù)據(jù)背后隱藏的規(guī)律。隨著社會信息化的發(fā)展,聚類分析在社會生活中發(fā)揮著越來越重要的作用,已廣泛應(yīng)用于社會多個領(lǐng)域。數(shù)據(jù)規(guī)模的快速增長和多樣化,提出適應(yīng)能力更強的聚類算法成為當前急需解決的問題。基于密度的聚類算法能適用于任意形狀數(shù)據(jù)的聚類,具有較強抗噪聲能力,成為近年來聚類算法研究的方向。密度峰值聚類算法(Clustering by fast search and find of density peak,CFSFDP)是Alex Rodriguez提出的基于密度的聚類算法。該算法思想簡單、聚類效果好、時間效率高,在一些數(shù)據(jù)集上獲得了不錯的聚類效果,但該算法依然存在一些不足:(1)CFSFDP算法基于假設(shè):中心結(jié)點被密度比它小的結(jié)點包圍,中心結(jié)點到比它密度大的結(jié)點距離較遠。該假設(shè)認為同一團簇中只有一個密度峰值,當團簇中有多個密度峰值時,該算法容易將一個團簇錯誤劃分為多個團簇,不適用于團簇中有多個密度峰值的數(shù)據(jù)集。(2)截斷距離是CFSFDP算法中的唯一參數(shù),截斷距...
【文章來源】:西南大學重慶市 211工程院校 教育部直屬院校
【文章頁數(shù)】:66 頁
【學位級別】:碩士
【部分圖文】:
傳遞距離示意圖
gauss數(shù)據(jù)集PBDBI和DBI指標值變化情況
cyclic數(shù)據(jù)集PBDBI和DBI指標值變化情況
【參考文獻】:
期刊論文
[1]基于劃分的聚類算法研究綜述[J]. 賈璦瑋. 電子設(shè)計工程. 2014(23)
[2]聚類有效性評價綜述[J]. 楊燕,靳蕃,KAMEL Mohamed. 計算機應(yīng)用研究. 2008(06)
碩士論文
[1]基于密度峰值聚類的兩種改進算法的研究[D]. 晏煥錢.蘭州大學 2018
[2]基于傳遞距離的度量學習和聚類算法研究[D]. 戴天辰.揚州大學 2018
[3]一類基于密度的聚類算法研究[D]. 逄琳.山東師范大學 2017
本文編號:3231862
【文章來源】:西南大學重慶市 211工程院校 教育部直屬院校
【文章頁數(shù)】:66 頁
【學位級別】:碩士
【部分圖文】:
傳遞距離示意圖
gauss數(shù)據(jù)集PBDBI和DBI指標值變化情況
cyclic數(shù)據(jù)集PBDBI和DBI指標值變化情況
【參考文獻】:
期刊論文
[1]基于劃分的聚類算法研究綜述[J]. 賈璦瑋. 電子設(shè)計工程. 2014(23)
[2]聚類有效性評價綜述[J]. 楊燕,靳蕃,KAMEL Mohamed. 計算機應(yīng)用研究. 2008(06)
碩士論文
[1]基于密度峰值聚類的兩種改進算法的研究[D]. 晏煥錢.蘭州大學 2018
[2]基于傳遞距離的度量學習和聚類算法研究[D]. 戴天辰.揚州大學 2018
[3]一類基于密度的聚類算法研究[D]. 逄琳.山東師范大學 2017
本文編號:3231862
本文鏈接:http://sikaile.net/kejilunwen/ruanjiangongchenglunwen/3231862.html
最近更新
教材專著