基于傳遞距離的密度峰值聚類算法研究
發(fā)布時(shí)間:2021-06-15 22:16
聚類是一個(gè)無監(jiān)督分類技術(shù),根據(jù)數(shù)據(jù)元素間的相似關(guān)系,將數(shù)據(jù)劃分到不同的團(tuán)簇中。通過分析聚類結(jié)果,觀察不同團(tuán)簇的分布規(guī)律,能夠發(fā)現(xiàn)數(shù)據(jù)背后隱藏的規(guī)律。隨著社會(huì)信息化的發(fā)展,聚類分析在社會(huì)生活中發(fā)揮著越來越重要的作用,已廣泛應(yīng)用于社會(huì)多個(gè)領(lǐng)域。數(shù)據(jù)規(guī)模的快速增長(zhǎng)和多樣化,提出適應(yīng)能力更強(qiáng)的聚類算法成為當(dāng)前急需解決的問題;诿芏鹊木垲愃惴苓m用于任意形狀數(shù)據(jù)的聚類,具有較強(qiáng)抗噪聲能力,成為近年來聚類算法研究的方向。密度峰值聚類算法(Clustering by fast search and find of density peak,CFSFDP)是Alex Rodriguez提出的基于密度的聚類算法。該算法思想簡(jiǎn)單、聚類效果好、時(shí)間效率高,在一些數(shù)據(jù)集上獲得了不錯(cuò)的聚類效果,但該算法依然存在一些不足:(1)CFSFDP算法基于假設(shè):中心結(jié)點(diǎn)被密度比它小的結(jié)點(diǎn)包圍,中心結(jié)點(diǎn)到比它密度大的結(jié)點(diǎn)距離較遠(yuǎn)。該假設(shè)認(rèn)為同一團(tuán)簇中只有一個(gè)密度峰值,當(dāng)團(tuán)簇中有多個(gè)密度峰值時(shí),該算法容易將一個(gè)團(tuán)簇錯(cuò)誤劃分為多個(gè)團(tuán)簇,不適用于團(tuán)簇中有多個(gè)密度峰值的數(shù)據(jù)集。(2)截?cái)嗑嚯x是CFSFDP算法中的唯一參數(shù),截?cái)嗑?..
【文章來源】:西南大學(xué)重慶市 211工程院校 教育部直屬院校
【文章頁數(shù)】:66 頁
【學(xué)位級(jí)別】:碩士
【部分圖文】:
傳遞距離示意圖
gauss數(shù)據(jù)集PBDBI和DBI指標(biāo)值變化情況
cyclic數(shù)據(jù)集PBDBI和DBI指標(biāo)值變化情況
【參考文獻(xiàn)】:
期刊論文
[1]基于劃分的聚類算法研究綜述[J]. 賈璦瑋. 電子設(shè)計(jì)工程. 2014(23)
[2]聚類有效性評(píng)價(jià)綜述[J]. 楊燕,靳蕃,KAMEL Mohamed. 計(jì)算機(jī)應(yīng)用研究. 2008(06)
碩士論文
[1]基于密度峰值聚類的兩種改進(jìn)算法的研究[D]. 晏煥錢.蘭州大學(xué) 2018
[2]基于傳遞距離的度量學(xué)習(xí)和聚類算法研究[D]. 戴天辰.揚(yáng)州大學(xué) 2018
[3]一類基于密度的聚類算法研究[D]. 逄琳.山東師范大學(xué) 2017
本文編號(hào):3231862
【文章來源】:西南大學(xué)重慶市 211工程院校 教育部直屬院校
【文章頁數(shù)】:66 頁
【學(xué)位級(jí)別】:碩士
【部分圖文】:
傳遞距離示意圖
gauss數(shù)據(jù)集PBDBI和DBI指標(biāo)值變化情況
cyclic數(shù)據(jù)集PBDBI和DBI指標(biāo)值變化情況
【參考文獻(xiàn)】:
期刊論文
[1]基于劃分的聚類算法研究綜述[J]. 賈璦瑋. 電子設(shè)計(jì)工程. 2014(23)
[2]聚類有效性評(píng)價(jià)綜述[J]. 楊燕,靳蕃,KAMEL Mohamed. 計(jì)算機(jī)應(yīng)用研究. 2008(06)
碩士論文
[1]基于密度峰值聚類的兩種改進(jìn)算法的研究[D]. 晏煥錢.蘭州大學(xué) 2018
[2]基于傳遞距離的度量學(xué)習(xí)和聚類算法研究[D]. 戴天辰.揚(yáng)州大學(xué) 2018
[3]一類基于密度的聚類算法研究[D]. 逄琳.山東師范大學(xué) 2017
本文編號(hào):3231862
本文鏈接:http://sikaile.net/kejilunwen/ruanjiangongchenglunwen/3231862.html
最近更新
教材專著