基于近鄰圖分析的譜聚類算法的研究
發(fā)布時(shí)間:2023-11-20 17:50
譜聚類算法(Spectral clustering)是基于譜圖理論的經(jīng)典聚類算法之一,而屬于K-way譜聚類算法的NJW(Ng-Jordan-Weiss)算法因其框架簡(jiǎn)單而廣受關(guān)注。該算法可通過(guò)歐氏距離建立樣本間的相似性度量矩陣W;雖然歐氏距離的度量方式簡(jiǎn)單,容易理解,可用于大多數(shù)據(jù)類型。但是,歐氏距離是基于每個(gè)獨(dú)立的樣本,樣本間的關(guān)系都是直接獲取,所建立的樣本度量也是基于樣本全局。樣本之間的關(guān)聯(lián)比較單一,不能充分描述樣本間的局部特征,使建立的相似性特征描述不完整,不能完全反映樣本之間的關(guān)系。除此之外,傳統(tǒng)的K近鄰算法中的K值都是通過(guò)多次實(shí)驗(yàn)獲得的經(jīng)驗(yàn)值,很難證明其為最佳值,所以容易陷入局部最優(yōu)。為了解決以上問(wèn)題,本文基于近鄰圖分析,對(duì)譜聚類算法進(jìn)行研究,主要作了以下工作:第一,針對(duì)歐氏距離相似性度量方法的不足,提出一種基于K閾值的相似性度量的譜聚類算法;算法充分參考了各種樣本區(qū)域的特性,利用K閾值的方式建立局部樣本之間的聯(lián)系,并在這些局部關(guān)聯(lián)的基礎(chǔ)上用最短路徑建立全局連通圖,然后以局部樣本標(biāo)準(zhǔn)差作為高斯核的取值。該算法很好的克服了以歐氏距離建立聯(lián)系時(shí),對(duì)樣本局部細(xì)節(jié)特征的忽視。第二,...
【文章頁(yè)數(shù)】:63 頁(yè)
【學(xué)位級(jí)別】:碩士
【文章目錄】:
摘要
Abstract
第1章 緒論
1.1 研究背景
1.2 國(guó)內(nèi)外研究現(xiàn)狀
1.3 本論文的研究成果和章節(jié)安排
第2章 基本理論
2.1 聚類
2.1.1 聚類定義
2.1.2 聚類分析的概況
2.2 譜聚類
2.2.1 譜聚類算法中的割集準(zhǔn)則
2.2.2 譜聚類算法中的參量
2.2.3 譜聚類算法的分類
2.2.4 譜聚類算法的實(shí)現(xiàn)步驟
2.3 k-均值算法
2.4 K近鄰
2.5 最短路徑
2.6 本章小結(jié)
第3章 基于K閾值的相似性度量的譜聚類算法
3.1 距離度量
3.1.1 基于K近鄰的距離度量
3.1.2 基于K近鄰的閾值選取
3.2 基于閾值篩選的高斯核
3.3 基于閾值篩選的加權(quán)項(xiàng)
3.4 實(shí)驗(yàn)以及結(jié)果分析
3.4.1 NEW-SC的算法框架
3.4.2 實(shí)驗(yàn)數(shù)據(jù)
3.4.3 性能測(cè)量
3.4.4 人工數(shù)據(jù)集實(shí)驗(yàn)結(jié)果
3.4.5 對(duì)UCI數(shù)據(jù)集的聚類分析
3.5 本章小結(jié)
第4章 自定義K值的相似性度量的譜聚類
4.1 基于自定義的K近鄰
4.2 實(shí)驗(yàn)以及結(jié)果分析
4.2.1 算法框架
4.2.2 人工數(shù)據(jù)集實(shí)驗(yàn)結(jié)果
4.3 對(duì)UCI數(shù)據(jù)集的聚類分析
4.4 本章小結(jié)
第5章 總結(jié)與展望
5.1 文章總結(jié)
5.2 未來(lái)與展望
參考文獻(xiàn)
致謝
攻讀碩士學(xué)位期間的科研成果
本文編號(hào):3865538
【文章頁(yè)數(shù)】:63 頁(yè)
【學(xué)位級(jí)別】:碩士
【文章目錄】:
摘要
Abstract
第1章 緒論
1.1 研究背景
1.2 國(guó)內(nèi)外研究現(xiàn)狀
1.3 本論文的研究成果和章節(jié)安排
第2章 基本理論
2.1 聚類
2.1.1 聚類定義
2.1.2 聚類分析的概況
2.2 譜聚類
2.2.1 譜聚類算法中的割集準(zhǔn)則
2.2.2 譜聚類算法中的參量
2.2.3 譜聚類算法的分類
2.2.4 譜聚類算法的實(shí)現(xiàn)步驟
2.3 k-均值算法
2.4 K近鄰
2.5 最短路徑
2.6 本章小結(jié)
第3章 基于K閾值的相似性度量的譜聚類算法
3.1 距離度量
3.1.1 基于K近鄰的距離度量
3.1.2 基于K近鄰的閾值選取
3.2 基于閾值篩選的高斯核
3.3 基于閾值篩選的加權(quán)項(xiàng)
3.4 實(shí)驗(yàn)以及結(jié)果分析
3.4.1 NEW-SC的算法框架
3.4.2 實(shí)驗(yàn)數(shù)據(jù)
3.4.3 性能測(cè)量
3.4.4 人工數(shù)據(jù)集實(shí)驗(yàn)結(jié)果
3.4.5 對(duì)UCI數(shù)據(jù)集的聚類分析
3.5 本章小結(jié)
第4章 自定義K值的相似性度量的譜聚類
4.1 基于自定義的K近鄰
4.2 實(shí)驗(yàn)以及結(jié)果分析
4.2.1 算法框架
4.2.2 人工數(shù)據(jù)集實(shí)驗(yàn)結(jié)果
4.3 對(duì)UCI數(shù)據(jù)集的聚類分析
4.4 本章小結(jié)
第5章 總結(jié)與展望
5.1 文章總結(jié)
5.2 未來(lái)與展望
參考文獻(xiàn)
致謝
攻讀碩士學(xué)位期間的科研成果
本文編號(hào):3865538
本文鏈接:http://sikaile.net/kejilunwen/ruanjiangongchenglunwen/3865538.html
最近更新
教材專著