基于多粒度-粒球劃分的快速k-means聚類算法研究
發(fā)布時間:2023-10-12 05:23
k-means算法是機器學習中一種經(jīng)典的被廣泛應用的無監(jiān)督學習算法。k-means算法在處理大規(guī)模聚類場景下的效率提升具有重要研究價值,本文為提升k-means算法在大數(shù)據(jù)場景下的效率提出了兩種改進方案,第一種是基于粒球劃分的精確kmeans加速算法,第二種是基于近鄰信息的近似k-means加速算法。本文提出的第一種改進k-means算法稱為Ball k-means,是一種精確加速算法,通過粒球模型來描述一個簇類。該算法主要通過減少數(shù)據(jù)點與聚類中心之間的不必要的距離計算從而達到降低運行時間來提高效率的目的。該算法中的近鄰搜索方式可以準確地為每個粒球找到其近鄰粒球,從而使得一個數(shù)據(jù)樣本點僅僅需要計算到其相鄰近的粒球的聚類中心的距離;此外,每個粒球還可以被劃分為“穩(wěn)定域”和“活動域”,而“活動域”可以進一步劃分為許多“環(huán)形域”。“穩(wěn)定域”中的數(shù)據(jù)點在當前迭代輪次中不會更改,而“環(huán)形域”中的點在當前迭代輪次中將在一些近鄰粒球之間進行調(diào)整;另外,還設計了一種方法來降低每輪迭代中粒球球心之間的歐式距離計算;針對k-means算法在后期迭代過程中越來越多的粒球會逐漸趨于“不變”,本文提出了一種方法...
【文章頁數(shù)】:59 頁
【學位級別】:碩士
【文章目錄】:
摘要
abstract
第1章 緒論
1.1 研究背景及意義
1.2 研究現(xiàn)狀及存在的問題
1.2.1 基于初始聚類中心的改進
1.2.2 近似加速k-means改進
1.2.3 精確加速k-means改進
1.2.4 其它改進方案
1.3 論文主要工作
1.4 論文組織結(jié)構(gòu)
第2章 相關理論介紹
2.1 多粒度簡述
2.2 數(shù)據(jù)挖掘簡述
2.3 聚類分析方法
2.4 k-means算法介紹
2.5 本章小結(jié)
第3章 基于粒球的快速精確k-means算法
3.1 概述
3.2 近鄰粒球的搜索及粒球的劃分
3.2.1 近鄰粒球的搜索
3.2.2 粒球的劃分
3.3 球心間的距離更新及迭代中的不變粒球
3.3.1 球心間的距離更新
3.3.2 迭代中的不變粒球
3.4 實驗與分析
3.5 本章小結(jié)
第4章 基于近鄰信息的快速近似k-means算法
4.1 概述
4.2 搜索局部化策略
4.3 近鄰更新方法
4.4 實驗及分析
4.5 本章小結(jié)
第5章 總結(jié)與展望
5.1 總結(jié)
5.2 展望
參考文獻
致謝
攻讀碩士學位期間從事的科研工作及取得的成果
本文編號:3853531
【文章頁數(shù)】:59 頁
【學位級別】:碩士
【文章目錄】:
摘要
abstract
第1章 緒論
1.1 研究背景及意義
1.2 研究現(xiàn)狀及存在的問題
1.2.1 基于初始聚類中心的改進
1.2.2 近似加速k-means改進
1.2.3 精確加速k-means改進
1.2.4 其它改進方案
1.3 論文主要工作
1.4 論文組織結(jié)構(gòu)
第2章 相關理論介紹
2.1 多粒度簡述
2.2 數(shù)據(jù)挖掘簡述
2.3 聚類分析方法
2.4 k-means算法介紹
2.5 本章小結(jié)
第3章 基于粒球的快速精確k-means算法
3.1 概述
3.2 近鄰粒球的搜索及粒球的劃分
3.2.1 近鄰粒球的搜索
3.2.2 粒球的劃分
3.3 球心間的距離更新及迭代中的不變粒球
3.3.1 球心間的距離更新
3.3.2 迭代中的不變粒球
3.4 實驗與分析
3.5 本章小結(jié)
第4章 基于近鄰信息的快速近似k-means算法
4.1 概述
4.2 搜索局部化策略
4.3 近鄰更新方法
4.4 實驗及分析
4.5 本章小結(jié)
第5章 總結(jié)與展望
5.1 總結(jié)
5.2 展望
參考文獻
致謝
攻讀碩士學位期間從事的科研工作及取得的成果
本文編號:3853531
本文鏈接:http://sikaile.net/kejilunwen/sousuoyinqinglunwen/3853531.html
最近更新
教材專著