基于多粒度-粒球劃分的快速k-means聚類算法研究
發(fā)布時(shí)間:2023-10-12 05:23
k-means算法是機(jī)器學(xué)習(xí)中一種經(jīng)典的被廣泛應(yīng)用的無(wú)監(jiān)督學(xué)習(xí)算法。k-means算法在處理大規(guī)模聚類場(chǎng)景下的效率提升具有重要研究?jī)r(jià)值,本文為提升k-means算法在大數(shù)據(jù)場(chǎng)景下的效率提出了兩種改進(jìn)方案,第一種是基于粒球劃分的精確kmeans加速算法,第二種是基于近鄰信息的近似k-means加速算法。本文提出的第一種改進(jìn)k-means算法稱為Ball k-means,是一種精確加速算法,通過(guò)粒球模型來(lái)描述一個(gè)簇類。該算法主要通過(guò)減少數(shù)據(jù)點(diǎn)與聚類中心之間的不必要的距離計(jì)算從而達(dá)到降低運(yùn)行時(shí)間來(lái)提高效率的目的。該算法中的近鄰搜索方式可以準(zhǔn)確地為每個(gè)粒球找到其近鄰粒球,從而使得一個(gè)數(shù)據(jù)樣本點(diǎn)僅僅需要計(jì)算到其相鄰近的粒球的聚類中心的距離;此外,每個(gè)粒球還可以被劃分為“穩(wěn)定域”和“活動(dòng)域”,而“活動(dòng)域”可以進(jìn)一步劃分為許多“環(huán)形域”!胺(wěn)定域”中的數(shù)據(jù)點(diǎn)在當(dāng)前迭代輪次中不會(huì)更改,而“環(huán)形域”中的點(diǎn)在當(dāng)前迭代輪次中將在一些近鄰粒球之間進(jìn)行調(diào)整;另外,還設(shè)計(jì)了一種方法來(lái)降低每輪迭代中粒球球心之間的歐式距離計(jì)算;針對(duì)k-means算法在后期迭代過(guò)程中越來(lái)越多的粒球會(huì)逐漸趨于“不變”,本文提出了一種方法...
【文章頁(yè)數(shù)】:59 頁(yè)
【學(xué)位級(jí)別】:碩士
【文章目錄】:
摘要
abstract
第1章 緒論
1.1 研究背景及意義
1.2 研究現(xiàn)狀及存在的問(wèn)題
1.2.1 基于初始聚類中心的改進(jìn)
1.2.2 近似加速k-means改進(jìn)
1.2.3 精確加速k-means改進(jìn)
1.2.4 其它改進(jìn)方案
1.3 論文主要工作
1.4 論文組織結(jié)構(gòu)
第2章 相關(guān)理論介紹
2.1 多粒度簡(jiǎn)述
2.2 數(shù)據(jù)挖掘簡(jiǎn)述
2.3 聚類分析方法
2.4 k-means算法介紹
2.5 本章小結(jié)
第3章 基于粒球的快速精確k-means算法
3.1 概述
3.2 近鄰粒球的搜索及粒球的劃分
3.2.1 近鄰粒球的搜索
3.2.2 粒球的劃分
3.3 球心間的距離更新及迭代中的不變粒球
3.3.1 球心間的距離更新
3.3.2 迭代中的不變粒球
3.4 實(shí)驗(yàn)與分析
3.5 本章小結(jié)
第4章 基于近鄰信息的快速近似k-means算法
4.1 概述
4.2 搜索局部化策略
4.3 近鄰更新方法
4.4 實(shí)驗(yàn)及分析
4.5 本章小結(jié)
第5章 總結(jié)與展望
5.1 總結(jié)
5.2 展望
參考文獻(xiàn)
致謝
攻讀碩士學(xué)位期間從事的科研工作及取得的成果
本文編號(hào):3853531
【文章頁(yè)數(shù)】:59 頁(yè)
【學(xué)位級(jí)別】:碩士
【文章目錄】:
摘要
abstract
第1章 緒論
1.1 研究背景及意義
1.2 研究現(xiàn)狀及存在的問(wèn)題
1.2.1 基于初始聚類中心的改進(jìn)
1.2.2 近似加速k-means改進(jìn)
1.2.3 精確加速k-means改進(jìn)
1.2.4 其它改進(jìn)方案
1.3 論文主要工作
1.4 論文組織結(jié)構(gòu)
第2章 相關(guān)理論介紹
2.1 多粒度簡(jiǎn)述
2.2 數(shù)據(jù)挖掘簡(jiǎn)述
2.3 聚類分析方法
2.4 k-means算法介紹
2.5 本章小結(jié)
第3章 基于粒球的快速精確k-means算法
3.1 概述
3.2 近鄰粒球的搜索及粒球的劃分
3.2.1 近鄰粒球的搜索
3.2.2 粒球的劃分
3.3 球心間的距離更新及迭代中的不變粒球
3.3.1 球心間的距離更新
3.3.2 迭代中的不變粒球
3.4 實(shí)驗(yàn)與分析
3.5 本章小結(jié)
第4章 基于近鄰信息的快速近似k-means算法
4.1 概述
4.2 搜索局部化策略
4.3 近鄰更新方法
4.4 實(shí)驗(yàn)及分析
4.5 本章小結(jié)
第5章 總結(jié)與展望
5.1 總結(jié)
5.2 展望
參考文獻(xiàn)
致謝
攻讀碩士學(xué)位期間從事的科研工作及取得的成果
本文編號(hào):3853531
本文鏈接:http://sikaile.net/kejilunwen/sousuoyinqinglunwen/3853531.html
最近更新
教材專著