基于多粒度-粒球劃分的快速k-means聚類算法研究

發(fā)布時(shí)間：2023-10-12 05:23

　　k-means算法是機(jī)器學(xué)習(xí)中一種經(jīng)典的被廣泛應(yīng)用的無(wú)監(jiān)督學(xué)習(xí)算法。k-means算法在處理大規(guī)模聚類場(chǎng)景下的效率提升具有重要研究?jī)r(jià)值,本文為提升k-means算法在大數(shù)據(jù)場(chǎng)景下的效率提出了兩種改進(jìn)方案,第一種是基于粒球劃分的精確kmeans加速算法,第二種是基于近鄰信息的近似k-means加速算法。本文提出的第一種改進(jìn)k-means算法稱為Ball k-means,是一種精確加速算法,通過(guò)粒球模型來(lái)描述一個(gè)簇類。該算法主要通過(guò)減少數(shù)據(jù)點(diǎn)與聚類中心之間的不必要的距離計(jì)算從而達(dá)到降低運(yùn)行時(shí)間來(lái)提高效率的目的。該算法中的近鄰搜索方式可以準(zhǔn)確地為每個(gè)粒球找到其近鄰粒球,從而使得一個(gè)數(shù)據(jù)樣本點(diǎn)僅僅需要計(jì)算到其相鄰近的粒球的聚類中心的距離;此外,每個(gè)粒球還可以被劃分為“穩(wěn)定域”和“活動(dòng)域”,而“活動(dòng)域”可以進(jìn)一步劃分為許多“環(huán)形域”�！胺€(wěn)定域”中的數(shù)據(jù)點(diǎn)在當(dāng)前迭代輪次中不會(huì)更改,而“環(huán)形域”中的點(diǎn)在當(dāng)前迭代輪次中將在一些近鄰粒球之間進(jìn)行調(diào)整;另外,還設(shè)計(jì)了一種方法來(lái)降低每輪迭代中粒球球心之間的歐式距離計(jì)算;針對(duì)k-means算法在后期迭代過(guò)程中越來(lái)越多的粒球會(huì)逐漸趨于“不變”,本文提出了一種方法...

【文章頁(yè)數(shù)】：59 頁(yè)

【學(xué)位級(jí)別】：碩士

【文章目錄】：
摘要
abstract
第1章緒論
    1.1 研究背景及意義
    1.2 研究現(xiàn)狀及存在的問(wèn)題
        1.2.1 基于初始聚類中心的改進(jìn)
        1.2.2 近似加速k-means改進(jìn)
        1.2.3 精確加速k-means改進(jìn)
        1.2.4 其它改進(jìn)方案
    1.3 論文主要工作
    1.4 論文組織結(jié)構(gòu)
第2章相關(guān)理論介紹
    2.1 多粒度簡(jiǎn)述
    2.2 數(shù)據(jù)挖掘簡(jiǎn)述
    2.3 聚類分析方法
    2.4 k-means算法介紹
    2.5 本章小結(jié)
第3章基于粒球的快速精確k-means算法
    3.1 概述
    3.2 近鄰粒球的搜索及粒球的劃分
        3.2.1 近鄰粒球的搜索
        3.2.2 粒球的劃分
    3.3 球心間的距離更新及迭代中的不變粒球
        3.3.1 球心間的距離更新
        3.3.2 迭代中的不變粒球
    3.4 實(shí)驗(yàn)與分析
    3.5 本章小結(jié)
第4章基于近鄰信息的快速近似k-means算法
    4.1 概述
    4.2 搜索局部化策略
    4.3 近鄰更新方法
    4.4 實(shí)驗(yàn)及分析
    4.5 本章小結(jié)
第5章總結(jié)與展望
    5.1 總結(jié)
    5.2 展望
參考文獻(xiàn)
致謝
攻讀碩士學(xué)位期間從事的科研工作及取得的成果

本文編號(hào)：3853531

資料下載

論文發(fā)表

支付寶下載

Download by Alipay
微信下載

Download by Wechat
會(huì)員下載

Download by Member

本文鏈接：http://sikaile.net/kejilunwen/sousuoyinqinglunwen/3853531.html

上一篇：基于無(wú)人機(jī)海上協(xié)同搜救關(guān)鍵技術(shù)研究
下一篇：知識(shí)圖譜在裝備大數(shù)據(jù)上的典型應(yīng)用

論文發(fā)表

·知網(wǎng)|萬(wàn)方|維普|龍?jiān)磡省級(jí)|國(guó)家級(jí)|科技核心|北大核心|南大核心CSSCI|EI|SCI|SSCI|

天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

基于多粒度-粒球劃分的快速k-means聚類算法研究