天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁(yè) > 科技論文 > 搜索引擎論文 >

基于多粒度-粒球劃分的快速k-means聚類算法研究

發(fā)布時(shí)間:2023-10-12 05:23
  k-means算法是機(jī)器學(xué)習(xí)中一種經(jīng)典的被廣泛應(yīng)用的無(wú)監(jiān)督學(xué)習(xí)算法。k-means算法在處理大規(guī)模聚類場(chǎng)景下的效率提升具有重要研究?jī)r(jià)值,本文為提升k-means算法在大數(shù)據(jù)場(chǎng)景下的效率提出了兩種改進(jìn)方案,第一種是基于粒球劃分的精確kmeans加速算法,第二種是基于近鄰信息的近似k-means加速算法。本文提出的第一種改進(jìn)k-means算法稱為Ball k-means,是一種精確加速算法,通過(guò)粒球模型來(lái)描述一個(gè)簇類。該算法主要通過(guò)減少數(shù)據(jù)點(diǎn)與聚類中心之間的不必要的距離計(jì)算從而達(dá)到降低運(yùn)行時(shí)間來(lái)提高效率的目的。該算法中的近鄰搜索方式可以準(zhǔn)確地為每個(gè)粒球找到其近鄰粒球,從而使得一個(gè)數(shù)據(jù)樣本點(diǎn)僅僅需要計(jì)算到其相鄰近的粒球的聚類中心的距離;此外,每個(gè)粒球還可以被劃分為“穩(wěn)定域”和“活動(dòng)域”,而“活動(dòng)域”可以進(jìn)一步劃分為許多“環(huán)形域”!胺(wěn)定域”中的數(shù)據(jù)點(diǎn)在當(dāng)前迭代輪次中不會(huì)更改,而“環(huán)形域”中的點(diǎn)在當(dāng)前迭代輪次中將在一些近鄰粒球之間進(jìn)行調(diào)整;另外,還設(shè)計(jì)了一種方法來(lái)降低每輪迭代中粒球球心之間的歐式距離計(jì)算;針對(duì)k-means算法在后期迭代過(guò)程中越來(lái)越多的粒球會(huì)逐漸趨于“不變”,本文提出了一種方法...

【文章頁(yè)數(shù)】:59 頁(yè)

【學(xué)位級(jí)別】:碩士

【文章目錄】:
摘要
abstract
第1章 緒論
    1.1 研究背景及意義
    1.2 研究現(xiàn)狀及存在的問(wèn)題
        1.2.1 基于初始聚類中心的改進(jìn)
        1.2.2 近似加速k-means改進(jìn)
        1.2.3 精確加速k-means改進(jìn)
        1.2.4 其它改進(jìn)方案
    1.3 論文主要工作
    1.4 論文組織結(jié)構(gòu)
第2章 相關(guān)理論介紹
    2.1 多粒度簡(jiǎn)述
    2.2 數(shù)據(jù)挖掘簡(jiǎn)述
    2.3 聚類分析方法
    2.4 k-means算法介紹
    2.5 本章小結(jié)
第3章 基于粒球的快速精確k-means算法
    3.1 概述
    3.2 近鄰粒球的搜索及粒球的劃分
        3.2.1 近鄰粒球的搜索
        3.2.2 粒球的劃分
    3.3 球心間的距離更新及迭代中的不變粒球
        3.3.1 球心間的距離更新
        3.3.2 迭代中的不變粒球
    3.4 實(shí)驗(yàn)與分析
    3.5 本章小結(jié)
第4章 基于近鄰信息的快速近似k-means算法
    4.1 概述
    4.2 搜索局部化策略
    4.3 近鄰更新方法
    4.4 實(shí)驗(yàn)及分析
    4.5 本章小結(jié)
第5章 總結(jié)與展望
    5.1 總結(jié)
    5.2 展望
參考文獻(xiàn)
致謝
攻讀碩士學(xué)位期間從事的科研工作及取得的成果



本文編號(hào):3853531

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/sousuoyinqinglunwen/3853531.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶d1566***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com