天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁(yè) > 科技論文 > 搜索引擎論文 >

快速搜索與密度峰值發(fā)現(xiàn)算法的研究與應(yīng)用

發(fā)布時(shí)間:2022-10-09 20:39
  聚類是無(wú)監(jiān)督機(jī)器學(xué)習(xí)的一種,在不需要先驗(yàn)知識(shí)的情況下,根據(jù)數(shù)據(jù)間的相似性將數(shù)據(jù)劃分為不同的集合,稱為類簇。聚類在自然科學(xué)、機(jī)械工程、生物醫(yī)學(xué)等眾多領(lǐng)域得到廣泛的應(yīng)用。因此,獲得一種高質(zhì)量的聚類算法對(duì)學(xué)術(shù)研究和生產(chǎn)生活都有重要的意義。根據(jù)算法分析數(shù)據(jù)的狀態(tài),聚類可以分為針對(duì)靜態(tài)數(shù)據(jù)的經(jīng)典聚類算法和針對(duì)數(shù)據(jù)流的數(shù)據(jù)流聚類算法?焖偎阉髋c密度峰值發(fā)現(xiàn)算法DP,是新近提出的基于局部密度和距離的聚類算法。該算法具有能夠發(fā)現(xiàn)任意形狀的類簇、邏輯簡(jiǎn)單易于理解、超參數(shù)少并且可以高效劃分?jǐn)?shù)據(jù)的優(yōu)點(diǎn)。但是該算法無(wú)法處理單個(gè)類簇中同時(shí)存在的多個(gè)密度峰值,以及存在數(shù)據(jù)劃分不穩(wěn)定的不足。同時(shí),當(dāng)數(shù)據(jù)分布不均勻時(shí),無(wú)法準(zhǔn)確識(shí)別稀疏類簇和小規(guī)模類簇。因此,本文聚焦于對(duì)DP算法的改進(jìn)和推廣,提高DP算法的聚類效果和使用范圍,分別提出針對(duì)靜態(tài)數(shù)據(jù)與數(shù)據(jù)流的改進(jìn)算法,本文主要內(nèi)容包括:1.針對(duì)靜態(tài)數(shù)據(jù),提出基于影響空間的穩(wěn)健密度峰值聚類算法,I-DP(Influence Space Based Robust Fast Search and Density Peak Clustering)。該改進(jìn)算法引入影響空間,制定一種... 

【文章頁(yè)數(shù)】:92 頁(yè)

【學(xué)位級(jí)別】:碩士

【文章目錄】:
摘要
ABSTRACT
第一章 緒論
    1.1 研究背景和意義
    1.2 國(guó)內(nèi)外研究現(xiàn)狀
        1.2.1 經(jīng)典聚類算法研究現(xiàn)狀
        1.2.2 數(shù)據(jù)流聚類算法研究現(xiàn)狀
    1.3 本文貢獻(xiàn)和內(nèi)容安排
        1.3.1 本文貢獻(xiàn)
        1.3.2 內(nèi)容安排
    1.4 本章小結(jié)
第二章 聚類相關(guān)概念與算法簡(jiǎn)介
    2.1 聚類算法概念
    2.2 經(jīng)典聚類算法
        2.2.1 基于劃分的聚類算法
        2.2.2 基于模型的聚類算法
        2.2.3 基于網(wǎng)格的聚類算法
        2.2.4 基于密度的聚類算法
        2.2.5 基于層次的聚類算法
    2.3 數(shù)據(jù)流聚類算法
        2.3.1 相關(guān)概念與定義
        2.3.2 包含兩階段的聚類算法
        2.3.3 包含單階段的聚類算法
    2.4 快速搜索與密度峰值發(fā)現(xiàn)算法
    2.5 算法評(píng)價(jià)方法
        2.5.1 內(nèi)部評(píng)價(jià)方法
        2.5.2 外部評(píng)價(jià)方法
    2.6 本章小結(jié)
第三章 基于影響空間的穩(wěn)健密度峰值聚類算法
    3.1 影響空間
    3.2 I-DP算法
        3.2.1 相對(duì)局部密度
        3.2.2 穩(wěn)健數(shù)據(jù)劃分策略
        3.2.3 算法流程和分析
    3.3 實(shí)驗(yàn)設(shè)計(jì)和結(jié)果分析
    3.4 本章小結(jié)
第四章 基于經(jīng)驗(yàn)數(shù)據(jù)分析的數(shù)據(jù)流密度峰值聚類算法
    4.1 經(jīng)驗(yàn)數(shù)據(jù)分析框架
    4.2 EDA-DP算法
        4.2.1 微簇
        4.2.2 相似性
        4.2.3 算法流程
    4.3 實(shí)驗(yàn)設(shè)計(jì)和結(jié)果分析
    4.4 本章小結(jié)
第五章 使用I-DP算法的文本聚類
    5.1 文本聚類相關(guān)概念
        5.1.1 預(yù)處理
        5.1.2 特征提取
    5.2 文本模型
        5.2.1 VSM模型
        5.2.2 LSI模型
        5.2.3 LDA模型
    5.3 實(shí)驗(yàn)流程
        5.3.1 實(shí)驗(yàn)平臺(tái)和語(yǔ)料選擇
        5.3.2 結(jié)果分析
    5.4 本章小結(jié)
第六章 總結(jié)與展望
    6.1 論文總結(jié)
    6.2 展望
參考文獻(xiàn)
作者在學(xué)期間所取得的科研成果
致謝


【參考文獻(xiàn)】:
期刊論文
[1]基于空間距離自適應(yīng)權(quán)重度量的粗糙K-means算法[J]. 王慧研,張騰飛,馬福民.  計(jì)算機(jī)科學(xué). 2018(07)
[2]基于LDA模型的文本聚類檢索[J]. 李霄野,李春生,李龍,張可佳.  計(jì)算機(jī)與現(xiàn)代化. 2018(06)
[3]基于LDA改進(jìn)的K-means算法在短文本聚類中的研究[J]. 馮靖,莫秀良,王春東.  天津理工大學(xué)學(xué)報(bào). 2018(03)
[4]基于密度比例的密度峰值聚類算法[J]. 高詩(shī)瑩,周曉鋒,李帥.  計(jì)算機(jī)工程與應(yīng)用. 2017(16)
[5]K近鄰優(yōu)化的密度峰值快速搜索聚類算法[J]. 謝娟英,高紅超,謝維信.  中國(guó)科學(xué):信息科學(xué). 2016(02)
[6]快速搜索與發(fā)現(xiàn)密度峰值聚類算法的優(yōu)化研究[J]. 蔣禮青,張明新,鄭金龍,戴嬌,尚趙偉.  計(jì)算機(jī)應(yīng)用研究. 2016(11)
[7]基于邊界距離的多向量文本聚類方法[J]. 蔡?hào)|風(fēng),王智超,季鐸,張桂平.  計(jì)算機(jī)工程與應(yīng)用. 2008(03)



本文編號(hào):3689319

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/sousuoyinqinglunwen/3689319.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶f16a6***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com