天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁(yè) > 科技論文 > 軟件論文 >

高維數(shù)據(jù)的離群點(diǎn)檢測(cè)算法分析與研究

發(fā)布時(shí)間:2023-03-19 06:45
  離群點(diǎn)檢測(cè)是數(shù)據(jù)挖掘的一個(gè)重要分支。過(guò)濾數(shù)據(jù)集中的噪聲和挖掘數(shù)據(jù)集中的潛在的、有意義的信息,使得離群點(diǎn)檢測(cè)具有重要的現(xiàn)實(shí)意義和廣闊的應(yīng)用前景。在信息技術(shù)和網(wǎng)絡(luò)快速發(fā)展的時(shí)代,高維大數(shù)據(jù)的應(yīng)用隨處可見(jiàn)。在高維大數(shù)據(jù)應(yīng)用場(chǎng)景下,對(duì)數(shù)據(jù)進(jìn)行全維分析時(shí),數(shù)據(jù)變得稀疏,真實(shí)的離群點(diǎn)被多維度的噪聲影響所掩蓋。面對(duì)高維數(shù)據(jù),傳統(tǒng)的離群點(diǎn)檢測(cè)方法難以有效的檢測(cè)數(shù)據(jù)中的離群點(diǎn),并且算法的效率也會(huì)變低。因此,搜索與離群點(diǎn)相關(guān)的子空間和挖掘高維數(shù)據(jù)中的離群點(diǎn),已成為高維離群點(diǎn)檢測(cè)算法的研究熱點(diǎn)。本文對(duì)已有的離群點(diǎn)檢測(cè)方法進(jìn)行了分析和討論,并介紹了面向高維數(shù)據(jù)常用的解決方法。本文以高維大數(shù)據(jù)為背景,研究了兩種離群點(diǎn)檢測(cè)算法,主要工作如下:首先,本文提出了一種隨機(jī)哈希分割森林的高維離群點(diǎn)檢測(cè)算法,該算法利用局部敏感哈希算法和樹(shù)結(jié)構(gòu)。局部敏感哈希算法能夠?qū)⑾嘟臄?shù)據(jù)實(shí)例散列到同一個(gè)桶中。然后,根據(jù)數(shù)據(jù)實(shí)例所在桶中的實(shí)例個(gè)數(shù)來(lái)衡量該實(shí)例的異常性。與隔離森林的思想相似,本算法使用樹(shù)結(jié)構(gòu)來(lái)對(duì)數(shù)據(jù)集進(jìn)行分割。在每一次劃分?jǐn)?shù)據(jù)過(guò)程中,都會(huì)隨機(jī)的選擇一個(gè)屬性作為劃分屬性,在該屬性上使用局部敏感哈希算法做哈希映射,在該屬性上具...

【文章頁(yè)數(shù)】:79 頁(yè)

【學(xué)位級(jí)別】:碩士

【文章目錄】:
摘要
ABSTRACT
注釋表
縮略詞
第一章 緒論
    1.1 研究背景及意義
        1.1.1 研究背景
        1.1.2 研究意義
    1.2 研究現(xiàn)狀
    1.3 本文主要工作及組織結(jié)構(gòu)
        1.3.1 主要工作
        1.3.2 組織結(jié)構(gòu)
    1.4 本章小結(jié)
第二章 相關(guān)理論研究基礎(chǔ)與技術(shù)應(yīng)用分析
    2.1 離群點(diǎn)的定義
    2.2 離群點(diǎn)檢測(cè)方法
        2.2.1 基于統(tǒng)計(jì)的離群點(diǎn)檢測(cè)方法
        2.2.2 基于距離的離群點(diǎn)檢測(cè)方法
        2.2.3 基于密度的離群點(diǎn)檢測(cè)方法
        2.2.4 基于聚類的離群點(diǎn)檢測(cè)方法
        2.2.5 基于深度的離群點(diǎn)檢測(cè)算法
    2.3 高維離群點(diǎn)檢測(cè)方法
        2.3.1 引言
        2.3.2 高維數(shù)據(jù)的挑戰(zhàn)
        2.3.3 基于低維投影的離群點(diǎn)檢測(cè)方法
        2.3.4 基于相關(guān)子空間的離群點(diǎn)檢測(cè)方法
        2.3.5 基于集成的子空間離群點(diǎn)檢測(cè)方法
    2.4 離群點(diǎn)檢測(cè)的實(shí)際應(yīng)用
    2.5 離群點(diǎn)檢測(cè)算法的性能評(píng)價(jià)指標(biāo)
        2.5.1 準(zhǔn)確率 (Precision)
        2.5.2 召回率 (Recall)
        2.5.3 ROC曲線
        2.5.4 AUC
    2.6 本章小結(jié)
第三章 基于隨機(jī)哈希分割森林的離群點(diǎn)檢測(cè)算法
    3.1 引言
    3.2 問(wèn)題描述
    3.3 局部敏感哈希算法
    3.4 算法設(shè)計(jì)
        3.4.1 算法思想
        3.4.2 算法描述
    3.5 實(shí)驗(yàn)設(shè)計(jì)及結(jié)果分析
        3.5.1 實(shí)驗(yàn)設(shè)計(jì)
        3.5.2 實(shí)驗(yàn)結(jié)果分析
    3.6 本章小結(jié)
第四章 基于順序集成的相關(guān)子空間選擇算法
    4.1 引言
    4.2 問(wèn)題描述
    4.3 算法設(shè)計(jì)
        4.3.1 算法思想
        4.3.2 閾值函數(shù)
        4.3.3 稀疏回歸函數(shù)
        4.3.4 算法描述
    4.4 實(shí)驗(yàn)設(shè)計(jì)及結(jié)果分析
        4.4.1 實(shí)驗(yàn)設(shè)計(jì)
        4.4.2 實(shí)驗(yàn)結(jié)果分析
    4.5 本章小結(jié)
第五章 總結(jié)和展望
    5.1 總結(jié)
    5.2 展望
參考文獻(xiàn)
致謝
在學(xué)期間的研究成果及學(xué)術(shù)論文情況



本文編號(hào):3764775

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/ruanjiangongchenglunwen/3764775.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶4d8c7***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com