天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

多維數(shù)據(jù)中基于密度的離群點(diǎn)檢測(cè)算法研究

發(fā)布時(shí)間:2021-05-10 22:58
  離群點(diǎn)檢測(cè)是數(shù)據(jù)挖掘領(lǐng)域的熱點(diǎn)問(wèn)題之一,在許多應(yīng)用場(chǎng)景中都扮演著重要角色,如醫(yī)療診斷、道路監(jiān)測(cè)、信用卡欺詐、網(wǎng)絡(luò)入侵和環(huán)境監(jiān)測(cè)等領(lǐng)域,F(xiàn)有離群點(diǎn)檢測(cè)方法主要應(yīng)用于低維數(shù)據(jù)場(chǎng)景,但隨著維度的不斷增長(zhǎng),傳統(tǒng)離群點(diǎn)檢測(cè)方法受到維度的影響,無(wú)法有效檢測(cè)離群點(diǎn),同時(shí)算法效率降低,無(wú)法滿足用戶日益增長(zhǎng)的需求。為了檢測(cè)出多維數(shù)據(jù)中的離群點(diǎn),本文對(duì)傳統(tǒng)離群點(diǎn)檢測(cè)算法進(jìn)行了對(duì)比分析和總結(jié),選擇基于密度的定義,并提出了一種針對(duì)多維數(shù)據(jù)的離群點(diǎn)檢測(cè)算法DODMD。為了解決多維空間數(shù)據(jù)稀疏的問(wèn)題,文中采用空間填充曲線將數(shù)據(jù)從多維空間映射到低維空間,并根據(jù)映射后的數(shù)據(jù)構(gòu)建ZH-tree索引結(jié)構(gòu),以有效管理多維數(shù)據(jù)。ZH-tree有兩個(gè)優(yōu)點(diǎn):1)其聚類屬性可以有效的幫助搜索數(shù)據(jù)對(duì)象的鄰居。2)其層次結(jié)構(gòu)可以有效的進(jìn)行空間剪枝,以過(guò)濾掉不可能是鄰居的數(shù)據(jù)。在原有的ZH-tree基礎(chǔ)上進(jìn)行改進(jìn),引入微簇的概念,將每個(gè)葉子節(jié)點(diǎn)看作一個(gè)微簇,并以微簇為單位進(jìn)行計(jì)算,達(dá)到批量過(guò)濾的目的。基于ZH-tree檢測(cè)多維數(shù)據(jù)中的離群點(diǎn),它包括兩個(gè)階段:1)在ZH-tree構(gòu)建完成后,通過(guò)一個(gè)貪婪的方法保存離群值較大的點(diǎn),并計(jì)算每個(gè)... 

【文章來(lái)源】:大連海事大學(xué)遼寧省 211工程院校

【文章頁(yè)數(shù)】:66 頁(yè)

【學(xué)位級(jí)別】:碩士

【文章目錄】:
摘要
Abstract
1 緒論
    1.1 研究背景及意義
    1.2 國(guó)內(nèi)外研究現(xiàn)狀
    1.3 本文主要工作及組織結(jié)構(gòu)
        1.3.1 主要工作
        1.3.2 論文組織結(jié)構(gòu)
    1.4 本章小結(jié)
2 離群點(diǎn)檢測(cè)相關(guān)知識(shí)
    2.1 離群點(diǎn)概述
        2.1.1 離群點(diǎn)的分類
        2.1.2 離群點(diǎn)檢測(cè)的應(yīng)用場(chǎng)景
    2.2 離群點(diǎn)檢測(cè)方法
        2.2.1 簡(jiǎn)單數(shù)據(jù)離群點(diǎn)檢測(cè)方法
        2.2.2 多維數(shù)據(jù)離群點(diǎn)檢測(cè)方法
    2.3 本章小結(jié)
3 多維數(shù)據(jù)中基于密度的離群點(diǎn)檢測(cè)算法
    3.1 基于LOF的離群點(diǎn)檢測(cè)算法
    3.2 基于空間填充曲線的索引構(gòu)建
        3.2.1 Z曲線
        3.2.2 ZH-tree索引構(gòu)建算法
    3.3 基于ZH-tree的kNN搜索算法
    3.4 DODMD過(guò)濾細(xì)化算法
        3.4.1 問(wèn)題描述及相關(guān)概念
        3.4.2 獲得LOF_(min)
        3.4.3 過(guò)濾細(xì)化算法
    3.5 本章小結(jié)
4 多維數(shù)據(jù)中基于密度的離群點(diǎn)檢測(cè)系統(tǒng)
    4.1 標(biāo)準(zhǔn)化模塊
    4.2 預(yù)處理模塊
    4.3 計(jì)算處理模塊
    4.4 過(guò)濾模塊
    4.5 系統(tǒng)實(shí)現(xiàn)
        4.5.1 預(yù)處理
        4.5.2 查詢處理
    4.6 本章小結(jié)
5 實(shí)驗(yàn)結(jié)果與分析
    5.1 真實(shí)數(shù)據(jù)集上的實(shí)驗(yàn)結(jié)果分析
        5.1.1 數(shù)據(jù)集描述
        5.1.2 AUC性能分析
        5.1.3 ROC曲線分析
    5.2 人工合成數(shù)據(jù)集上的實(shí)驗(yàn)結(jié)果分析
        5.2.1 數(shù)據(jù)集描述
        5.2.2 時(shí)間效率分析
    5.3 本章小結(jié)
6 總結(jié)和展望
    6.1 工作總結(jié)
    6.2 工作展望
參考文獻(xiàn)
致謝



本文編號(hào):3180215

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/shengwushengchang/3180215.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶9fba3***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com