高效且支持多查詢的離群點(diǎn)檢測方法研究
發(fā)布時(shí)間:2023-02-09 14:35
隨著互聯(lián)網(wǎng)技術(shù)的進(jìn)步,數(shù)據(jù)挖掘這一學(xué)術(shù)領(lǐng)域正在日益發(fā)展,離群點(diǎn)檢測作為其重要組成部分之一,目的是找出異常的數(shù)據(jù)信息。迄今為止,離群點(diǎn)檢測的相關(guān)技術(shù)已經(jīng)在網(wǎng)絡(luò)安全、社會(huì)分析等諸多領(lǐng)域中被應(yīng)用。在離群點(diǎn)檢測系統(tǒng)中,隨著上層業(yè)務(wù)的不斷拓展,系統(tǒng)在同一時(shí)間段內(nèi)所接收到的查詢請求不斷增多,而處理的時(shí)效性要求也不斷提高,這也對(duì)離群點(diǎn)檢測算法的性能提出更高的要求。而現(xiàn)有的離群點(diǎn)檢測算法絕大多數(shù)都是面向單個(gè)查詢,這使得系統(tǒng)在短時(shí)間內(nèi)處理大量查詢請求時(shí)的性能不佳,降低了用戶的使用體驗(yàn)感。因此,本文主要針對(duì)離群點(diǎn)檢測的多查詢問題展開了相關(guān)研究,主要貢獻(xiàn)點(diǎn)如下:(1)提出了一種面向單查詢的高效離群點(diǎn)檢測算法——RODASQ(R-tree Outlier Detection Algorithm-Single Query)。首先,該算法對(duì)傳統(tǒng)的空間索引R樹進(jìn)行擴(kuò)展,即為R樹中的每個(gè)結(jié)點(diǎn)添加了密度屬性,并提出了一種估算數(shù)據(jù)點(diǎn)離群度的新型方法。然后將離群點(diǎn)在空間中的存在特性與擴(kuò)展后的R樹索引相結(jié)合,通過從R樹中選出較小密度的結(jié)點(diǎn),并優(yōu)先計(jì)算該結(jié)點(diǎn)內(nèi)離群度較大的數(shù)據(jù)點(diǎn),能夠快速地在初始時(shí)確定一個(gè)...
【文章頁數(shù)】:64 頁
【學(xué)位級(jí)別】:碩士
【文章目錄】:
摘要
Abstract
1 緒論
1.1 研究背景與研究意義
1.2 相關(guān)研究工作
1.2.1 面向單查詢的離群點(diǎn)檢測
1.2.2 面向多查詢的離群點(diǎn)檢測
1.3 主要貢獻(xiàn)
1.4 論文各章節(jié)安排
2 相關(guān)理論及技術(shù)介紹
2.1 基于距離的離群點(diǎn)相關(guān)定義
2.2 基于距離的離群點(diǎn)檢測相關(guān)算法
2.2.1 基于嵌套循環(huán)的離群點(diǎn)檢測算法
2.2.2 基于索引的離群點(diǎn)檢測算法
2.2.3 基于單元的離群點(diǎn)檢測算法
2.3 閾值
2.4 本章小結(jié)
3 面向單查詢的離群點(diǎn)檢測算法
3.1 基于R樹的基準(zhǔn)處理框架
3.2 面向單查詢的離群點(diǎn)檢測算法描述
3.2.1 R樹的擴(kuò)展
3.2.2 結(jié)點(diǎn)選擇方法
3.2.3 數(shù)據(jù)點(diǎn)選擇方法
3.2.4 面向單查詢的算法描述
3.3 本章小結(jié)
4 面向多查詢的離群點(diǎn)檢測算法
4.1 面向多查詢的離群點(diǎn)檢測算法描述
4.1.1 查詢?nèi)蝿?wù)分組
4.1.2 組內(nèi)多離群點(diǎn)檢測的算法描述
4.2 本章小結(jié)
5 實(shí)驗(yàn)對(duì)比分析
5.1 實(shí)驗(yàn)方法及環(huán)境
5.2 真實(shí)數(shù)據(jù)集中的實(shí)驗(yàn)結(jié)果
5.3 人工合成數(shù)據(jù)集中的實(shí)驗(yàn)結(jié)果
5.3.1 面向單查詢的算法性能對(duì)比
5.3.2 面向多查詢的算法性能對(duì)比
5.4 本章小結(jié)
結(jié)論
參考文獻(xiàn)
致謝
作者簡歷及攻讀碩士學(xué)位期間的科研成果
本文編號(hào):3738899
【文章頁數(shù)】:64 頁
【學(xué)位級(jí)別】:碩士
【文章目錄】:
摘要
Abstract
1 緒論
1.1 研究背景與研究意義
1.2 相關(guān)研究工作
1.2.1 面向單查詢的離群點(diǎn)檢測
1.2.2 面向多查詢的離群點(diǎn)檢測
1.3 主要貢獻(xiàn)
1.4 論文各章節(jié)安排
2 相關(guān)理論及技術(shù)介紹
2.1 基于距離的離群點(diǎn)相關(guān)定義
2.2 基于距離的離群點(diǎn)檢測相關(guān)算法
2.2.1 基于嵌套循環(huán)的離群點(diǎn)檢測算法
2.2.2 基于索引的離群點(diǎn)檢測算法
2.2.3 基于單元的離群點(diǎn)檢測算法
2.3 閾值
2.4 本章小結(jié)
3 面向單查詢的離群點(diǎn)檢測算法
3.1 基于R樹的基準(zhǔn)處理框架
3.2 面向單查詢的離群點(diǎn)檢測算法描述
3.2.1 R樹的擴(kuò)展
3.2.2 結(jié)點(diǎn)選擇方法
3.2.3 數(shù)據(jù)點(diǎn)選擇方法
3.2.4 面向單查詢的算法描述
3.3 本章小結(jié)
4 面向多查詢的離群點(diǎn)檢測算法
4.1 面向多查詢的離群點(diǎn)檢測算法描述
4.1.1 查詢?nèi)蝿?wù)分組
4.1.2 組內(nèi)多離群點(diǎn)檢測的算法描述
4.2 本章小結(jié)
5 實(shí)驗(yàn)對(duì)比分析
5.1 實(shí)驗(yàn)方法及環(huán)境
5.2 真實(shí)數(shù)據(jù)集中的實(shí)驗(yàn)結(jié)果
5.3 人工合成數(shù)據(jù)集中的實(shí)驗(yàn)結(jié)果
5.3.1 面向單查詢的算法性能對(duì)比
5.3.2 面向多查詢的算法性能對(duì)比
5.4 本章小結(jié)
結(jié)論
參考文獻(xiàn)
致謝
作者簡歷及攻讀碩士學(xué)位期間的科研成果
本文編號(hào):3738899
本文鏈接:http://sikaile.net/shoufeilunwen/xixikjs/3738899.html
最近更新
教材專著