面向數(shù)據(jù)流的異常檢測技術研究
發(fā)布時間:2024-01-28 08:18
網(wǎng)絡空間安全始終是研究者關注的重點,尤其是在網(wǎng)絡設備升級,寬帶提速的今天,如何在復雜的網(wǎng)絡數(shù)據(jù)流下,有效地發(fā)現(xiàn)異常數(shù)據(jù)是當前安全領域的主要問題之一。傳統(tǒng)的面向靜態(tài)數(shù)據(jù)集的數(shù)據(jù)挖掘算法首先將數(shù)據(jù)集全部加載到內(nèi)存,通過對數(shù)據(jù)集的多次遍歷以建立靜態(tài)的分析模型,這個過程需要大量的時間和空間開銷。數(shù)據(jù)流具有數(shù)據(jù)分布動態(tài)變化、數(shù)據(jù)體積潛在無窮、數(shù)據(jù)持續(xù)到達等特征。這些特征要求數(shù)據(jù)流挖掘算法能夠在有限的內(nèi)存下通過單次遍歷數(shù)據(jù)建立初始模型,且該模型能夠及時地對后續(xù)到達的數(shù)據(jù)做出相應處理,動態(tài)調(diào)整以適應變化的數(shù)據(jù)流,F(xiàn)有的異常檢測技術大多基于傳統(tǒng)的數(shù)據(jù)挖掘算法,雖然能夠在靜態(tài)的數(shù)據(jù)集上獲得較好的結果,但是無法應用于動態(tài)的數(shù)據(jù)流環(huán)境;谏鲜龇治龊捅容^,本文針對數(shù)據(jù)流環(huán)境下的異常檢測技術進行相應研究,并做出如下工作:(1)本文闡述了數(shù)據(jù)流的概念和定義,分析了動態(tài)數(shù)據(jù)流環(huán)境對挖掘算法的要求和存在的問題,總結了數(shù)據(jù)流挖掘的主要任務和常用算法。數(shù)據(jù)流是一個由連續(xù)的數(shù)據(jù)對象構成的序列,這些數(shù)據(jù)通常持續(xù)到達,具有高維特征,潛在的數(shù)據(jù)分布存在變化。相較于傳統(tǒng)機器學習技術,數(shù)據(jù)流挖掘算法通常只記錄數(shù)據(jù)粗略的統(tǒng)計信息,單...
【文章頁數(shù)】:63 頁
【學位級別】:碩士
本文編號:3887375
【文章頁數(shù)】:63 頁
【學位級別】:碩士
圖2.3時間窗口技術??
圖3.4不同數(shù)據(jù)量下聚類效果對比??
圖3.5不同數(shù)據(jù)量下時間開銷對比??
圖3.6不同類別數(shù)量下聚類效果對比??
本文編號:3887375
本文鏈接:http://sikaile.net/guanlilunwen/ydhl/3887375.html
最近更新
教材專著