基于多窗口機(jī)制的聚類異常檢測(cè)算法
本文選題:單窗口 + 多窗口; 參考:《信息網(wǎng)絡(luò)安全》2016年11期
【摘要】:文章通過分析單窗口聚類異常檢測(cè)算法的不足,綜合利用權(quán)值、相似度和局部密度等概念對(duì)單窗口檢測(cè)出的潛在異常點(diǎn)進(jìn)行歸屬查找和異常合并,設(shè)計(jì)了一種基于多窗口機(jī)制的數(shù)據(jù)流異常檢測(cè)算法。該算法首先在單個(gè)窗口內(nèi)用改進(jìn)的K-means聚類算法對(duì)預(yù)處理之后的數(shù)據(jù)流進(jìn)行初步聚類檢測(cè),將每個(gè)窗口聚類的結(jié)果分為正常簇集合和潛在異常點(diǎn)集合。然后對(duì)單窗口檢測(cè)結(jié)果進(jìn)行二次判斷。針對(duì)單窗口檢測(cè)的潛在異常點(diǎn),利用相似度原理進(jìn)行正常類簇的歸屬查找,排除異常誤判;利用局部密度等概念,對(duì)剩下的潛在異常點(diǎn)進(jìn)行異常合并,再次排除可能的正常點(diǎn)。最后利用時(shí)間權(quán)值,綜合多個(gè)數(shù)據(jù)流窗口的檢測(cè)結(jié)果得出最終異常數(shù)據(jù)。仿真實(shí)驗(yàn)表明,相較于單窗口數(shù)據(jù)流異常檢測(cè)算法,該算法提高了數(shù)據(jù)流的異常檢測(cè)率,減少了異常誤判,在檢測(cè)率和誤報(bào)率方面更具優(yōu)勢(shì)。
[Abstract]:In this paper, by analyzing the deficiency of single window clustering anomaly detection algorithm, using the concepts of weight, similarity and local density, we can find and merge the potential outliers detected by single window. An algorithm of data stream anomaly detection based on multi-window mechanism is designed. Firstly, the improved K-means clustering algorithm is used to detect the pre-processed data stream in a single window, and the results of each window clustering are divided into normal cluster set and potential outlier point set. Then the results of single window detection are judged twice. For the potential outliers detected by single window, the homing search of normal clusters is carried out by the similarity principle, and the abnormal misjudgment is eliminated. By using the concepts of local density, the remaining potential outliers are merged and the possible normal points are eliminated again. Finally, using the time weight value, the detection results of multiple data stream windows are synthesized to obtain the final abnormal data. The simulation results show that compared with the single window data flow anomaly detection algorithm, the algorithm improves the anomaly detection rate of the data flow, reduces the abnormal error detection, and has more advantages in the detection rate and false alarm rate.
【作者單位】: 海軍工程大學(xué)信息安全系;91428部隊(duì);
【基金】:湖北省自然科學(xué)基金[2015CF867]
【分類號(hào)】:TP311.13
【相似文獻(xiàn)】
相關(guān)期刊論文 前10條
1 侯太平,顧大權(quán),王柏春,朱紅偉;遠(yuǎn)程天氣會(huì)商系統(tǒng)中的數(shù)據(jù)流處理[J];計(jì)算機(jī)工程;2003年03期
2 陳昕,宋瀚濤;基于數(shù)據(jù)流的近似查詢計(jì)算及其應(yīng)用研究[J];計(jì)算機(jī)應(yīng)用研究;2003年11期
3 陳昕,陳維興,蘇錦祥;基于數(shù)據(jù)流模式的聚集快速查詢計(jì)算研究[J];計(jì)算機(jī)集成制造系統(tǒng);2004年06期
4 張冬冬,李建中,王偉平,郭龍江;分布式復(fù)式數(shù)據(jù)流的處理[J];計(jì)算機(jī)研究與發(fā)展;2004年10期
5 王金棟;周良;張磊;丁秋林;;一類數(shù)據(jù)流連續(xù)查詢的降載策略研究[J];武漢大學(xué)學(xué)報(bào)(工學(xué)版);2005年06期
6 劉景春;;數(shù)據(jù)流分類關(guān)鍵技術(shù)研究[J];佳木斯大學(xué)學(xué)報(bào)(自然科學(xué)版);2007年01期
7 李琳;孫士兵;;數(shù)據(jù)流聚類方法發(fā)展研究[J];長(zhǎng)沙民政職業(yè)技術(shù)學(xué)院學(xué)報(bào);2008年04期
8 陳軍;周明天;楊曉燕;;數(shù)據(jù)流系統(tǒng)降載研究綜述[J];計(jì)算機(jī)應(yīng)用研究;2008年10期
9 傅鸝;魯先志;蔡斌;;一種基于數(shù)據(jù)流驅(qū)動(dòng)的數(shù)據(jù)流連續(xù)查詢模型[J];重慶工學(xué)院學(xué)報(bào)(自然科學(xué)版);2008年10期
10 David P.Misunas ,張啟瑞;數(shù)據(jù)流處理機(jī)的性能分析[J];計(jì)算機(jī)工程與應(yīng)用;1980年12期
相關(guān)會(huì)議論文 前10條
1 張冬冬;李建中;王偉平;郭龍江;;分布式復(fù)式數(shù)據(jù)流的處理[A];第二十一屆中國(guó)數(shù)據(jù)庫(kù)學(xué)術(shù)會(huì)議論文集(研究報(bào)告篇)[C];2004年
2 楚紅濤;寒楓;張燕;王婷;;基于數(shù)據(jù)流的挖掘研究[A];計(jì)算機(jī)技術(shù)與應(yīng)用進(jìn)展·2007——全國(guó)第18屆計(jì)算機(jī)技術(shù)與應(yīng)用(CACIS)學(xué)術(shù)會(huì)議論文集[C];2007年
3 尹婷;李紅燕;;窗口模型下數(shù)據(jù)流查詢流水化執(zhí)行的研究[A];第二十一屆中國(guó)數(shù)據(jù)庫(kù)學(xué)術(shù)會(huì)議論文集(技術(shù)報(bào)告篇)[C];2004年
4 孟軍;張航黎;張建英;郭禾;;分布式數(shù)據(jù)流的漸增式聚集維護(hù)算法[A];2006年全國(guó)開放式分布與并行計(jì)算學(xué)術(shù)會(huì)議論文集(二)[C];2006年
5 韓近強(qiáng);楊冬青;唐世渭;;數(shù)據(jù)流處理中一種自適應(yīng)的直方圖維護(hù)算法[A];第二十屆全國(guó)數(shù)據(jù)庫(kù)學(xué)術(shù)會(huì)議論文集(研究報(bào)告篇)[C];2003年
6 蔡致遠(yuǎn);熊方;錢衛(wèi)寧;周傲英;;核合并分析及其在數(shù)據(jù)流密度估計(jì)上的應(yīng)用[A];第二十屆全國(guó)數(shù)據(jù)庫(kù)學(xué)術(shù)會(huì)議論文集(研究報(bào)告篇)[C];2003年
7 王亦兵;楊樹強(qiáng);王曉偉;;一個(gè)面向數(shù)據(jù)流的多維分析系統(tǒng)的研究與實(shí)現(xiàn)[A];全國(guó)計(jì)算機(jī)安全學(xué)術(shù)交流會(huì)論文集(第二十四卷)[C];2009年
8 于亞新;王國(guó)仁;陳燦;蘇林;朱歆華;趙相國(guó);;基于操作符優(yōu)先級(jí)的兩種分布式數(shù)據(jù)流負(fù)載分配算法研究[A];第二十四屆中國(guó)數(shù)據(jù)庫(kù)學(xué)術(shù)會(huì)議論文集(研究報(bào)告篇)[C];2007年
9 周銳;肖川;王國(guó)仁;韓東紅;霍歡;;數(shù)據(jù)流滑動(dòng)窗口連接上的卸載技術(shù)的研究[A];第二十三屆中國(guó)數(shù)據(jù)庫(kù)學(xué)術(shù)會(huì)議論文集(技術(shù)報(bào)告篇)[C];2006年
10 田李;王樂;賈焰;鄒鵬;李愛平;;分布式數(shù)據(jù)流上低通信開銷的連續(xù)極值查詢方法研究[A];第二十四屆中國(guó)數(shù)據(jù)庫(kù)學(xué)術(shù)會(huì)議論文集(研究報(bào)告篇)[C];2007年
相關(guān)博士學(xué)位論文 前10條
1 張麗;數(shù)據(jù)流上序敏感查詢處理關(guān)鍵技術(shù)研究[D];國(guó)防科學(xué)技術(shù)大學(xué);2013年
2 王超;時(shí)間序列數(shù)據(jù)流復(fù)雜模式挖掘研究[D];合肥工業(yè)大學(xué);2015年
3 李颯;數(shù)據(jù)流軟聚類理論及其在瓦斯災(zāi)害預(yù)警中的應(yīng)用[D];遼寧工程技術(shù)大學(xué);2014年
4 陳華輝;基于遺忘特性的數(shù)據(jù)流概要結(jié)構(gòu)及其應(yīng)用研究[D];復(fù)旦大學(xué);2008年
5 孔英會(huì);數(shù)據(jù)流技術(shù)及其在電力信息處理中的應(yīng)用研究[D];華北電力大學(xué)(河北);2009年
6 崇志宏;基于屏蔽/匯總技術(shù)的數(shù)據(jù)流處理算法[D];復(fù)旦大學(xué);2006年
7 姚遠(yuǎn);海量動(dòng)態(tài)數(shù)據(jù)流分類方法研究[D];大連理工大學(xué);2013年
8 曹振麗;面向養(yǎng)殖環(huán)境監(jiān)測(cè)的數(shù)據(jù)流處理方法研究[D];中國(guó)農(nóng)業(yè)大學(xué);2015年
9 朱輝生;基于情節(jié)規(guī)則匹配的數(shù)據(jù)流預(yù)測(cè)研究[D];復(fù)旦大學(xué);2011年
10 袁志堅(jiān);數(shù)據(jù)流突發(fā)檢測(cè)若干關(guān)鍵技術(shù)研究[D];國(guó)防科學(xué)技術(shù)大學(xué);2008年
相關(guān)碩士學(xué)位論文 前10條
1 王川;面向位置服務(wù)的物聯(lián)網(wǎng)數(shù)據(jù)質(zhì)量保證方法研究[D];南京理工大學(xué);2015年
2 祝然威;基于時(shí)間窗口的數(shù)據(jù)流頻繁項(xiàng)挖掘算法[D];復(fù)旦大學(xué);2014年
3 邱孝兵;基于GPU的數(shù)據(jù)流聚類及相關(guān)性分析[D];大連理工大學(xué);2015年
4 張野;數(shù)據(jù)流查詢語(yǔ)言中語(yǔ)法分析器的設(shè)計(jì)[D];電子科技大學(xué);2015年
5 閆新院;基于概要模型的數(shù)據(jù)流聚合技術(shù)研究[D];西安電子科技大學(xué);2014年
6 王濤;基于Ntrip協(xié)議的實(shí)時(shí)數(shù)據(jù)流軟件的設(shè)計(jì)與實(shí)現(xiàn)[D];西安電子科技大學(xué);2014年
7 陳彬;數(shù)據(jù)流實(shí)時(shí)存儲(chǔ)關(guān)鍵技術(shù)[D];浙江工業(yè)大學(xué);2015年
8 王高洋;基于網(wǎng)格和加速粒子群優(yōu)化的數(shù)據(jù)流聚類算法研究[D];哈爾濱師范大學(xué);2015年
9 錢海振;大數(shù)據(jù)流滯后相關(guān)性挖掘方法[D];遼寧師范大學(xué);2015年
10 劉祥佳;制造物聯(lián)海量數(shù)據(jù)流模式挖掘算法研究[D];廣東工業(yè)大學(xué);2016年
,本文編號(hào):2062784
本文鏈接:http://sikaile.net/kejilunwen/ruanjiangongchenglunwen/2062784.html