基于近鄰傳播聚類的離群檢測(cè)算法在入侵檢測(cè)中的應(yīng)用研究
本文選題:離群檢測(cè) + 近鄰傳播 ; 參考:《合肥工業(yè)大學(xué)》2017年碩士論文
【摘要】:近年來(lái),數(shù)據(jù)挖掘中的許多方向都取得了不小的突破,在入侵檢測(cè)領(lǐng)域也取得了不小的成果。但是在大多數(shù)研究的算法僅僅是針對(duì)數(shù)據(jù)集做一般模式的研究,然而在某些時(shí)候看來(lái)一些與數(shù)據(jù)集中大多數(shù)數(shù)據(jù)模式和行為不一致的數(shù)據(jù)點(diǎn),也存在著非常重要的研究?jī)r(jià)值,這些點(diǎn)被稱為離群點(diǎn),由少量離群點(diǎn)組成的簇被稱為離群簇。在數(shù)據(jù)挖掘中,使用某些算法將數(shù)據(jù)集中這些離群點(diǎn)或者離群簇檢測(cè)出來(lái)的方法叫做離群檢測(cè)。在網(wǎng)絡(luò)環(huán)境中,網(wǎng)絡(luò)入侵行為通常是網(wǎng)絡(luò)行為中比例非常小的一部分行為,并且這部分行為會(huì)對(duì)網(wǎng)絡(luò)環(huán)境帶來(lái)一定的危害而且該行為本身就有別于正常行為,所以可以說(shuō)網(wǎng)絡(luò)入侵也屬于離群行為。因此,這種特性為離群檢測(cè)應(yīng)用到入侵檢測(cè)中提供了理論上的可行性。本文主要研究了基于近鄰傳播聚類的離群檢測(cè)算法在入侵檢測(cè)中的應(yīng)用,詳細(xì)介紹與分析國(guó)內(nèi)外常用的離群檢測(cè)算法,并對(duì)近鄰傳播算法做了詳細(xì)的介紹;證明了該算法應(yīng)用于離群檢測(cè)的可行性,提出了基于近鄰傳播聚類的離群檢測(cè)算法;并設(shè)計(jì)了基于離群檢測(cè)的入侵檢測(cè)算法模型與流程,通過(guò)AP算法先對(duì)數(shù)據(jù)集進(jìn)行聚類然后進(jìn)行聚類劃分并計(jì)算離群指數(shù),挖掘出入侵行為。通過(guò)一些列實(shí)驗(yàn),驗(yàn)證了本文提出算法的有效性。本文的主要工作如下:(1)深入的研究了離群檢測(cè)技術(shù),分析了離群檢測(cè)技術(shù)的現(xiàn)狀,詳細(xì)的闡述了離群檢測(cè)技術(shù)的各種方法,并分析了這些方法的優(yōu)缺點(diǎn)。(2)詳細(xì)的介紹了近鄰傳播聚類算法,針對(duì)近鄰傳播算法的特點(diǎn)以及離群檢測(cè)的特性與環(huán)境,驗(yàn)證了近鄰傳播算法應(yīng)用于離群檢測(cè)的可行性,提出了基于近鄰傳播聚類的離群檢測(cè)算法。(3)深入的研究了入侵檢測(cè)相關(guān)技術(shù),并針對(duì)基于離群檢測(cè)的入侵檢測(cè)提出了相對(duì)應(yīng)的算法模型與流程。(4)設(shè)計(jì)了基于近鄰傳播聚類的離群檢測(cè)算法應(yīng)用于入侵檢測(cè)的實(shí)驗(yàn)方案,對(duì)網(wǎng)絡(luò)入侵檢測(cè)數(shù)據(jù)集KDD CUP 99進(jìn)行了研究分析,并將算法與數(shù)據(jù)集用于實(shí)驗(yàn),驗(yàn)證算法的效果。本文提出的ODAP算法應(yīng)用于入侵檢測(cè)環(huán)境中,并根據(jù)實(shí)驗(yàn)的準(zhǔn)確率等指標(biāo)進(jìn)行評(píng)估。實(shí)驗(yàn)表明,基于近鄰傳播聚類的離群檢測(cè)算法在入侵檢測(cè)中有較好的效果。
[Abstract]:In recent years, great breakthroughs have been made in many fields of data mining, and great achievements have been made in the field of intrusion detection. However, in most researches, the algorithms only focus on the general schema of the data set. However, in some cases, some data points that are inconsistent with most of the data patterns and behaviors in the data set also have very important research value. These points are called outliers, and clusters composed of a few outliers are called outliers. In data mining, using some algorithms to detect outliers or outliers in data sets is called outlier detection. In the network environment, the network intrusion behavior is usually a very small part of the network behavior, and this part of the behavior will bring some harm to the network environment and the behavior itself is different from the normal behavior. So it can be said that network intrusion also belongs to outlier behavior. Therefore, this feature provides a theoretical feasibility for outlier detection in intrusion detection. This paper mainly studies the application of outlier detection algorithm based on nearest neighbor propagation clustering in intrusion detection, introduces and analyzes the common outlier detection algorithms at home and abroad in detail, and introduces the nearest neighbor propagation algorithm in detail. The feasibility of applying this algorithm to outlier detection is proved, and an outlier detection algorithm based on nearest neighbor propagation clustering is proposed, and an intrusion detection algorithm model and flow chart based on outlier detection are designed. First, the data set is clustered by AP algorithm, then the outlier index is calculated and the intrusion behavior is mined. The validity of the proposed algorithm is verified by some column experiments. The main work of this paper is as follows: (1) the outlier detection technology is deeply studied, the current situation of outlier detection technology is analyzed, and the various methods of outlier detection technology are described in detail. The advantages and disadvantages of these methods are analyzed. (2) the nearest neighbor propagation clustering algorithm is introduced in detail. According to the characteristics of the nearest neighbor propagation algorithm and the characteristics and environment of outlier detection, the feasibility of applying the nearest neighbor propagation algorithm to outlier detection is verified. An outlier detection algorithm based on nearest neighbor propagation clustering is proposed. Based on outlier detection, the corresponding algorithm model and flow chart are proposed. An experimental scheme of outlier detection based on nearest neighbor propagation clustering is designed. The network intrusion detection data set KDD CUP 99 is studied and analyzed, and the algorithm and data set are used in experiments to verify the effect of the algorithm. The ODAP algorithm proposed in this paper is applied to the intrusion detection environment and is evaluated according to the experimental accuracy. Experiments show that the outlier detection algorithm based on nearest neighbor propagation clustering is effective in intrusion detection.
【學(xué)位授予單位】:合肥工業(yè)大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2017
【分類號(hào)】:TP311.13;TP393.08
【相似文獻(xiàn)】
相關(guān)期刊論文 前10條
1 魏藜,宮學(xué)慶,錢衛(wèi)寧,周傲英;高維空間中的離群點(diǎn)發(fā)現(xiàn)[J];軟件學(xué)報(bào);2002年02期
2 薛安榮;姚林;鞠時(shí)光;陳偉鶴;馬漢達(dá);;離群點(diǎn)挖掘方法綜述[J];計(jì)算機(jī)科學(xué);2008年11期
3 李存華;;l_∞度量意義下的離群點(diǎn)檢測(cè)[J];淮海工學(xué)院學(xué)報(bào)(自然科學(xué)版);2008年02期
4 李昕;顏學(xué)峰;;融合離群點(diǎn)判別的穩(wěn)態(tài)檢測(cè)方法及其應(yīng)用[J];華東理工大學(xué)學(xué)報(bào)(自然科學(xué)版);2009年01期
5 封海岳;薛安榮;;基于重疊模塊度的社區(qū)離群點(diǎn)檢測(cè)[J];計(jì)算機(jī)應(yīng)用與軟件;2013年05期
6 王柏鈞,王力勤;《穩(wěn)健回歸與離群點(diǎn)檢測(cè)》介紹[J];成都?xì)庀髮W(xué)院學(xué)報(bào);1989年04期
7 黃添強(qiáng);秦小麟;葉飛躍;;基于方形鄰域的離群點(diǎn)查找新方法[J];控制與決策;2006年05期
8 熊君麗;;高維空間下基于密度的離群點(diǎn)探測(cè)算法實(shí)現(xiàn)[J];現(xiàn)代電子技術(shù);2006年15期
9 黃添強(qiáng);秦小麟;王欽敏;;空間離群點(diǎn)的模型與跳躍取樣查找算法[J];中國(guó)圖象圖形學(xué)報(bào);2006年09期
10 陳光平;葉東毅;;一種改進(jìn)的離群點(diǎn)檢測(cè)方法[J];福州大學(xué)學(xué)報(bào)(自然科學(xué)版);2007年03期
相關(guān)會(huì)議論文 前9條
1 張鋒;常會(huì)友;;茫然第三方支持的隱私保持離群點(diǎn)探測(cè)協(xié)議[A];第二十四屆中國(guó)數(shù)據(jù)庫(kù)學(xué)術(shù)會(huì)議論文集(研究報(bào)告篇)[C];2007年
2 連鳳娜;吳錦林;薛永生;;一種改進(jìn)的基于距離的離群挖掘算法[A];第二十四屆中國(guó)數(shù)據(jù)庫(kù)學(xué)術(shù)會(huì)議論文集(技術(shù)報(bào)告篇)[C];2007年
3 梁雪琴;劉紅生;代秀梅;周亞芬;;聚類離群點(diǎn)挖掘技術(shù)在內(nèi)部審計(jì)信息化中的應(yīng)用——一個(gè)來(lái)自商業(yè)銀行信用卡審計(jì)的實(shí)例[A];全國(guó)內(nèi)部審計(jì)理論研討優(yōu)秀論文集(2013)[C];2014年
4 于浩;王斌;肖剛;楊曉春;;基于距離的不確定離群點(diǎn)檢測(cè)[A];第26屆中國(guó)數(shù)據(jù)庫(kù)學(xué)術(shù)會(huì)議論文集(A輯)[C];2009年
5 許龍飛;熊君麗;段敏;;基于粗糙集的高維空間離群點(diǎn)發(fā)現(xiàn)算法研究[A];第二十屆全國(guó)數(shù)據(jù)庫(kù)學(xué)術(shù)會(huì)議論文集(技術(shù)報(bào)告篇)[C];2003年
6 劉文遠(yuǎn);李振平;王寶文;裴繼輝;;一種多維數(shù)據(jù)的離群點(diǎn)檢測(cè)算法[A];2007年全國(guó)第十一屆企業(yè)信息化與工業(yè)工程學(xué)術(shù)會(huì)議論文集[C];2007年
7 魏藜;錢衛(wèi)寧;周傲英;;HOT:尋找高維空間中的離群點(diǎn)[A];第十八屆全國(guó)數(shù)據(jù)庫(kù)學(xué)術(shù)會(huì)議論文集(研究報(bào)告篇)[C];2001年
8 周紅福;錢衛(wèi)寧;魏藜;周傲英;;EDOLOIS:高效準(zhǔn)確的子空間局部離群點(diǎn)發(fā)現(xiàn)[A];第二十屆全國(guó)數(shù)據(jù)庫(kù)學(xué)術(shù)會(huì)議論文集(研究報(bào)告篇)[C];2003年
9 魏藜;錢衛(wèi)寧;周傲英;;SLOT:基于估計(jì)的高效子空間局部離群點(diǎn)發(fā)現(xiàn)[A];第十九屆全國(guó)數(shù)據(jù)庫(kù)學(xué)術(shù)會(huì)議論文集(研究報(bào)告篇)[C];2002年
相關(guān)博士學(xué)位論文 前10條
1 劉莘;基于時(shí)空分析的CCS泄漏預(yù)警關(guān)鍵技術(shù)研究[D];中國(guó)礦業(yè)大學(xué);2016年
2 劉露;異質(zhì)信息網(wǎng)絡(luò)中離群點(diǎn)檢測(cè)方法研究[D];吉林大學(xué);2017年
3 楊鵬;離群檢測(cè)及其優(yōu)化算法研究[D];重慶大學(xué);2010年
4 林海;離群檢測(cè)及離群釋義空間查找算法研究[D];重慶大學(xué);2012年
5 薛安榮;空間離群點(diǎn)挖掘技術(shù)的研究[D];江蘇大學(xué);2008年
6 楊茂林;離群檢測(cè)算法研究[D];華中科技大學(xué);2012年
7 金義富;高維稀疏離群數(shù)據(jù)集延伸知識(shí)發(fā)現(xiàn)研究[D];重慶大學(xué);2007年
8 雷大江;離群檢測(cè)與離群釋義算法研究[D];重慶大學(xué);2012年
9 萬(wàn)家強(qiáng);基于連通性的離群檢測(cè)與聚類研究[D];重慶大學(xué);2014年
10 唐向紅;數(shù)據(jù)流離群點(diǎn)檢測(cè)研究[D];華中科技大學(xué);2010年
相關(guān)碩士學(xué)位論文 前10條
1 韓紅霞;基于距離離群點(diǎn)的分析與研究[D];江蘇大學(xué);2007年
2 黃馨玉;基于鄰域重心變化的離群點(diǎn)檢測(cè)算法研究[D];遼寧大學(xué);2015年
3 程百球;基于EP模式的離群點(diǎn)發(fā)現(xiàn)[D];安慶師范學(xué)院;2015年
4 歐陽(yáng)根平;Hadoop云平臺(tái)下基于離群點(diǎn)挖掘的入侵檢測(cè)技術(shù)研究[D];電子科技大學(xué);2015年
5 鄧璇;數(shù)據(jù)流挖掘關(guān)鍵技術(shù)研究與實(shí)現(xiàn)[D];電子科技大學(xué);2015年
6 周瑩瑩;利用離群點(diǎn)檢測(cè)改進(jìn)協(xié)同過(guò)濾推薦算法[D];南京郵電大學(xué);2015年
7 陳娟;基于離群特征提取和能量計(jì)算的SVM股市預(yù)測(cè)研究[D];合肥工業(yè)大學(xué);2014年
8 張友強(qiáng);基于選擇性集成學(xué)習(xí)的離群點(diǎn)檢測(cè)研究[D];青島科技大學(xué);2016年
9 王美晶;基于PSO算法的離群點(diǎn)檢測(cè)方法研究[D];福州大學(xué);2013年
10 關(guān)皓文;基于離群點(diǎn)檢測(cè)方法的醫(yī)保異常發(fā)現(xiàn)[D];山東大學(xué);2016年
,本文編號(hào):1866360
本文鏈接:http://sikaile.net/guanlilunwen/ydhl/1866360.html