基于過采樣的非平衡入侵?jǐn)?shù)據(jù)檢測(cè)研究
發(fā)布時(shí)間:2022-01-05 10:21
針對(duì)入侵檢測(cè)系統(tǒng)對(duì)于未知攻擊訓(xùn)練較少,導(dǎo)致特定攻擊檢測(cè)率低的問題,提出一種融合最大相異系數(shù)密度的SMOTE入侵檢測(cè)方法。利用改進(jìn)合成少數(shù)類過采樣(Synthetic Minority Oversampling Technique,SMOTE)算法,結(jié)合深度信念網(wǎng)絡(luò)(Deep Belief Network,DBN)和梯度提升決策樹(Gradient Boosted Decision Tree,GBDT),解決入侵檢測(cè)系統(tǒng)中非平衡樣本分類問題。首先,在數(shù)據(jù)預(yù)處理階段應(yīng)用融合最大相異系數(shù)密度的SMOTE過采樣算法,選取鄰域半徑內(nèi)的樣本間最大相異系數(shù)平均值作為該點(diǎn)最大相異系數(shù)密度,通過類內(nèi)最大相異系數(shù)密度閾值篩選過采樣基礎(chǔ)點(diǎn)集,結(jié)合SMOTE過采樣原理倍率增加少數(shù)類數(shù)量;其次,利用DBN提取樣本低維特征,包括自下而上無監(jiān)督學(xué)習(xí)與自頂向下的有監(jiān)督微調(diào)過程;最后,利用GBDT進(jìn)行迭代決策樹構(gòu)建,通過不斷學(xué)習(xí)前者結(jié)論和殘差最終輸出學(xué)習(xí)分類結(jié)果。選用經(jīng)典入侵檢測(cè)數(shù)據(jù)集NSLKDD進(jìn)行實(shí)驗(yàn)驗(yàn)證,提取本地特權(quán)用戶進(jìn)入(Remote to Local,R2L)和遠(yuǎn)端未授權(quán)進(jìn)入(User to Root,U2...
【文章來源】:遼寧工程技術(shù)大學(xué)遼寧省
【文章頁數(shù)】:62 頁
【學(xué)位級(jí)別】:碩士
【部分圖文】:
013-2018年CNDV收錄安全漏洞數(shù)量對(duì)比圖
遼寧工程技術(shù)大學(xué)碩士學(xué)位論文1611(1)kjj=ykj=k-j+ξZ=j(3.2)分析公式3.2,保證選定的k值計(jì)算的Zy數(shù)值穩(wěn)定,使k值對(duì)應(yīng)的最大相異系數(shù)足夠小,故繪制k-Zy圖像分析最優(yōu)k值選取問題[62]。如圖3.1所示,Zy取值隨著k值增大而逐漸趨近于0,較大的k值是良好的向量相似性保證。圖3.1最大相異系數(shù)隨k變化Figure3.1Zychangeswithk3.2SMOTE過采樣算法Chawla等人[38]在2002年提出SMOTE算法,該算法是過采樣中的經(jīng)典算法。通過少數(shù)類樣本與k個(gè)近鄰間的連線隨機(jī)生成新樣本。倍數(shù)增加少數(shù)類樣本,完成少數(shù)類過采樣過程,算法詳細(xì)過程如下:(1)數(shù)據(jù)集中少數(shù)類樣本個(gè)數(shù)為T,一個(gè)少數(shù)類樣本特征向量為xi,i∈{1,...,T}。過采樣百分比為N,此處要求N必為正整數(shù),過采樣樣本數(shù)Tnew=N×T,若給定N<1,強(qiáng)制令N=1。(2)在少數(shù)類全部T個(gè)樣本中找出少數(shù)類xi的k個(gè)近鄰(歐氏距離),一般地,取k=5。尋找到的近鄰記作xi(near),near∈{1,...,k};(3)從xi(near)中隨機(jī)抽取樣本xj,j∈{1,...,k},再生成一個(gè)0到1之間的隨機(jī)浮點(diǎn)數(shù)ζ1,從而生成一個(gè)基于少數(shù)類xi的新少數(shù)類xi1。i1i1jix=x+z(x-x)(3.3)(4)將(3.3)重復(fù)進(jìn)行N次,從而生成N個(gè)新的少數(shù)類樣本xi(new),new∈{1,...,N}。
RBM結(jié)構(gòu)
【參考文獻(xiàn)】:
期刊論文
[1]深度自編碼網(wǎng)絡(luò)在入侵檢測(cè)中的應(yīng)用研究[J]. 丁紅衛(wèi),萬良,龍廷艷. 哈爾濱工業(yè)大學(xué)學(xué)報(bào). 2019(05)
[2]新的基于代價(jià)敏感集成學(xué)習(xí)的非平衡數(shù)據(jù)集分類方法NIBoost[J]. 王莉,陳紅梅,王生武. 計(jì)算機(jī)應(yīng)用. 2019(03)
[3]融合最大相異系數(shù)密度的SMOTE算法的入侵檢測(cè)方法[J]. 陳虹,肖越,肖成龍,陳建虎. 信息網(wǎng)絡(luò)安全. 2019(03)
[4]供應(yīng)鏈金融大數(shù)據(jù)分布特征的分析與洞見[J]. 劉穎. 計(jì)算機(jī)科學(xué). 2019(02)
[5]一種基于質(zhì)心空間的不均衡數(shù)據(jù)欠采樣方法[J]. 金旭,王磊,孫國梓,李華康. 計(jì)算機(jī)科學(xué). 2019(02)
[6]NLOF:基于網(wǎng)格過濾的兩階段離群點(diǎn)檢測(cè)算法[J]. 王立英,石磊,伊靜,宋天霞. 計(jì)算機(jī)應(yīng)用研究. 2020(04)
[7]面向不平衡數(shù)據(jù)集的一種基于聚類的欠采樣方法[J]. 李春雪,謝林森,盧誠波. 數(shù)學(xué)的實(shí)踐與認(rèn)識(shí). 2019(01)
[8]基于自然鄰居鄰域圖的無參數(shù)離群檢測(cè)算法[J]. 馮驥,冉瑞生,魏延. 智能系統(tǒng)學(xué)報(bào). 2019(05)
[9]基于直覺模糊集理論的IDS方法研究[J]. 邢瑞康,李成海. 計(jì)算機(jī)科學(xué). 2018(S2)
[10]空間欠采樣寬帶線性調(diào)頻信號(hào)二維DOA估計(jì)[J]. 馮浩然,阮懷林. 計(jì)算機(jī)工程. 2018(08)
碩士論文
[1]隨機(jī)森林算法的優(yōu)化研究及在文本并行分類上的應(yīng)用[D]. 張?chǎng)?南京郵電大學(xué) 2018
[2]基于深度學(xué)習(xí)的入侵檢測(cè)[D]. 楊昆朋.北京交通大學(xué) 2015
本文編號(hào):3570178
【文章來源】:遼寧工程技術(shù)大學(xué)遼寧省
【文章頁數(shù)】:62 頁
【學(xué)位級(jí)別】:碩士
【部分圖文】:
013-2018年CNDV收錄安全漏洞數(shù)量對(duì)比圖
遼寧工程技術(shù)大學(xué)碩士學(xué)位論文1611(1)kjj=ykj=k-j+ξZ=j(3.2)分析公式3.2,保證選定的k值計(jì)算的Zy數(shù)值穩(wěn)定,使k值對(duì)應(yīng)的最大相異系數(shù)足夠小,故繪制k-Zy圖像分析最優(yōu)k值選取問題[62]。如圖3.1所示,Zy取值隨著k值增大而逐漸趨近于0,較大的k值是良好的向量相似性保證。圖3.1最大相異系數(shù)隨k變化Figure3.1Zychangeswithk3.2SMOTE過采樣算法Chawla等人[38]在2002年提出SMOTE算法,該算法是過采樣中的經(jīng)典算法。通過少數(shù)類樣本與k個(gè)近鄰間的連線隨機(jī)生成新樣本。倍數(shù)增加少數(shù)類樣本,完成少數(shù)類過采樣過程,算法詳細(xì)過程如下:(1)數(shù)據(jù)集中少數(shù)類樣本個(gè)數(shù)為T,一個(gè)少數(shù)類樣本特征向量為xi,i∈{1,...,T}。過采樣百分比為N,此處要求N必為正整數(shù),過采樣樣本數(shù)Tnew=N×T,若給定N<1,強(qiáng)制令N=1。(2)在少數(shù)類全部T個(gè)樣本中找出少數(shù)類xi的k個(gè)近鄰(歐氏距離),一般地,取k=5。尋找到的近鄰記作xi(near),near∈{1,...,k};(3)從xi(near)中隨機(jī)抽取樣本xj,j∈{1,...,k},再生成一個(gè)0到1之間的隨機(jī)浮點(diǎn)數(shù)ζ1,從而生成一個(gè)基于少數(shù)類xi的新少數(shù)類xi1。i1i1jix=x+z(x-x)(3.3)(4)將(3.3)重復(fù)進(jìn)行N次,從而生成N個(gè)新的少數(shù)類樣本xi(new),new∈{1,...,N}。
RBM結(jié)構(gòu)
【參考文獻(xiàn)】:
期刊論文
[1]深度自編碼網(wǎng)絡(luò)在入侵檢測(cè)中的應(yīng)用研究[J]. 丁紅衛(wèi),萬良,龍廷艷. 哈爾濱工業(yè)大學(xué)學(xué)報(bào). 2019(05)
[2]新的基于代價(jià)敏感集成學(xué)習(xí)的非平衡數(shù)據(jù)集分類方法NIBoost[J]. 王莉,陳紅梅,王生武. 計(jì)算機(jī)應(yīng)用. 2019(03)
[3]融合最大相異系數(shù)密度的SMOTE算法的入侵檢測(cè)方法[J]. 陳虹,肖越,肖成龍,陳建虎. 信息網(wǎng)絡(luò)安全. 2019(03)
[4]供應(yīng)鏈金融大數(shù)據(jù)分布特征的分析與洞見[J]. 劉穎. 計(jì)算機(jī)科學(xué). 2019(02)
[5]一種基于質(zhì)心空間的不均衡數(shù)據(jù)欠采樣方法[J]. 金旭,王磊,孫國梓,李華康. 計(jì)算機(jī)科學(xué). 2019(02)
[6]NLOF:基于網(wǎng)格過濾的兩階段離群點(diǎn)檢測(cè)算法[J]. 王立英,石磊,伊靜,宋天霞. 計(jì)算機(jī)應(yīng)用研究. 2020(04)
[7]面向不平衡數(shù)據(jù)集的一種基于聚類的欠采樣方法[J]. 李春雪,謝林森,盧誠波. 數(shù)學(xué)的實(shí)踐與認(rèn)識(shí). 2019(01)
[8]基于自然鄰居鄰域圖的無參數(shù)離群檢測(cè)算法[J]. 馮驥,冉瑞生,魏延. 智能系統(tǒng)學(xué)報(bào). 2019(05)
[9]基于直覺模糊集理論的IDS方法研究[J]. 邢瑞康,李成海. 計(jì)算機(jī)科學(xué). 2018(S2)
[10]空間欠采樣寬帶線性調(diào)頻信號(hào)二維DOA估計(jì)[J]. 馮浩然,阮懷林. 計(jì)算機(jī)工程. 2018(08)
碩士論文
[1]隨機(jī)森林算法的優(yōu)化研究及在文本并行分類上的應(yīng)用[D]. 張?chǎng)?南京郵電大學(xué) 2018
[2]基于深度學(xué)習(xí)的入侵檢測(cè)[D]. 楊昆朋.北京交通大學(xué) 2015
本文編號(hào):3570178
本文鏈接:http://sikaile.net/kejilunwen/ruanjiangongchenglunwen/3570178.html
最近更新
教材專著