基于過采樣的非平衡入侵數(shù)據(jù)檢測研究
發(fā)布時間:2022-01-05 10:21
針對入侵檢測系統(tǒng)對于未知攻擊訓練較少,導致特定攻擊檢測率低的問題,提出一種融合最大相異系數(shù)密度的SMOTE入侵檢測方法。利用改進合成少數(shù)類過采樣(Synthetic Minority Oversampling Technique,SMOTE)算法,結(jié)合深度信念網(wǎng)絡(luò)(Deep Belief Network,DBN)和梯度提升決策樹(Gradient Boosted Decision Tree,GBDT),解決入侵檢測系統(tǒng)中非平衡樣本分類問題。首先,在數(shù)據(jù)預處理階段應用融合最大相異系數(shù)密度的SMOTE過采樣算法,選取鄰域半徑內(nèi)的樣本間最大相異系數(shù)平均值作為該點最大相異系數(shù)密度,通過類內(nèi)最大相異系數(shù)密度閾值篩選過采樣基礎(chǔ)點集,結(jié)合SMOTE過采樣原理倍率增加少數(shù)類數(shù)量;其次,利用DBN提取樣本低維特征,包括自下而上無監(jiān)督學習與自頂向下的有監(jiān)督微調(diào)過程;最后,利用GBDT進行迭代決策樹構(gòu)建,通過不斷學習前者結(jié)論和殘差最終輸出學習分類結(jié)果。選用經(jīng)典入侵檢測數(shù)據(jù)集NSLKDD進行實驗驗證,提取本地特權(quán)用戶進入(Remote to Local,R2L)和遠端未授權(quán)進入(User to Root,U2...
【文章來源】:遼寧工程技術(shù)大學遼寧省
【文章頁數(shù)】:62 頁
【學位級別】:碩士
【部分圖文】:
013-2018年CNDV收錄安全漏洞數(shù)量對比圖
遼寧工程技術(shù)大學碩士學位論文1611(1)kjj=ykj=k-j+ξZ=j(3.2)分析公式3.2,保證選定的k值計算的Zy數(shù)值穩(wěn)定,使k值對應的最大相異系數(shù)足夠小,故繪制k-Zy圖像分析最優(yōu)k值選取問題[62]。如圖3.1所示,Zy取值隨著k值增大而逐漸趨近于0,較大的k值是良好的向量相似性保證。圖3.1最大相異系數(shù)隨k變化Figure3.1Zychangeswithk3.2SMOTE過采樣算法Chawla等人[38]在2002年提出SMOTE算法,該算法是過采樣中的經(jīng)典算法。通過少數(shù)類樣本與k個近鄰間的連線隨機生成新樣本。倍數(shù)增加少數(shù)類樣本,完成少數(shù)類過采樣過程,算法詳細過程如下:(1)數(shù)據(jù)集中少數(shù)類樣本個數(shù)為T,一個少數(shù)類樣本特征向量為xi,i∈{1,...,T}。過采樣百分比為N,此處要求N必為正整數(shù),過采樣樣本數(shù)Tnew=N×T,若給定N<1,強制令N=1。(2)在少數(shù)類全部T個樣本中找出少數(shù)類xi的k個近鄰(歐氏距離),一般地,取k=5。尋找到的近鄰記作xi(near),near∈{1,...,k};(3)從xi(near)中隨機抽取樣本xj,j∈{1,...,k},再生成一個0到1之間的隨機浮點數(shù)ζ1,從而生成一個基于少數(shù)類xi的新少數(shù)類xi1。i1i1jix=x+z(x-x)(3.3)(4)將(3.3)重復進行N次,從而生成N個新的少數(shù)類樣本xi(new),new∈{1,...,N}。
RBM結(jié)構(gòu)
【參考文獻】:
期刊論文
[1]深度自編碼網(wǎng)絡(luò)在入侵檢測中的應用研究[J]. 丁紅衛(wèi),萬良,龍廷艷. 哈爾濱工業(yè)大學學報. 2019(05)
[2]新的基于代價敏感集成學習的非平衡數(shù)據(jù)集分類方法NIBoost[J]. 王莉,陳紅梅,王生武. 計算機應用. 2019(03)
[3]融合最大相異系數(shù)密度的SMOTE算法的入侵檢測方法[J]. 陳虹,肖越,肖成龍,陳建虎. 信息網(wǎng)絡(luò)安全. 2019(03)
[4]供應鏈金融大數(shù)據(jù)分布特征的分析與洞見[J]. 劉穎. 計算機科學. 2019(02)
[5]一種基于質(zhì)心空間的不均衡數(shù)據(jù)欠采樣方法[J]. 金旭,王磊,孫國梓,李華康. 計算機科學. 2019(02)
[6]NLOF:基于網(wǎng)格過濾的兩階段離群點檢測算法[J]. 王立英,石磊,伊靜,宋天霞. 計算機應用研究. 2020(04)
[7]面向不平衡數(shù)據(jù)集的一種基于聚類的欠采樣方法[J]. 李春雪,謝林森,盧誠波. 數(shù)學的實踐與認識. 2019(01)
[8]基于自然鄰居鄰域圖的無參數(shù)離群檢測算法[J]. 馮驥,冉瑞生,魏延. 智能系統(tǒng)學報. 2019(05)
[9]基于直覺模糊集理論的IDS方法研究[J]. 邢瑞康,李成海. 計算機科學. 2018(S2)
[10]空間欠采樣寬帶線性調(diào)頻信號二維DOA估計[J]. 馮浩然,阮懷林. 計算機工程. 2018(08)
碩士論文
[1]隨機森林算法的優(yōu)化研究及在文本并行分類上的應用[D]. 張鑫.南京郵電大學 2018
[2]基于深度學習的入侵檢測[D]. 楊昆朋.北京交通大學 2015
本文編號:3570178
【文章來源】:遼寧工程技術(shù)大學遼寧省
【文章頁數(shù)】:62 頁
【學位級別】:碩士
【部分圖文】:
013-2018年CNDV收錄安全漏洞數(shù)量對比圖
遼寧工程技術(shù)大學碩士學位論文1611(1)kjj=ykj=k-j+ξZ=j(3.2)分析公式3.2,保證選定的k值計算的Zy數(shù)值穩(wěn)定,使k值對應的最大相異系數(shù)足夠小,故繪制k-Zy圖像分析最優(yōu)k值選取問題[62]。如圖3.1所示,Zy取值隨著k值增大而逐漸趨近于0,較大的k值是良好的向量相似性保證。圖3.1最大相異系數(shù)隨k變化Figure3.1Zychangeswithk3.2SMOTE過采樣算法Chawla等人[38]在2002年提出SMOTE算法,該算法是過采樣中的經(jīng)典算法。通過少數(shù)類樣本與k個近鄰間的連線隨機生成新樣本。倍數(shù)增加少數(shù)類樣本,完成少數(shù)類過采樣過程,算法詳細過程如下:(1)數(shù)據(jù)集中少數(shù)類樣本個數(shù)為T,一個少數(shù)類樣本特征向量為xi,i∈{1,...,T}。過采樣百分比為N,此處要求N必為正整數(shù),過采樣樣本數(shù)Tnew=N×T,若給定N<1,強制令N=1。(2)在少數(shù)類全部T個樣本中找出少數(shù)類xi的k個近鄰(歐氏距離),一般地,取k=5。尋找到的近鄰記作xi(near),near∈{1,...,k};(3)從xi(near)中隨機抽取樣本xj,j∈{1,...,k},再生成一個0到1之間的隨機浮點數(shù)ζ1,從而生成一個基于少數(shù)類xi的新少數(shù)類xi1。i1i1jix=x+z(x-x)(3.3)(4)將(3.3)重復進行N次,從而生成N個新的少數(shù)類樣本xi(new),new∈{1,...,N}。
RBM結(jié)構(gòu)
【參考文獻】:
期刊論文
[1]深度自編碼網(wǎng)絡(luò)在入侵檢測中的應用研究[J]. 丁紅衛(wèi),萬良,龍廷艷. 哈爾濱工業(yè)大學學報. 2019(05)
[2]新的基于代價敏感集成學習的非平衡數(shù)據(jù)集分類方法NIBoost[J]. 王莉,陳紅梅,王生武. 計算機應用. 2019(03)
[3]融合最大相異系數(shù)密度的SMOTE算法的入侵檢測方法[J]. 陳虹,肖越,肖成龍,陳建虎. 信息網(wǎng)絡(luò)安全. 2019(03)
[4]供應鏈金融大數(shù)據(jù)分布特征的分析與洞見[J]. 劉穎. 計算機科學. 2019(02)
[5]一種基于質(zhì)心空間的不均衡數(shù)據(jù)欠采樣方法[J]. 金旭,王磊,孫國梓,李華康. 計算機科學. 2019(02)
[6]NLOF:基于網(wǎng)格過濾的兩階段離群點檢測算法[J]. 王立英,石磊,伊靜,宋天霞. 計算機應用研究. 2020(04)
[7]面向不平衡數(shù)據(jù)集的一種基于聚類的欠采樣方法[J]. 李春雪,謝林森,盧誠波. 數(shù)學的實踐與認識. 2019(01)
[8]基于自然鄰居鄰域圖的無參數(shù)離群檢測算法[J]. 馮驥,冉瑞生,魏延. 智能系統(tǒng)學報. 2019(05)
[9]基于直覺模糊集理論的IDS方法研究[J]. 邢瑞康,李成海. 計算機科學. 2018(S2)
[10]空間欠采樣寬帶線性調(diào)頻信號二維DOA估計[J]. 馮浩然,阮懷林. 計算機工程. 2018(08)
碩士論文
[1]隨機森林算法的優(yōu)化研究及在文本并行分類上的應用[D]. 張鑫.南京郵電大學 2018
[2]基于深度學習的入侵檢測[D]. 楊昆朋.北京交通大學 2015
本文編號:3570178
本文鏈接:http://sikaile.net/kejilunwen/ruanjiangongchenglunwen/3570178.html
最近更新
教材專著