基于特征選擇和集成學(xué)習(xí)的入侵檢測(cè)方法研究
發(fā)布時(shí)間:2024-03-10 00:50
入侵檢測(cè)是網(wǎng)絡(luò)安全研究的熱點(diǎn)領(lǐng)域,它是防范主機(jī)和網(wǎng)絡(luò)攻擊的一種有效措施。它的使用彌補(bǔ)了傳統(tǒng)防火墻技術(shù)、簽名認(rèn)證技術(shù)和訪問控制技術(shù)在安全防護(hù)上的不足。傳統(tǒng)的入侵檢測(cè)技術(shù)是通過人為構(gòu)造的規(guī)則庫來對(duì)數(shù)據(jù)進(jìn)行甄別,其工作量繁雜而且檢測(cè)率也不高。機(jī)器學(xué)習(xí)的出現(xiàn)為入侵檢測(cè)提供了一種新的解決方案,入侵檢測(cè)問題可通過機(jī)器學(xué)習(xí)中的分類問題來解決,通過使用入侵檢測(cè)訓(xùn)練集來構(gòu)建專門的分類模型,然后利用這個(gè)分類模型對(duì)新來的數(shù)據(jù)進(jìn)行判斷分類。但在入侵檢測(cè)模型的構(gòu)建中也存在著一些問題,入侵檢測(cè)的訓(xùn)練集中不同類別的數(shù)據(jù)樣本分布不平衡,以此建好的模型難以對(duì)少數(shù)類樣本進(jìn)行準(zhǔn)確的分類。另外,入侵檢測(cè)中數(shù)據(jù)的特征維度比較高,存在著冗余,影響模型分類的準(zhǔn)確率和效率。所以針對(duì)這些問題,本文的主要研究?jī)?nèi)容如下:(1)對(duì)入侵檢測(cè)基準(zhǔn)數(shù)據(jù)集KDDcup99進(jìn)行了去除冗余數(shù)據(jù)的處理,大幅減小了數(shù)據(jù)的規(guī)模,縮短了不同類別間樣本的數(shù)量差距。然后在此基礎(chǔ)上,對(duì)樣本中每個(gè)特征的取值做了詳細(xì)的統(tǒng)計(jì)分析,找出那些取固定值比例超過99.9%的特征,并對(duì)它們剩余的0.01%的取值在不同類別間的分布進(jìn)行具體分析,找出影響度較小的那些特征,在模型構(gòu)建前剔...
【文章頁數(shù)】:71 頁
【學(xué)位級(jí)別】:碩士
【文章目錄】:
摘要
Abstract
1 緒論
1.1 研究背景與意義
1.2 國(guó)內(nèi)外研究現(xiàn)狀
1.2.1 入侵檢測(cè)簡(jiǎn)介
1.2.2 入侵檢測(cè)中基礎(chǔ)分類器的選用
1.2.3 入侵檢測(cè)中特征的處理與研究
1.3 主要研究?jī)?nèi)容
1.4 論文組織結(jié)構(gòu)
2 相關(guān)基礎(chǔ)工作與準(zhǔn)備
2.1 機(jī)器學(xué)習(xí)基礎(chǔ)分類算法
2.1.1 K近鄰算法
2.1.2 支持向量機(jī)
2.1.3 決策樹
2.2 入侵檢測(cè)數(shù)據(jù)集
2.2.1 KDDcup99 數(shù)據(jù)集描述
2.2.2 KDDcup99 數(shù)據(jù)集數(shù)據(jù)的統(tǒng)計(jì)分析
2.3 數(shù)據(jù)集的預(yù)處理
2.3.1 去除冗余數(shù)據(jù)
2.3.2 數(shù)值特征轉(zhuǎn)換與歸一化
2.4 本章實(shí)驗(yàn)
2.4.1 評(píng)價(jià)指標(biāo)
2.4.2 超參數(shù)的網(wǎng)格搜索
2.4.3 去冗余與特征刪除前后實(shí)驗(yàn)對(duì)比
2.5 本章小結(jié)
3 基于互信息和螢火蟲算法的入侵檢測(cè)方法研究
3.1 基于互信息的特征選擇
3.1.1 互信息與熵
3.1.2 最大化互信息進(jìn)行特征選擇
3.2 基于螢火蟲算法的特征選擇
3.2.1 基礎(chǔ)螢火蟲算法
3.2.2 改進(jìn)的螢火蟲算法用于特征特征選擇
3.2.3 特征選擇最終決策
3.3 本章實(shí)驗(yàn)
3.3.1 不平衡數(shù)據(jù)的采樣
3.3.2 實(shí)驗(yàn)分析
3.4 本章小結(jié)
4 基于集成學(xué)習(xí)的入侵檢測(cè)方法研究
4.1 集成學(xué)習(xí)的相關(guān)構(gòu)成
4.1.1 集成學(xué)習(xí)的多樣性
4.1.2 集成學(xué)習(xí)的組合方式
4.1.3 集成學(xué)習(xí)的結(jié)果整合策略
4.2 基于集成方法解決數(shù)據(jù)不平衡問題
4.2.1 基于Bagging的方法解決數(shù)據(jù)不平衡問題
4.2.2 基于Stacking的方法解決數(shù)據(jù)不平衡問題
4.3 本章實(shí)驗(yàn)
4.4 本章小結(jié)
5 總結(jié)與展望
5.1 本文工作總結(jié)
5.2 未來工作方向
參考文獻(xiàn)
攻讀碩士學(xué)位期間發(fā)表論文及科研成果
致謝
本文編號(hào):3924012
【文章頁數(shù)】:71 頁
【學(xué)位級(jí)別】:碩士
【文章目錄】:
摘要
Abstract
1 緒論
1.1 研究背景與意義
1.2 國(guó)內(nèi)外研究現(xiàn)狀
1.2.1 入侵檢測(cè)簡(jiǎn)介
1.2.2 入侵檢測(cè)中基礎(chǔ)分類器的選用
1.2.3 入侵檢測(cè)中特征的處理與研究
1.3 主要研究?jī)?nèi)容
1.4 論文組織結(jié)構(gòu)
2 相關(guān)基礎(chǔ)工作與準(zhǔn)備
2.1 機(jī)器學(xué)習(xí)基礎(chǔ)分類算法
2.1.1 K近鄰算法
2.1.2 支持向量機(jī)
2.1.3 決策樹
2.2 入侵檢測(cè)數(shù)據(jù)集
2.2.1 KDDcup99 數(shù)據(jù)集描述
2.2.2 KDDcup99 數(shù)據(jù)集數(shù)據(jù)的統(tǒng)計(jì)分析
2.3 數(shù)據(jù)集的預(yù)處理
2.3.1 去除冗余數(shù)據(jù)
2.3.2 數(shù)值特征轉(zhuǎn)換與歸一化
2.4 本章實(shí)驗(yàn)
2.4.1 評(píng)價(jià)指標(biāo)
2.4.2 超參數(shù)的網(wǎng)格搜索
2.4.3 去冗余與特征刪除前后實(shí)驗(yàn)對(duì)比
2.5 本章小結(jié)
3 基于互信息和螢火蟲算法的入侵檢測(cè)方法研究
3.1 基于互信息的特征選擇
3.1.1 互信息與熵
3.1.2 最大化互信息進(jìn)行特征選擇
3.2 基于螢火蟲算法的特征選擇
3.2.1 基礎(chǔ)螢火蟲算法
3.2.2 改進(jìn)的螢火蟲算法用于特征特征選擇
3.2.3 特征選擇最終決策
3.3 本章實(shí)驗(yàn)
3.3.1 不平衡數(shù)據(jù)的采樣
3.3.2 實(shí)驗(yàn)分析
3.4 本章小結(jié)
4 基于集成學(xué)習(xí)的入侵檢測(cè)方法研究
4.1 集成學(xué)習(xí)的相關(guān)構(gòu)成
4.1.1 集成學(xué)習(xí)的多樣性
4.1.2 集成學(xué)習(xí)的組合方式
4.1.3 集成學(xué)習(xí)的結(jié)果整合策略
4.2 基于集成方法解決數(shù)據(jù)不平衡問題
4.2.1 基于Bagging的方法解決數(shù)據(jù)不平衡問題
4.2.2 基于Stacking的方法解決數(shù)據(jù)不平衡問題
4.3 本章實(shí)驗(yàn)
4.4 本章小結(jié)
5 總結(jié)與展望
5.1 本文工作總結(jié)
5.2 未來工作方向
參考文獻(xiàn)
攻讀碩士學(xué)位期間發(fā)表論文及科研成果
致謝
本文編號(hào):3924012
本文鏈接:http://sikaile.net/guanlilunwen/ydhl/3924012.html
最近更新
教材專著