基于機(jī)器學(xué)習(xí)的網(wǎng)絡(luò)入侵檢測(cè)技術(shù)研究
發(fā)布時(shí)間:2023-02-09 19:16
隨著互聯(lián)網(wǎng)的飛速發(fā)展,智能化的信息時(shí)代為惡意人員的數(shù)據(jù)泄露、網(wǎng)絡(luò)攻擊等行為提供了更多可能性,網(wǎng)絡(luò)安全面臨嚴(yán)峻挑戰(zhàn)。入侵檢測(cè)是用于檢測(cè)計(jì)算機(jī)網(wǎng)絡(luò)系統(tǒng)中的入侵行為的新型信息安全技術(shù),基于機(jī)器學(xué)習(xí)的入侵檢測(cè)方法相比于傳統(tǒng)的基于規(guī)則的方法能更好地識(shí)別未知的異常以及應(yīng)對(duì)大數(shù)據(jù)時(shí)代龐大且復(fù)雜的日志數(shù)據(jù)。本文以NSL-KDD網(wǎng)絡(luò)入侵檢測(cè)數(shù)據(jù)集為研究對(duì)象,研究了采用決策樹(shù)(Decision Tree,DT)、隨機(jī)森林(Random Forests,RF)、梯度提升決策樹(shù)(Gradient Boosting Decision Tree,GBDT)、極端梯度提升決策樹(shù)(e Xtreme Gradient Boosting,XGBoost)和支持向量機(jī)(Support Vector Machine,SVM)五種機(jī)器學(xué)習(xí)算法進(jìn)行網(wǎng)絡(luò)入侵檢測(cè),并設(shè)計(jì)了基于樹(shù)模型+Boruta模式的新型特征選擇算法來(lái)提升五種機(jī)器學(xué)習(xí)模型的檢測(cè)效果,為實(shí)際網(wǎng)絡(luò)入侵檢測(cè)項(xiàng)目提供參考與指導(dǎo)。本文首先對(duì)NSL-KDD數(shù)據(jù)集進(jìn)行預(yù)處理,用XGBoost實(shí)現(xiàn)特征選擇,通過(guò)網(wǎng)格搜索技術(shù)尋找決策樹(shù)、隨機(jī)森林、GBDT、XGBoost、SVM五種...
【文章頁(yè)數(shù)】:93 頁(yè)
【學(xué)位級(jí)別】:碩士
【文章目錄】:
致謝
摘要
ABSTRACT
1 緒論
1.1 課題背景及意義
1.2 國(guó)內(nèi)外發(fā)展歷史及現(xiàn)狀
1.3 發(fā)展方向
1.4 本文主要研究?jī)?nèi)容
1.5 本文的組織結(jié)構(gòu)
2 入侵檢測(cè)研究理論基礎(chǔ)
2.1 數(shù)據(jù)預(yù)處理和特征選擇概述
2.1.1 數(shù)據(jù)預(yù)處理的必要性與常用方法
2.1.2 特征選擇的必要性與常用方法
2.2 入侵檢測(cè)模型評(píng)估指標(biāo)
2.3 模型參數(shù)優(yōu)化方法
2.3.1 交叉驗(yàn)證
2.3.2 網(wǎng)格搜索
2.4 Person相關(guān)系數(shù)
2.5 機(jī)器學(xué)習(xí)模型理論基礎(chǔ)
2.5.1 決策樹(shù)
2.5.2 隨機(jī)森林
2.5.3 GBDT
2.5.4 XGBoost
2.5.5 SVM
2.6 本章小結(jié)
3 基于樹(shù)模型+Boruta模式的特征選擇算法
3.1 Boruta特征選擇算法
3.1.1 傳統(tǒng)Boruta算法
3.1.2 BorutaShap
3.1.3 BoostARoota
3.2 樹(shù)模型+BoostARoota算法思想及設(shè)計(jì)
3.3 樹(shù)模型+CatBoruta算法
3.3.1 CatBoost算法
3.3.2 CatBoruta算法思想及設(shè)計(jì)
3.3.3 樹(shù)模型+CatBoruta算法思想及設(shè)計(jì)
3.4 本章小結(jié)
4 實(shí)驗(yàn)對(duì)比與分析
4.1 數(shù)據(jù)集描述與預(yù)處理方法
4.1.1 數(shù)據(jù)集描述
4.1.2 數(shù)據(jù)預(yù)處理方法
4.2 XGBoost特征選擇效果分析
4.3 機(jī)器學(xué)習(xí)模型參數(shù)尋優(yōu)
4.3.1 隨機(jī)森林參數(shù)尋優(yōu)
4.3.2 決策樹(shù)參數(shù)尋優(yōu)
4.3.3 SVM參數(shù)尋優(yōu)
4.3.4 GBDT參數(shù)尋優(yōu)
4.3.5 XGBoost參數(shù)尋優(yōu)方法
4.4 基于機(jī)器學(xué)習(xí)的網(wǎng)絡(luò)入侵檢測(cè)實(shí)驗(yàn)
4.5 實(shí)驗(yàn)結(jié)果對(duì)比與分析
4.5.1 XGBoost特征選擇方案
4.5.2 樹(shù)模型+BoostARoota特征選擇方案
4.5.3 樹(shù)模型+CatBoruta特征選擇方案
4.6 本章小結(jié)
5 總結(jié)與展望
參考文獻(xiàn)
作者簡(jiǎn)歷及攻讀碩士學(xué)位期間取得的研究成果
學(xué)位論文數(shù)據(jù)集
本文編號(hào):3739101
【文章頁(yè)數(shù)】:93 頁(yè)
【學(xué)位級(jí)別】:碩士
【文章目錄】:
致謝
摘要
ABSTRACT
1 緒論
1.1 課題背景及意義
1.2 國(guó)內(nèi)外發(fā)展歷史及現(xiàn)狀
1.3 發(fā)展方向
1.4 本文主要研究?jī)?nèi)容
1.5 本文的組織結(jié)構(gòu)
2 入侵檢測(cè)研究理論基礎(chǔ)
2.1 數(shù)據(jù)預(yù)處理和特征選擇概述
2.1.1 數(shù)據(jù)預(yù)處理的必要性與常用方法
2.1.2 特征選擇的必要性與常用方法
2.2 入侵檢測(cè)模型評(píng)估指標(biāo)
2.3 模型參數(shù)優(yōu)化方法
2.3.1 交叉驗(yàn)證
2.3.2 網(wǎng)格搜索
2.4 Person相關(guān)系數(shù)
2.5 機(jī)器學(xué)習(xí)模型理論基礎(chǔ)
2.5.1 決策樹(shù)
2.5.2 隨機(jī)森林
2.5.3 GBDT
2.5.4 XGBoost
2.5.5 SVM
2.6 本章小結(jié)
3 基于樹(shù)模型+Boruta模式的特征選擇算法
3.1 Boruta特征選擇算法
3.1.1 傳統(tǒng)Boruta算法
3.1.2 BorutaShap
3.1.3 BoostARoota
3.2 樹(shù)模型+BoostARoota算法思想及設(shè)計(jì)
3.3 樹(shù)模型+CatBoruta算法
3.3.1 CatBoost算法
3.3.2 CatBoruta算法思想及設(shè)計(jì)
3.3.3 樹(shù)模型+CatBoruta算法思想及設(shè)計(jì)
3.4 本章小結(jié)
4 實(shí)驗(yàn)對(duì)比與分析
4.1 數(shù)據(jù)集描述與預(yù)處理方法
4.1.1 數(shù)據(jù)集描述
4.1.2 數(shù)據(jù)預(yù)處理方法
4.2 XGBoost特征選擇效果分析
4.3 機(jī)器學(xué)習(xí)模型參數(shù)尋優(yōu)
4.3.1 隨機(jī)森林參數(shù)尋優(yōu)
4.3.2 決策樹(shù)參數(shù)尋優(yōu)
4.3.3 SVM參數(shù)尋優(yōu)
4.3.4 GBDT參數(shù)尋優(yōu)
4.3.5 XGBoost參數(shù)尋優(yōu)方法
4.4 基于機(jī)器學(xué)習(xí)的網(wǎng)絡(luò)入侵檢測(cè)實(shí)驗(yàn)
4.5 實(shí)驗(yàn)結(jié)果對(duì)比與分析
4.5.1 XGBoost特征選擇方案
4.5.2 樹(shù)模型+BoostARoota特征選擇方案
4.5.3 樹(shù)模型+CatBoruta特征選擇方案
4.6 本章小結(jié)
5 總結(jié)與展望
參考文獻(xiàn)
作者簡(jiǎn)歷及攻讀碩士學(xué)位期間取得的研究成果
學(xué)位論文數(shù)據(jù)集
本文編號(hào):3739101
本文鏈接:http://sikaile.net/guanlilunwen/lindaojc/3739101.html
最近更新
教材專(zhuān)著