隨機(jī)森林入侵檢測算法研究
【文章頁數(shù)】:55 頁
【學(xué)位級別】:碩士
【部分圖文】:
圖2.2Train和Test數(shù)據(jù)集中樣本類型分布
蘭州交通大學(xué)工程碩士學(xué)位論文-11-NSL-KDD數(shù)據(jù)集與KDDCup1999數(shù)據(jù)集相比,首先去除了訓(xùn)練集中的冗余樣本得到新的訓(xùn)練集Train+,然后使用21種基礎(chǔ)的算法模型將測試集中的樣本依據(jù)分類正確的模型數(shù)量分為22類,并以此給出Test+和Test-21兩種測試集,其中Te....
圖3.3特征重要度分布圖
-16-究者認(rèn)為DBN對入侵檢測系統(tǒng)有著較強(qiáng)的能力[38],因此本文選用PCA與DBN進(jìn)行特征提齲PCA將高維數(shù)據(jù)映射到另一個低維子空間中,子空間的長軸(主成分)代表著數(shù)據(jù)變化率最高的特征。PCA還可以反應(yīng)特征的重要程度和相關(guān)程度,與長軸越接近的特征,其重要程度越高,進(jìn)而達(dá)到特征....
圖3.4決策樹、RF和EDF的F1值對比
蘭州交通大學(xué)工程碩士學(xué)位論文-19-表3.5Train和Test集上個分類器檢測率對比分類器ACCJ4881.05%NB76.56%NBTree82.02%RandomForest80.67%ExtraTrees78.19%RandomTree81.59%MLP77.41%SVM....
圖3.7特征重要度分布
蘭州交通大學(xué)工程碩士學(xué)位論文-23-圖3.8為在不同窗口情況下Test集上模型測試準(zhǔn)確率隨森林層數(shù)的變化曲線。在整體上,隨著層數(shù)加深,測試集準(zhǔn)確率不斷提高,而在掃描窗口為[10]和[10,30]時時,測試集準(zhǔn)確率較高,且兩條曲線都收斂于86%左右,此時模型特征提取能力達(dá)到較高水平....
本文編號:3909133
本文鏈接:http://sikaile.net/guanlilunwen/lindaojc/3909133.html