基于機(jī)器學(xué)習(xí)的加密流量識(shí)別算法研究
發(fā)布時(shí)間:2022-09-29 16:46
隨著信息技術(shù)的不斷發(fā)展,網(wǎng)絡(luò)中充斥的各種各樣的加密流量,而為了有效識(shí)別各類(lèi)應(yīng)用的加密流量,以提高網(wǎng)絡(luò)管理、改善網(wǎng)絡(luò)服務(wù)、保障網(wǎng)絡(luò)環(huán)境安全,加密流量的特征提取和應(yīng)用識(shí)別顯得越來(lái)越重要。本文在機(jī)器學(xué)習(xí)算法的基礎(chǔ)上,就加密流量識(shí)別算法進(jìn)行研究,本文的主要工作如下:1)本文首先分析總結(jié)了傳統(tǒng)流量識(shí)別方法,對(duì)比了各個(gè)方法的優(yōu)缺點(diǎn)以及適用場(chǎng)景,并進(jìn)一步分析了傳統(tǒng)方法在當(dāng)前加密流量爆發(fā)式增長(zhǎng)的網(wǎng)絡(luò)環(huán)境下面臨的困境。然后分析了機(jī)器學(xué)習(xí)方法相比于傳統(tǒng)流量識(shí)別方法的優(yōu)勢(shì)所在。2)本文基于Bagging提出了一種面向應(yīng)用的加密流量識(shí)別算法,借助數(shù)據(jù)流統(tǒng)計(jì)特征對(duì)加密流量對(duì)應(yīng)的應(yīng)用類(lèi)型進(jìn)行分類(lèi),并利用孤立森林對(duì)特征數(shù)據(jù)集中的噪聲樣本進(jìn)行去除,以進(jìn)一步提高算法的準(zhǔn)確率。在該算法的基礎(chǔ)上,對(duì)應(yīng)用進(jìn)一步細(xì)化分類(lèi),嘗試對(duì)應(yīng)用的功能模塊的進(jìn)行識(shí)別,并提出了一種面向功能的加密流量識(shí)別算法。在功能識(shí)別中,由于數(shù)據(jù)流統(tǒng)計(jì)特征難以覆蓋所有功能,本文引入了負(fù)載特征作為輔助,并有效提高了算法的識(shí)別準(zhǔn)確率。最后通過(guò)實(shí)驗(yàn)測(cè)試了兩個(gè)算法分別在應(yīng)用識(shí)別和功能識(shí)別的識(shí)別效果,均取得較高的準(zhǔn)確率、精確率、召回率。3)本文在上述兩個(gè)算法的基礎(chǔ)上,...
【文章頁(yè)數(shù)】:68 頁(yè)
【學(xué)位級(jí)別】:碩士
【文章目錄】:
摘要
ABSTRACT
第1章 緒論
1.1 研究背景及意義
1.2 研究現(xiàn)狀
1.3 本文的主要研究?jī)?nèi)容
1.3.1 流量特征提取
1.3.2 傳統(tǒng)流量識(shí)別方法
1.3.3 基于機(jī)器學(xué)習(xí)的流量識(shí)別算法
1.3.4 并行優(yōu)化
1.4 文章架構(gòu)
第2章 相關(guān)背景知識(shí)
2.1 常見(jiàn)加密協(xié)議
2.2 加密流量特征提取
2.3 流量識(shí)別方法
2.3.1 基于端口的流量識(shí)別技術(shù)
2.3.2 深度報(bào)文檢測(cè)技術(shù)
2.3.3 基于行為特征的流量識(shí)別技術(shù)
2.4 機(jī)器學(xué)習(xí)
2.4.1 支持向量機(jī)算法
2.4.2 C4.5決策樹(shù)算法
2.4.3 樸素貝葉斯算法
2.4.4 效果評(píng)估標(biāo)準(zhǔn)
2.5 集成學(xué)習(xí)
2.5.1 Boosting
2.5.2 Bagging
2.5.3 Stacking
2.5.4 集成學(xué)習(xí)組合策略
第3章 面向應(yīng)用的加密流量識(shí)別算法
3.1 數(shù)據(jù)集
3.1.1 ISCX VPN-non VPN數(shù)據(jù)集
3.1.2 捕獲數(shù)據(jù)集
3.2 特征選擇
3.2.1 條件熵
3.2.2 基于條件熵的特征選擇
3.3 噪聲處理
3.3.1 孤立森林
3.3.2 基于孤立深林的噪聲處理
3.4 算法設(shè)計(jì)
3.5 實(shí)驗(yàn)結(jié)果
3.5.1 機(jī)器學(xué)習(xí)算法效果對(duì)比
3.5.2 噪聲數(shù)據(jù)影響
3.6 本章小結(jié)
第4章 面向功能的加密流量識(shí)別算法
4.1 數(shù)據(jù)集
4.2 特征選擇
4.2.1 數(shù)據(jù)流統(tǒng)計(jì)特征
4.2.2 負(fù)載特征
4.3 算法設(shè)計(jì)
4.4 實(shí)驗(yàn)結(jié)果
4.4.1 機(jī)器學(xué)習(xí)算法效果對(duì)比
4.4.2 特征影響
4.5 本章小結(jié)
第5章 基于SPARK的并行優(yōu)化方法
5.1 整體框架
5.2 基于SPARK的 BAGGING算法優(yōu)化
5.2.1 數(shù)據(jù)并行策略
5.2.2 任務(wù)并行策略
5.3 實(shí)驗(yàn)結(jié)果
5.3.1 識(shí)別效果
5.3.2 識(shí)別效率
5.4 本章小結(jié)
結(jié)論
參考文獻(xiàn)
攻讀碩士學(xué)位期間發(fā)表的論文及其它成果
致謝
本文編號(hào):3682947
【文章頁(yè)數(shù)】:68 頁(yè)
【學(xué)位級(jí)別】:碩士
【文章目錄】:
摘要
ABSTRACT
第1章 緒論
1.1 研究背景及意義
1.2 研究現(xiàn)狀
1.3 本文的主要研究?jī)?nèi)容
1.3.1 流量特征提取
1.3.2 傳統(tǒng)流量識(shí)別方法
1.3.3 基于機(jī)器學(xué)習(xí)的流量識(shí)別算法
1.3.4 并行優(yōu)化
1.4 文章架構(gòu)
第2章 相關(guān)背景知識(shí)
2.1 常見(jiàn)加密協(xié)議
2.2 加密流量特征提取
2.3 流量識(shí)別方法
2.3.1 基于端口的流量識(shí)別技術(shù)
2.3.2 深度報(bào)文檢測(cè)技術(shù)
2.3.3 基于行為特征的流量識(shí)別技術(shù)
2.4 機(jī)器學(xué)習(xí)
2.4.1 支持向量機(jī)算法
2.4.2 C4.5決策樹(shù)算法
2.4.3 樸素貝葉斯算法
2.4.4 效果評(píng)估標(biāo)準(zhǔn)
2.5 集成學(xué)習(xí)
2.5.1 Boosting
2.5.2 Bagging
2.5.3 Stacking
2.5.4 集成學(xué)習(xí)組合策略
第3章 面向應(yīng)用的加密流量識(shí)別算法
3.1 數(shù)據(jù)集
3.1.1 ISCX VPN-non VPN數(shù)據(jù)集
3.1.2 捕獲數(shù)據(jù)集
3.2 特征選擇
3.2.1 條件熵
3.2.2 基于條件熵的特征選擇
3.3 噪聲處理
3.3.1 孤立森林
3.3.2 基于孤立深林的噪聲處理
3.4 算法設(shè)計(jì)
3.5 實(shí)驗(yàn)結(jié)果
3.5.1 機(jī)器學(xué)習(xí)算法效果對(duì)比
3.5.2 噪聲數(shù)據(jù)影響
3.6 本章小結(jié)
第4章 面向功能的加密流量識(shí)別算法
4.1 數(shù)據(jù)集
4.2 特征選擇
4.2.1 數(shù)據(jù)流統(tǒng)計(jì)特征
4.2.2 負(fù)載特征
4.3 算法設(shè)計(jì)
4.4 實(shí)驗(yàn)結(jié)果
4.4.1 機(jī)器學(xué)習(xí)算法效果對(duì)比
4.4.2 特征影響
4.5 本章小結(jié)
第5章 基于SPARK的并行優(yōu)化方法
5.1 整體框架
5.2 基于SPARK的 BAGGING算法優(yōu)化
5.2.1 數(shù)據(jù)并行策略
5.2.2 任務(wù)并行策略
5.3 實(shí)驗(yàn)結(jié)果
5.3.1 識(shí)別效果
5.3.2 識(shí)別效率
5.4 本章小結(jié)
結(jié)論
參考文獻(xiàn)
攻讀碩士學(xué)位期間發(fā)表的論文及其它成果
致謝
本文編號(hào):3682947
本文鏈接:http://sikaile.net/kejilunwen/zidonghuakongzhilunwen/3682947.html
最近更新
教材專(zhuān)著