基于機器學(xué)習(xí)的網(wǎng)絡(luò)流量識別及其應(yīng)用研究
發(fā)布時間:2023-04-02 07:01
隨著信息技術(shù)的不斷發(fā)展,數(shù)據(jù)中心網(wǎng)絡(luò)的規(guī)模日益擴大。在數(shù)據(jù)中心內(nèi)的一些業(yè)務(wù),如數(shù)據(jù)遷移、文件備份,其產(chǎn)生的流量數(shù)目雖然很少,但傳輸?shù)臄?shù)據(jù)量極大,被稱為大象流。為了更好地利用網(wǎng)絡(luò)資源,減少網(wǎng)絡(luò)擁塞,需要對大象流作出區(qū)分,單獨優(yōu)化。本文利用機器學(xué)習(xí),對數(shù)據(jù)中心網(wǎng)絡(luò)中的大象流進(jìn)行識別,然后探討了路由優(yōu)化場景下識別模型的評估指標(biāo),最后將流量大小的二類識別擴展到了多類識別。主要的研究內(nèi)容和創(chuàng)新點包括以下幾個方面:(1)為了盡可能早地檢測出大象流,本文以數(shù)據(jù)挖掘的角度,從一條流的前幾個數(shù)據(jù)包中提取多個有效特征,使用LightGBM算法對大象流進(jìn)行快速識別。針對數(shù)據(jù)集中大象流、老鼠流的樣本不均衡問題,本文引入了聚焦損失函數(shù),并在其基礎(chǔ)上提出了雙相聚焦損失函數(shù)(Biphasic Focal Loss,BFL),使模型在訓(xùn)練過程中更多地關(guān)注困難樣本。本文分別使用了三種真實數(shù)據(jù)集驗證了不同學(xué)習(xí)算法的有效性,實驗結(jié)果表明使用了BFL的LightGBM模型不但具有較高的TPR和TNR,而且對大象流判定門限的變化具有更強的魯棒性。(2)為了提高數(shù)據(jù)中心網(wǎng)絡(luò)的性能,常需要對網(wǎng)絡(luò)路由進(jìn)行優(yōu)化。然而,當(dāng)前的一些基于大...
【文章頁數(shù)】:79 頁
【學(xué)位級別】:碩士
【文章目錄】:
摘要
abstract
第一章 緒論
1.1 研究背景與意義
1.2 研究現(xiàn)狀
1.3 本文的主要工作
1.4 本文的結(jié)構(gòu)安排
第二章 相關(guān)理論基礎(chǔ)
2.1 監(jiān)督學(xué)習(xí)簡介
2.2 決策樹
2.3 集成學(xué)習(xí)
2.3.1 Boosting集成
2.3.1.1 梯度提升樹
2.3.2 Bagging集成
2.3.2.1 隨機森林
2.4 機器學(xué)習(xí)的網(wǎng)絡(luò)應(yīng)用流程
2.5 數(shù)據(jù)中心網(wǎng)絡(luò)簡介
2.5.1 數(shù)據(jù)中心網(wǎng)絡(luò)的常見拓?fù)?br> 2.5.2 數(shù)據(jù)中心網(wǎng)絡(luò)的流量特征
2.6 本章小結(jié)
第三章 基于機器學(xué)習(xí)的大象流識別
3.1 LightGBM的原理
3.2 數(shù)據(jù)預(yù)處理
3.2.1 數(shù)據(jù)解析
3.2.2 特征構(gòu)造
3.3 樣本不均衡問題
3.3.1 常見解決方法
3.3.2 聚焦損失函數(shù)
3.3.3 雙相聚集損失函數(shù)
3.4 算法性能評估
3.4.1 實驗設(shè)置
3.4.2 實驗結(jié)果
3.5 本章小結(jié)
第四章 路由優(yōu)化下識別模型的評估指標(biāo)探究
4.1 數(shù)據(jù)中心網(wǎng)絡(luò)中的路由優(yōu)化
4.1.1 數(shù)據(jù)中心網(wǎng)絡(luò)的傳統(tǒng)路由
4.1.2 基于SDN的路由優(yōu)化
4.1.2.1 SDN網(wǎng)絡(luò)架構(gòu)
4.1.2.2 大象流計數(shù)路由
4.2 基于路由優(yōu)化效果的識別模型評估
4.2.1 召回率與查準(zhǔn)率
4.2.2 ROC和 AUC
4.2.3 加權(quán)F值下的模型評估
4.3 仿真實驗
4.4 本章小結(jié)
第五章 流量大小的多類識別及其路由優(yōu)化
5.1 流量大小的多分類擴展
5.1.1 多分類器的構(gòu)建
5.1.2 多分類器的評估指標(biāo)
5.1.3 實驗結(jié)果
5.2 多分類下的網(wǎng)絡(luò)路由優(yōu)化算法
5.2.1 多分類隨機路由算法
5.2.1.1 路由算法設(shè)計
5.2.1.2 路由仿真實驗
5.2.2 多分類多權(quán)重路由算法
5.2.2.1 路由算法設(shè)計
5.2.2.2 路由仿真實驗
5.3 本章小結(jié)
第六章 總結(jié)與展望
6.1 本文總結(jié)
6.2 未來展望
致謝
參考文獻(xiàn)
攻讀碩士學(xué)位期間取得的成果
本文編號:3778781
【文章頁數(shù)】:79 頁
【學(xué)位級別】:碩士
【文章目錄】:
摘要
abstract
第一章 緒論
1.1 研究背景與意義
1.2 研究現(xiàn)狀
1.3 本文的主要工作
1.4 本文的結(jié)構(gòu)安排
第二章 相關(guān)理論基礎(chǔ)
2.1 監(jiān)督學(xué)習(xí)簡介
2.2 決策樹
2.3 集成學(xué)習(xí)
2.3.1 Boosting集成
2.3.1.1 梯度提升樹
2.3.2 Bagging集成
2.3.2.1 隨機森林
2.4 機器學(xué)習(xí)的網(wǎng)絡(luò)應(yīng)用流程
2.5 數(shù)據(jù)中心網(wǎng)絡(luò)簡介
2.5.1 數(shù)據(jù)中心網(wǎng)絡(luò)的常見拓?fù)?br> 2.5.2 數(shù)據(jù)中心網(wǎng)絡(luò)的流量特征
2.6 本章小結(jié)
第三章 基于機器學(xué)習(xí)的大象流識別
3.1 LightGBM的原理
3.2 數(shù)據(jù)預(yù)處理
3.2.1 數(shù)據(jù)解析
3.2.2 特征構(gòu)造
3.3 樣本不均衡問題
3.3.1 常見解決方法
3.3.2 聚焦損失函數(shù)
3.3.3 雙相聚集損失函數(shù)
3.4 算法性能評估
3.4.1 實驗設(shè)置
3.4.2 實驗結(jié)果
3.5 本章小結(jié)
第四章 路由優(yōu)化下識別模型的評估指標(biāo)探究
4.1 數(shù)據(jù)中心網(wǎng)絡(luò)中的路由優(yōu)化
4.1.1 數(shù)據(jù)中心網(wǎng)絡(luò)的傳統(tǒng)路由
4.1.2 基于SDN的路由優(yōu)化
4.1.2.1 SDN網(wǎng)絡(luò)架構(gòu)
4.1.2.2 大象流計數(shù)路由
4.2 基于路由優(yōu)化效果的識別模型評估
4.2.1 召回率與查準(zhǔn)率
4.2.2 ROC和 AUC
4.2.3 加權(quán)F值下的模型評估
4.3 仿真實驗
4.4 本章小結(jié)
第五章 流量大小的多類識別及其路由優(yōu)化
5.1 流量大小的多分類擴展
5.1.1 多分類器的構(gòu)建
5.1.2 多分類器的評估指標(biāo)
5.1.3 實驗結(jié)果
5.2 多分類下的網(wǎng)絡(luò)路由優(yōu)化算法
5.2.1 多分類隨機路由算法
5.2.1.1 路由算法設(shè)計
5.2.1.2 路由仿真實驗
5.2.2 多分類多權(quán)重路由算法
5.2.2.1 路由算法設(shè)計
5.2.2.2 路由仿真實驗
5.3 本章小結(jié)
第六章 總結(jié)與展望
6.1 本文總結(jié)
6.2 未來展望
致謝
參考文獻(xiàn)
攻讀碩士學(xué)位期間取得的成果
本文編號:3778781
本文鏈接:http://sikaile.net/guanlilunwen/lindaojc/3778781.html
最近更新
教材專著