天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

面向類不平衡流量數(shù)據(jù)的分類模型

發(fā)布時間:2021-12-09 00:10
  針對網(wǎng)絡(luò)流量分類過程中,傳統(tǒng)模型在小類別上的分類性能較差和難以實現(xiàn)頻繁、及時更新的問題,提出一種基于集成學(xué)習(xí)的網(wǎng)絡(luò)流量分類模型(ELTCM)。首先,根據(jù)類別分布信息定義了偏向于小類別的特征度量,利用加權(quán)對稱不確定性和近似馬爾可夫毯(AMB)對網(wǎng)絡(luò)流量特征進行降維,減小類不平衡問題帶來的影響;然后,引入早期概念漂移檢測增強模型應(yīng)對流量特征隨網(wǎng)絡(luò)變化而變化的能力,并通過增量學(xué)習(xí)的方式提高模型更新訓(xùn)練的靈活性。利用真實流量數(shù)據(jù)集進行實驗,仿真結(jié)果表明,與基于C4.5決策樹的分類模型(DTITC)和基于錯誤率的概念漂移檢測分類模型(ERCDD)相比,ELTCM的平均整體精確率分別提高了1.13%和0.26%,且各小類別的分類性能皆優(yōu)于對比模型。ELTCM有較好的泛化能力,能在不犧牲整體分類精度的情況下有效提高小類別的分類性能。 

【文章來源】:計算機應(yīng)用. 2020,40(08)北大核心CSCD

【文章頁數(shù)】:7 頁

【部分圖文】:

面向類不平衡流量數(shù)據(jù)的分類模型


基于機器學(xué)習(xí)的網(wǎng)絡(luò)流量分類系統(tǒng)結(jié)構(gòu)

流程圖,特征選擇,流程,子集


特征選擇的流程如圖2所示,它主要包含生成特征子集(搜索策略)、評價準則、停止準則和結(jié)果驗證[19]四個基本步驟。特征選擇方法在原始特征集合中利用特定的搜索策略得到備選子集,并根據(jù)某種評價指標對選出的備選子集進行評價,由最優(yōu)評估值的特征集合取代次優(yōu)特征集合,并根據(jù)停止準則結(jié)束搜索,保證算法的有窮性,最后使用人工數(shù)據(jù)集或真實數(shù)據(jù)集測試所選子集的有效性。2 基于集成學(xué)習(xí)的網(wǎng)絡(luò)流量分類模型

系統(tǒng)結(jié)構(gòu)圖,網(wǎng)絡(luò)流量,系統(tǒng)結(jié)構(gòu),模型


基于集成學(xué)習(xí)的網(wǎng)絡(luò)流量分類模型(ELTCM)系統(tǒng)結(jié)構(gòu)如圖3所示。初始時,在預(yù)先獲取的數(shù)據(jù)集上進行訓(xùn)練,得到一個基分類器;通過增量學(xué)習(xí)的方式,將新增的網(wǎng)絡(luò)流量及其通過基分類器所得的分類結(jié)果作為新的數(shù)據(jù)子集;若新的數(shù)據(jù)子集與前一階段的數(shù)據(jù)集相比,發(fā)生了概念漂移并達到一定程度時,采用新的數(shù)據(jù)集訓(xùn)練得到新的基分類器,并將新增基分類器加入集成分類系統(tǒng),參與預(yù)測下一階段的網(wǎng)絡(luò)流量的分類結(jié)果。這樣,當(dāng)模型需要更新時,只需要利用少量的新樣本進行訓(xùn)練,提高了模型更新訓(xùn)練的靈活性,縮短了模型更新的時間間隔。在訓(xùn)練基分類器時,提出一種基于加權(quán)對稱不確定性(Weighted Symmetric Uncertainty,WSU)和近似馬爾可夫毯(Approximate Markov Blanket,AMB)的特征選擇算法,充分考慮特征與類別間、特征與特征之間的相關(guān)性,在刪除不相關(guān)特征和冗余特征的同時,選出易于識別小類別的特征,減少類不平衡問題帶來的影響。2.1 WSU_AMB特征選擇算法

【參考文獻】:
期刊論文
[1]面向概念漂移問題的漸進多核學(xué)習(xí)方法[J]. 白東穎,易亞星,王慶超,余志勇.  計算機應(yīng)用. 2019(09)
[2]網(wǎng)絡(luò)背景流量的分類與識別研究綜述[J]. 鄒騰寬,汪鈺穎,吳承榮.  計算機應(yīng)用. 2019(03)
[3]基于深度卷積神經(jīng)網(wǎng)絡(luò)的網(wǎng)絡(luò)流量分類方法[J]. 王勇,周慧怡,俸皓,葉苗,柯文龍.  通信學(xué)報. 2018(01)
[4]互聯(lián)網(wǎng)中基于用戶連接圖的流量分類機制[J]. 張震,汪斌強,陳鴻昶,馬海龍.  電子與信息學(xué)報. 2013(04)
[5]基于互信息選擇聚類集成的網(wǎng)絡(luò)流量分類方法[J]. 丁要軍,蔡皖東.  計算機應(yīng)用. 2013(01)
[6]基于最短劃分距離的網(wǎng)絡(luò)流量決策樹分類方法[J]. 楊哲,李領(lǐng)治,紀其進,朱艷琴.  通信學(xué)報. 2012(03)
[7]基于C4.5決策樹的流量分類方法[J]. 徐鵬,林森.  軟件學(xué)報. 2009(10)



本文編號:3529518

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/guanlilunwen/ydhl/3529518.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶fafb7***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com