天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

面向類不平衡流量數(shù)據(jù)的分類模型

發(fā)布時(shí)間:2021-12-09 00:10
  針對(duì)網(wǎng)絡(luò)流量分類過(guò)程中,傳統(tǒng)模型在小類別上的分類性能較差和難以實(shí)現(xiàn)頻繁、及時(shí)更新的問(wèn)題,提出一種基于集成學(xué)習(xí)的網(wǎng)絡(luò)流量分類模型(ELTCM)。首先,根據(jù)類別分布信息定義了偏向于小類別的特征度量,利用加權(quán)對(duì)稱不確定性和近似馬爾可夫毯(AMB)對(duì)網(wǎng)絡(luò)流量特征進(jìn)行降維,減小類不平衡問(wèn)題帶來(lái)的影響;然后,引入早期概念漂移檢測(cè)增強(qiáng)模型應(yīng)對(duì)流量特征隨網(wǎng)絡(luò)變化而變化的能力,并通過(guò)增量學(xué)習(xí)的方式提高模型更新訓(xùn)練的靈活性。利用真實(shí)流量數(shù)據(jù)集進(jìn)行實(shí)驗(yàn),仿真結(jié)果表明,與基于C4.5決策樹(shù)的分類模型(DTITC)和基于錯(cuò)誤率的概念漂移檢測(cè)分類模型(ERCDD)相比,ELTCM的平均整體精確率分別提高了1.13%和0.26%,且各小類別的分類性能皆優(yōu)于對(duì)比模型。ELTCM有較好的泛化能力,能在不犧牲整體分類精度的情況下有效提高小類別的分類性能。 

【文章來(lái)源】:計(jì)算機(jī)應(yīng)用. 2020,40(08)北大核心CSCD

【文章頁(yè)數(shù)】:7 頁(yè)

【部分圖文】:

面向類不平衡流量數(shù)據(jù)的分類模型


基于機(jī)器學(xué)習(xí)的網(wǎng)絡(luò)流量分類系統(tǒng)結(jié)構(gòu)

流程圖,特征選擇,流程,子集


特征選擇的流程如圖2所示,它主要包含生成特征子集(搜索策略)、評(píng)價(jià)準(zhǔn)則、停止準(zhǔn)則和結(jié)果驗(yàn)證[19]四個(gè)基本步驟。特征選擇方法在原始特征集合中利用特定的搜索策略得到備選子集,并根據(jù)某種評(píng)價(jià)指標(biāo)對(duì)選出的備選子集進(jìn)行評(píng)價(jià),由最優(yōu)評(píng)估值的特征集合取代次優(yōu)特征集合,并根據(jù)停止準(zhǔn)則結(jié)束搜索,保證算法的有窮性,最后使用人工數(shù)據(jù)集或真實(shí)數(shù)據(jù)集測(cè)試所選子集的有效性。2 基于集成學(xué)習(xí)的網(wǎng)絡(luò)流量分類模型

系統(tǒng)結(jié)構(gòu)圖,網(wǎng)絡(luò)流量,系統(tǒng)結(jié)構(gòu),模型


基于集成學(xué)習(xí)的網(wǎng)絡(luò)流量分類模型(ELTCM)系統(tǒng)結(jié)構(gòu)如圖3所示。初始時(shí),在預(yù)先獲取的數(shù)據(jù)集上進(jìn)行訓(xùn)練,得到一個(gè)基分類器;通過(guò)增量學(xué)習(xí)的方式,將新增的網(wǎng)絡(luò)流量及其通過(guò)基分類器所得的分類結(jié)果作為新的數(shù)據(jù)子集;若新的數(shù)據(jù)子集與前一階段的數(shù)據(jù)集相比,發(fā)生了概念漂移并達(dá)到一定程度時(shí),采用新的數(shù)據(jù)集訓(xùn)練得到新的基分類器,并將新增基分類器加入集成分類系統(tǒng),參與預(yù)測(cè)下一階段的網(wǎng)絡(luò)流量的分類結(jié)果。這樣,當(dāng)模型需要更新時(shí),只需要利用少量的新樣本進(jìn)行訓(xùn)練,提高了模型更新訓(xùn)練的靈活性,縮短了模型更新的時(shí)間間隔。在訓(xùn)練基分類器時(shí),提出一種基于加權(quán)對(duì)稱不確定性(Weighted Symmetric Uncertainty,WSU)和近似馬爾可夫毯(Approximate Markov Blanket,AMB)的特征選擇算法,充分考慮特征與類別間、特征與特征之間的相關(guān)性,在刪除不相關(guān)特征和冗余特征的同時(shí),選出易于識(shí)別小類別的特征,減少類不平衡問(wèn)題帶來(lái)的影響。2.1 WSU_AMB特征選擇算法

【參考文獻(xiàn)】:
期刊論文
[1]面向概念漂移問(wèn)題的漸進(jìn)多核學(xué)習(xí)方法[J]. 白東穎,易亞星,王慶超,余志勇.  計(jì)算機(jī)應(yīng)用. 2019(09)
[2]網(wǎng)絡(luò)背景流量的分類與識(shí)別研究綜述[J]. 鄒騰寬,汪鈺穎,吳承榮.  計(jì)算機(jī)應(yīng)用. 2019(03)
[3]基于深度卷積神經(jīng)網(wǎng)絡(luò)的網(wǎng)絡(luò)流量分類方法[J]. 王勇,周慧怡,俸皓,葉苗,柯文龍.  通信學(xué)報(bào). 2018(01)
[4]互聯(lián)網(wǎng)中基于用戶連接圖的流量分類機(jī)制[J]. 張震,汪斌強(qiáng),陳鴻昶,馬海龍.  電子與信息學(xué)報(bào). 2013(04)
[5]基于互信息選擇聚類集成的網(wǎng)絡(luò)流量分類方法[J]. 丁要軍,蔡皖東.  計(jì)算機(jī)應(yīng)用. 2013(01)
[6]基于最短劃分距離的網(wǎng)絡(luò)流量決策樹(shù)分類方法[J]. 楊哲,李領(lǐng)治,紀(jì)其進(jìn),朱艷琴.  通信學(xué)報(bào). 2012(03)
[7]基于C4.5決策樹(shù)的流量分類方法[J]. 徐鵬,林森.  軟件學(xué)報(bào). 2009(10)



本文編號(hào):3529518

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/guanlilunwen/ydhl/3529518.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶fafb7***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com