SDN環(huán)境下不同機(jī)器學(xué)習(xí)算法的網(wǎng)絡(luò)流量分類分析
【文章頁(yè)數(shù)】:7 頁(yè)
【部分圖文】:
圖1Borderline-SMOTE算法流程
因本文中使用的Moore數(shù)據(jù)集中GAME類型與其他類型樣本量差距太大,即使使用Borderline-SMOTE算法也無法避免樣本重疊,所以在進(jìn)行實(shí)驗(yàn)時(shí),剔除了標(biāo)記為GAME類型的樣本,然后選取WWW類型部分樣本和其他類型的全部樣本組成新的訓(xùn)練數(shù)據(jù)集,采用Borderline-SM....
圖2不同算法對(duì)各種特征的分類準(zhǔn)確率
不同算法對(duì)各種特征的分類準(zhǔn)確率如圖2所示.由圖2可以看出,在對(duì)網(wǎng)絡(luò)流量進(jìn)行分類時(shí),不同的特征對(duì)識(shí)別準(zhǔn)確率的影響很大,基于端口號(hào)的識(shí)別方法、基于時(shí)間信息的識(shí)別方法和基于信息標(biāo)志位的識(shí)別方法無論在何種機(jī)器學(xué)習(xí)方法下識(shí)別率均不高,而將數(shù)據(jù)包數(shù)量、數(shù)據(jù)包大小等網(wǎng)絡(luò)流量統(tǒng)計(jì)信息作為分類特征....
圖3不同算法對(duì)組合特征的分類準(zhǔn)確率
本文在機(jī)器學(xué)習(xí)平臺(tái)RapidMiner上驗(yàn)證了SDN環(huán)境下KNN、SVM、RF和GBDT這4種算法的網(wǎng)絡(luò)流量分類效果.實(shí)驗(yàn)結(jié)果表明,GBDT算法利用每次學(xué)習(xí)的殘差進(jìn)行迭代訓(xùn)練,相較于其他3種算法具有更好的分類效果和較短的訓(xùn)練時(shí)間.SDN的網(wǎng)絡(luò)可重構(gòu)能力為將GBDT算法作為功能模塊....
圖4不同算法的訓(xùn)練時(shí)間
圖3不同算法對(duì)組合特征的分類準(zhǔn)確率
本文編號(hào):3973257
本文鏈接:http://sikaile.net/guanlilunwen/ydhl/3973257.html