隨著網(wǎng)絡(luò)技術(shù)的飛速發(fā)展,互聯(lián)網(wǎng)的規(guī)模不斷擴(kuò)大,業(yè)務(wù)類型不斷增加。一方面網(wǎng)絡(luò)流量急劇增長,造成網(wǎng)絡(luò)擁塞,導(dǎo)致網(wǎng)絡(luò)服務(wù)質(zhì)量下降,另一方面,種類繁多的網(wǎng)絡(luò)應(yīng)用,越來越占用網(wǎng)絡(luò)資源,且給網(wǎng)絡(luò)安全帶來巨大威脅。為更好了解網(wǎng)絡(luò)狀況,及時(shí)處理網(wǎng)絡(luò)故障,并對(duì)管理和優(yōu)化網(wǎng)絡(luò)配置提供依據(jù),網(wǎng)絡(luò)管理者需對(duì)不同網(wǎng)絡(luò)應(yīng)用進(jìn)行及時(shí)、準(zhǔn)確的分析,對(duì)網(wǎng)絡(luò)行為進(jìn)行有效的控制。實(shí)現(xiàn)這些的前提和基礎(chǔ)是對(duì)網(wǎng)絡(luò)流量的正確識(shí)別與分類。 目前,基于流統(tǒng)計(jì)特征的流量分類方法是研究熱點(diǎn),在這種方法中,定義和提取區(qū)分不同類型流量的有效特征與選擇合適的分類方法是關(guān)鍵。這里的網(wǎng)絡(luò)特征,既包含數(shù)據(jù)包特征也包含數(shù)據(jù)流特征。富含分類信息特征的選取,能提高分類精確度,同時(shí),特征維度的降低,能減少后續(xù)分類器建模時(shí)間,提高分類速度。本文從人工分析選擇特征和特征選擇算法選擇特征這兩個(gè)方面展開研究。 首先,在Moore特征集的基礎(chǔ)上,人工分析選擇特征。本文將Moore特征集的特征按性質(zhì)分為五個(gè)組,分組考察特征對(duì)網(wǎng)絡(luò)流分類的貢獻(xiàn),找出關(guān)鍵特征組別,然后再逐步細(xì)化,區(qū)分出哪些特征對(duì)網(wǎng)絡(luò)流分類具有相對(duì)更高的貢獻(xiàn)度。為排除后續(xù)機(jī)器學(xué)習(xí)方法對(duì)分類的影響,實(shí)驗(yàn)時(shí),選擇...
【文章頁數(shù)】:57 頁
【學(xué)位級(jí)別】:碩士
【部分圖文】:

圖3.1各組特征預(yù)測精確度對(duì)比圖
3.3.1各組特征對(duì)分類的貢獻(xiàn)度圖3.1為5組網(wǎng)絡(luò)流特征利用四種機(jī)器學(xué)習(xí)方法對(duì)Moore數(shù)據(jù)集進(jìn)行分類的預(yù)測精確度對(duì)比?赑orts日PacketNumbers^PacketBytes^Time□TCPFlags90—------—----- — ....

圖3.2基于端口特征的F-measure對(duì)比
對(duì)網(wǎng)絡(luò)流分類有相對(duì)更高的預(yù)測精確度。對(duì)網(wǎng)絡(luò)流分類時(shí),除了整體預(yù)測精確度,我們還關(guān)注分類中各個(gè)類別流量的分類情況。圖3.2和圖3.3所示為使用端口特征和與分組長度相關(guān)特征配合k-NN和C4.5決策樹方法,數(shù)據(jù)集中各類別應(yīng)用的分類情況,評(píng)價(jià)指標(biāo)為綜合考慮查全率和查準(zhǔn)率的F-mea....

圖3.3基于分組長度相關(guān)特征的F-measure對(duì)比
對(duì)網(wǎng)絡(luò)流分類有相對(duì)更高的預(yù)測精確度。對(duì)網(wǎng)絡(luò)流分類時(shí),除了整體預(yù)測精確度,我們還關(guān)注分類中各個(gè)類別流量的分類情況。圖3.2和圖3.3所示為使用端口特征和與分組長度相關(guān)特征配合k-NN和C4.5決策樹方法,數(shù)據(jù)集中各類別應(yīng)用的分類情況,評(píng)價(jià)指標(biāo)為綜合考慮查全率和查準(zhǔn)率的F-mea....
本文編號(hào):
3960608
本文鏈接:http://sikaile.net/guanlilunwen/ydhl/3960608.html