天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

基于機(jī)器學(xué)習(xí)的網(wǎng)絡(luò)流量分類技術(shù)研究與應(yīng)用

發(fā)布時(shí)間:2020-10-20 07:37
   隨著信息技術(shù)的蓬勃發(fā)展,種類繁多的互聯(lián)網(wǎng)應(yīng)用產(chǎn)生的大量流量占用了很多網(wǎng)絡(luò)資源,在給服務(wù)質(zhì)量帶來(lái)巨大挑戰(zhàn)的同時(shí)也給互聯(lián)網(wǎng)安全產(chǎn)生負(fù)面影響。為了高效地利用網(wǎng)絡(luò)資源并為網(wǎng)絡(luò)管理者提供有效的管控手段,以辨別應(yīng)用層協(xié)議為目的的網(wǎng)絡(luò)流量分類技術(shù)成為近年來(lái)的研究熱點(diǎn)問(wèn)題。文章以此為研究背景,以具有相同五元組的傳輸層雙向報(bào)文序列為研究對(duì)象,對(duì)基于機(jī)器學(xué)習(xí)的網(wǎng)絡(luò)流量分類技術(shù)進(jìn)行研究并加以應(yīng)用。 文章首先介紹了基于知名端口號(hào)、基于特征字匹配等傳統(tǒng)的網(wǎng)絡(luò)流量分類技術(shù),但因其固有的缺陷導(dǎo)致分類精度已難以滿足現(xiàn)階段的需求,故引出基于機(jī)器學(xué)習(xí)的網(wǎng)絡(luò)流量分類技術(shù)。隨后文章對(duì)機(jī)器學(xué)習(xí)中的樸素貝葉斯、C4.5決策樹(shù)、支持向量機(jī)以及集成學(xué)習(xí)分類算法進(jìn)行了研究。 之后,根據(jù)上述機(jī)器學(xué)習(xí)算法的特點(diǎn),文章提出兩種改進(jìn)的分類算法,分別是以樣本縮減策略為基礎(chǔ)的基于支持向量機(jī)的改進(jìn)算法以及基于結(jié)果反饋的機(jī)器學(xué)習(xí)改進(jìn)算法。第一種改進(jìn)算法以信息增益率和樣本質(zhì)心為理論基礎(chǔ),將對(duì)分類結(jié)果影響不大的屬性和靠近樣本質(zhì)心的樣本點(diǎn)刪除,只用可能成為支持向量的樣本點(diǎn)進(jìn)行訓(xùn)練,在保證正確率的同時(shí)增加了訓(xùn)練效率;第二種改進(jìn)算法以分類器的誤判樣本集合為基礎(chǔ),將誤判樣本的正確分類結(jié)果反饋給測(cè)試樣本,以增加分類器對(duì)測(cè)試樣本的分類精度。 最后,文章對(duì)數(shù)據(jù)包捕獲、流形成、流屬性確定、流樣本標(biāo)記流程、連續(xù)數(shù)據(jù)離散化進(jìn)行了描述,并利用經(jīng)典數(shù)據(jù)集對(duì)基于機(jī)器學(xué)習(xí)的網(wǎng)絡(luò)流量分類算法及其改進(jìn)算法進(jìn)行應(yīng)用。實(shí)驗(yàn)結(jié)果表明機(jī)器學(xué)習(xí)分類算法能夠避免傳統(tǒng)分類算法的缺陷,將不同應(yīng)用層協(xié)議產(chǎn)生的流量高精度地分類。對(duì)改進(jìn)算法的實(shí)驗(yàn)結(jié)果表明,基于支持向量機(jī)的改進(jìn)算法在保持精度不變的基礎(chǔ)上大幅度縮短了訓(xùn)練時(shí)間,基于結(jié)果反饋的機(jī)器學(xué)習(xí)改進(jìn)算法成功地利用誤判集合將正確結(jié)果反饋給待測(cè)樣本,增加了分類精度。驗(yàn)證了改進(jìn)算法在訓(xùn)練效率與精度上對(duì)原算法的提升。
【學(xué)位單位】:安徽理工大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位年份】:2014
【中圖分類】:TP181;TP393.06
【文章目錄】:
摘要
Abstract
目錄
Contents
插圖清單
附表清單
1 緒論
    1.1 研究背景
    1.2 研究現(xiàn)狀
    1.3 主要研究?jī)?nèi)容及本文組織結(jié)構(gòu)
2 網(wǎng)絡(luò)流量分類方法概述
    2.1 網(wǎng)絡(luò)流量及流量分類的定義
        2.1.1 TCP/IP協(xié)議族
        2.1.2 網(wǎng)絡(luò)流的概念
        2.1.3 網(wǎng)絡(luò)流量分類的定義
    2.2 基于知名端口號(hào)的流量分類算法概述
    2.3 基于特征字匹配的流量分類算法概述
    2.4 基于機(jī)器學(xué)習(xí)的流量分類算法概述
3 基于機(jī)器學(xué)習(xí)的網(wǎng)絡(luò)流量分類算法研究
    3.1 基于樸素貝葉斯分類模型的網(wǎng)絡(luò)流量分類
        3.1.1 貝葉斯法則
        3.1.2 樸素貝葉斯分類算法
    3.2 基于C4.5決策樹(shù)的網(wǎng)絡(luò)流量分類
        3.2.1 決策樹(shù)簡(jiǎn)介
        3.2.2 C4.5決策樹(shù)分類算法
    3.3 基于支持向量機(jī)的網(wǎng)絡(luò)流量分類
        3.3.1 支持向量機(jī)簡(jiǎn)介
        3.3.2 最優(yōu)分類超平面
        3.3.3 線性不可分的支持向量機(jī)
    3.4 基于集成學(xué)習(xí)的網(wǎng)絡(luò)流量分類
        3.4.1 集成學(xué)習(xí)的概念
        3.4.2 集成學(xué)習(xí)的流程
4 基于機(jī)器學(xué)習(xí)的網(wǎng)絡(luò)流量分類算法改進(jìn)
    4.1 基于支持向量機(jī)的網(wǎng)絡(luò)流量分類算法改進(jìn)
        4.1.1 基于信息增益率的流量屬性選擇
        4.1.2 基于質(zhì)心的樣本縮減策略
    4.2 基于結(jié)果反饋的機(jī)器學(xué)習(xí)分類算法
        4.2.1 誤判集合與樣本相似
        4.2.2 基于結(jié)果反饋的機(jī)器學(xué)習(xí)分類算法流程
5 基于機(jī)器學(xué)習(xí)的網(wǎng)絡(luò)流量分類算法應(yīng)用
    5.1 網(wǎng)絡(luò)流量樣本數(shù)據(jù)的獲取
        5.1.1 常用流量采集工具
        5.1.2 流量屬性的確定
        5.1.3 網(wǎng)絡(luò)流樣本的標(biāo)記
    5.2 連續(xù)數(shù)據(jù)的離散化
    5.3 實(shí)驗(yàn)及結(jié)果分析
        5.3.1 數(shù)據(jù)集與實(shí)驗(yàn)工具
        5.3.2 實(shí)驗(yàn)評(píng)價(jià)指標(biāo)
        5.3.3 實(shí)驗(yàn)結(jié)果分析
    5.4 改進(jìn)算法的實(shí)驗(yàn)驗(yàn)證
        5.4.1 基于支持向量機(jī)的網(wǎng)絡(luò)流量分類改進(jìn)算法實(shí)驗(yàn)
        5.4.2 基于結(jié)果反饋的機(jī)器學(xué)習(xí)分類算法實(shí)驗(yàn)
6 總結(jié)與展望
    6.1 文章總結(jié)
    6.2 今后的工作
參考文獻(xiàn)
致謝
作者簡(jiǎn)介及讀研期間主要科研成果

【參考文獻(xiàn)】

相關(guān)期刊論文 前10條

1 徐鵬;劉瓊;林森;;基于支持向量機(jī)的Internet流量分類研究[J];計(jì)算機(jī)研究與發(fā)展;2009年03期

2 饒剛;劉瓊蓀;;基于Fisher鑒別分析的支持向量機(jī)訓(xùn)練樣本縮減策略[J];計(jì)算機(jī)工程與應(yīng)用;2012年03期

3 羅瑜;易文德;王丹琛;何大可;;大規(guī)模數(shù)據(jù)集下支持向量機(jī)訓(xùn)練樣本的縮減策略[J];計(jì)算機(jī)科學(xué);2007年10期

4 張春霞;張講社;;選擇性集成學(xué)習(xí)算法綜述[J];計(jì)算機(jī)學(xué)報(bào);2011年08期

5 于真;;基于支持向量機(jī)的人臉識(shí)別技術(shù)研究[J];計(jì)算機(jī)仿真;2011年12期

6 徐鵬;林森;劉瓊;;基于決策樹(shù)的流量分類方法[J];計(jì)算機(jī)應(yīng)用研究;2008年08期

7 常旭;李義杰;劉萬(wàn)軍;;CDC與REP結(jié)合的決策樹(shù)剪枝優(yōu)化算法[J];計(jì)算機(jī)工程;2012年14期

8 任永功;楊榮杰;尹明飛;馬名威;;基于信息增益的文本特征選擇方法[J];計(jì)算機(jī)科學(xué);2012年11期

9 郭超;張雪英;劉曉峰;;支持向量機(jī)在低信噪比語(yǔ)音識(shí)別中的應(yīng)用[J];計(jì)算機(jī)工程與應(yīng)用;2013年05期

10 徐鵬;林森;;基于C4.5決策樹(shù)的流量分類方法[J];軟件學(xué)報(bào);2009年10期


相關(guān)博士學(xué)位論文 前2條

1 范洪博;快速精確字符串匹配算法研究[D];哈爾濱工程大學(xué);2011年

2 李自強(qiáng);大規(guī)模文本分類的若干問(wèn)題研究[D];電子科技大學(xué);2013年



本文編號(hào):2848403

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/guanlilunwen/ydhl/2848403.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶dfa67***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com