基于支持向量機的加密流量識別方法
本文關鍵詞: 加密流量識別 相對熵 蒙特卡洛仿真 支持向量機 出處:《東南大學學報(自然科學版)》2017年04期 論文類型:期刊論文
【摘要】:針對現(xiàn)有的加密流量識別方法難以區(qū)分加密流量和非加密壓縮文件流量的問題,對互聯(lián)網中的加密流量、txt流量、doc流量、jpg流量和壓縮文件流量進行分析,發(fā)現(xiàn)基于信息熵的方法能夠有效地將低熵值數(shù)據(jù)流和高熵值數(shù)據(jù)流區(qū)分開.但該方法不能識別每個字節(jié)是隨機的而全部流量是偽隨機的非加密壓縮文件流量,因此采用相對熵特征向量{h_0,h_1,h_2,h_3}區(qū)分低熵值數(shù)據(jù)流和高熵值數(shù)據(jù)流,采用蒙特卡洛仿真方法估計π值的誤差p_(error)來區(qū)分局部隨機流量和整體隨機流量.最終提出基于支持向量機的加密流量和非加密流量的識別方法 SVM-ID,并將特征子空間鐖SVM={h_0,h_1,h_2,h_3,p_(error)}作為SVM-ID方法的輸入.將SVM-ID方法和相對熵方法進行對比實驗,結果表明,所提方法不僅能夠很好地識別加密流量,還能區(qū)分加密流量和非加密的壓縮文件流量.
[Abstract]:In view of the problem that it is difficult to distinguish the encrypted traffic from the non-encrypted compressed file traffic by the existing encryption traffic identification methods, this paper analyzes the encrypted traffic and the compressed file traffic in the Internet, such as the encrypted traffic, the txt flow, the doc flow, the jpg traffic, and the compressed file traffic. It is found that the method based on information entropy can effectively distinguish low entropy data stream from high entropy data stream, but this method can not recognize that every byte is random and all traffic is pseudorandom unencrypted compressed file traffic. Therefore, the low entropy data stream and the high entropy value data stream are distinguished by using the relative entropy eigenvector {hash0h1hhhhs2hh3}. Monte Carlo simulation method is used to estimate the error of 蟺 value to distinguish local random traffic from global random flow. Finally, SVM-ID-based recognition method of encrypted and non-encrypted traffic based on support vector machine is proposed, and the feature subspace is subspace. As an input to the SVM-ID method, the SVM-ID method is compared with the relative entropy method. The results show that the proposed method can not only identify the encrypted traffic, but also distinguish the encrypted traffic from the non-encrypted compressed file traffic.
【作者單位】: 東南大學計算機科學與工程學院;東南大學教育部計算機網絡與信息集成重點實驗室;
【基金】:國家高技術研究發(fā)展計劃(863計劃)資助項目(2015AA015603) 國家自然科學基金資助項目(61602114) 中興通訊研究基金資助項目 軟件新技術與產業(yè)化協(xié)同創(chuàng)新中心資助項目
【分類號】:TP18;TP393.06
【相似文獻】
相關期刊論文 前10條
1 楊錚;李國元;左敏;;一個嵌入式網絡流量識別系統(tǒng)的設計與實現(xiàn)[J];計算機系統(tǒng)應用;2008年06期
2 辛峰;於建華;;互聯(lián)網流量識別技術的研究及實現(xiàn)[J];廣東通信技術;2008年03期
3 李晗;劉瀧;;應用層流量識別方法的研究[J];廣東通信技術;2008年04期
4 梁偉;李晗;;網絡流量識別方法研究[J];通信技術;2008年11期
5 張玲;李君;孫雁飛;;快速應用層流量識別方法的研究與實現(xiàn)[J];電信快報;2009年10期
6 葛體富;;網絡流量識別技術以及實現(xiàn)方案淺議[J];電腦知識與技術;2011年22期
7 侯艷;;基于深度包和流的流量識別系統(tǒng)設計[J];電子設計工程;2013年22期
8 馬保雷;宋穎慧;劉亞維;;基于概念漂移檢測的自適應流量識別的研究[J];智能計算機與應用;2013年06期
9 張眾;楊建華;謝高崗;;高效可擴展的應用層流量識別架構[J];通信學報;2008年12期
10 吳震;劉興彬;童曉民;;基于信息熵的流量識別方法[J];計算機工程;2009年20期
相關會議論文 前7條
1 馬永立;壽國礎;胡怡紅;錢宗玨;區(qū)海平;;新型網絡流量識別分析系統(tǒng)及其性能評估[A];第六屆全國信息獲取與處理學術會議論文集(2)[C];2008年
2 張娜娜;;P2P流量識別方法研究[A];江蘇省電子學會2010年學術年會論文集[C];2010年
3 高長喜;辛陽;鈕心忻;楊義先;;基于行為特征分析的P2P流量識別技術的研究[A];第一屆中國高校通信類院系學術研討會論文集[C];2007年
4 許劉兵;;基于人工神經網絡的P2P流量識別模型的研究[A];中國電子學會第十五屆信息論學術年會暨第一屆全國網絡編碼學術年會論文集(上冊)[C];2008年
5 賈波;鄒園萍;;基于無監(jiān)督學習的P2P流量識別[A];浙江省信號處理學會2011學術年會論文集[C];2011年
6 王波;周曉光;蘇志遠;;基于節(jié)點狀態(tài)的P2P流量識別系統(tǒng)[A];中國電子學會第十五屆信息論學術年會暨第一屆全國網絡編碼學術年會論文集(下冊)[C];2008年
7 王波;周曉光;蘇志遠;;基于節(jié)點狀態(tài)的P2P流量識別系統(tǒng)[A];2008通信理論與技術新發(fā)展——第十三屆全國青年通信學術會議論文集(下)[C];2008年
相關博士學位論文 前7條
1 侯穎;網絡流量測量與識別關鍵技術研究[D];解放軍信息工程大學;2015年
2 林冠洲;網絡流量識別關鍵技術研究[D];北京郵電大學;2011年
3 田旭;互聯(lián)網流量識別技術研究[D];北京郵電大學;2012年
4 彭建芬;P2P流量識別關鍵技術研究[D];北京郵電大學;2011年
5 張劍;寬帶接入網流量識別關鍵技術研究[D];北京郵電大學;2011年
6 李冰;VoIP和P2P IPTV流量的識別與測量研究[D];天津大學;2010年
7 郭振濱;互聯(lián)網測量與建模研究[D];北京交通大學;2012年
相關碩士學位論文 前10條
1 王曉明;家庭網絡流量識別與QoS控制[D];山東大學;2015年
2 石林;基于DPI的流量識別方法研究與應用[D];江西理工大學;2015年
3 武光達;基于DPI的流量識別系統(tǒng)設計[D];貴州大學;2015年
4 羅平;網絡層流量識別與關鍵內容提取系統(tǒng)設計與實現(xiàn)[D];電子科技大學;2014年
5 白宇;基于馬爾可夫鏈的加密流識別系統(tǒng)研究與實現(xiàn)[D];北京理工大學;2015年
6 譚靜;基于機器學習的P2P流量識別算法研究[D];河南理工大學;2014年
7 龔雪梅;基于用戶感知的無線網絡流量識別與控制的設計與實現(xiàn)[D];電子科技大學;2015年
8 王煒;網絡應用層加密流量識別技術研究[D];解放軍信息工程大學;2014年
9 王偉萌;基于應用層的流量識別系統(tǒng)設計與實現(xiàn)[D];北方工業(yè)大學;2016年
10 劉松吟;基于聚類分析的電力通信網絡流量分類算法研究[D];東南大學;2016年
,本文編號:1541141
本文鏈接:http://sikaile.net/guanlilunwen/ydhl/1541141.html