天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當前位置:主頁 > 管理論文 > 移動網絡論文 >

基于機器學習的P2P流量識別算法研究

發(fā)布時間:2018-06-07 19:07

  本文選題:P2P + 流量識別; 參考:《河南理工大學》2014年碩士論文


【摘要】:P2P技術的快速發(fā)展使得P2P流量在網絡流量中的比重越來越大,到目前為止,P2P流量成為網絡中所占比重最大的流量,這對網絡管理造成了巨大的困難,對流量監(jiān)控技術提出了更高的要求。與此同時,P2P應用為了躲避檢測,正在向可以隨機選擇端口號進行通信和對應用層數據加密的方向發(fā)展,因此,造成早期的流量識別技術對P2P流量的識別準確率降低,無法達到預期的要求,目前機器學習的方法逐漸興起,在流量識別中的應用由于具有不依賴端口號與負載信息的優(yōu)勢,得到了研究界的廣泛關注。本文對首先P2P技術進行了分析,包括P2P技術的定義、網絡結構、特點以及應用類型,對現階段的P2P流量識別技術進行了總結,并重點分析研究了在P2P流量識別中的機器學習算法。接下來深入研究了機器學習中的K均值與決策樹算法,針對決策樹模型在標簽樣本稀少的情況下識別準確率不高的問題,提出一種基于K均值與決策樹的P2P流量識別算法。為提高K均值聚類的準確性,為決策樹訓練提供準確的標簽樣本,首先提出一種改進的K均值半監(jiān)督聚類,通過用標簽樣本與貪心算法對初始聚類中心進行選定,然后對樣本數據聚類,采用最大似然估計對聚類結果和實際網絡應用類型進行匹配,提高了K均值算法的聚類性能。然后采用改進的K均值半監(jiān)督聚類算法對含有大量無標簽樣本和少量標簽樣本的訓練數據集進行預處理,用得到的含有大量標簽樣本的新訓練集構建決策樹分類模型。最后的實驗結果表明,在標記樣本較少的情況下,新算法對P2P流量的識別能力較好。
[Abstract]:The rapid development of P2P technology makes the proportion of P2P traffic in network traffic more and more large, so far, P2P traffic has become the largest volume of traffic in the network, which has caused great difficulties for network management and higher requirements for traffic monitoring technology. In the same time, P2P applications are going to be random in order to avoid detection. The port number is selected for communication and the direction of encryption of the application layer data is developed. Therefore, the early flow recognition technology reduces the recognition accuracy of the P2P traffic and can not meet the expected requirements. At present, the method of machine learning is gradually rising, and the application in traffic recognition is based on the advantages of not relying on port number and load information. This paper analyzes the first P2P technology, including the definition of P2P technology, network structure, characteristics and application types, summarizes the current P2P flow recognition technology, and focuses on the machine learning algorithm in P2P traffic identification. Then, the K in machine learning is studied in depth. In order to improve the accuracy of the K mean and the decision tree, an improved P2P mean semi supervised clustering algorithm is proposed to improve the accuracy of the K mean clustering, and a modified K mean semi supervised clustering algorithm is proposed. Class, by selecting the initial clustering center with the label sample and the greedy algorithm, then clustering the sample data, using the maximum likelihood estimation to match the clustering results and the actual network application types, the clustering performance of the K mean algorithm is improved. Then the improved K mean semi supervised clustering algorithm is used to contain a large number of unlabeled samples. The training data set is preprocessed with a small number of label samples, and a decision tree classification model is constructed with the new training set containing a large number of label samples. The final experimental results show that the new algorithm has better recognition ability for P2P traffic under the case of fewer marked samples.
【學位授予單位】:河南理工大學
【學位級別】:碩士
【學位授予年份】:2014
【分類號】:TP393.06

【相似文獻】

相關期刊論文 前10條

1 楊錚;李國元;左敏;;一個嵌入式網絡流量識別系統(tǒng)的設計與實現[J];計算機系統(tǒng)應用;2008年06期

2 辛峰;於建華;;互聯網流量識別技術的研究及實現[J];廣東通信技術;2008年03期

3 李晗;劉瀧;;應用層流量識別方法的研究[J];廣東通信技術;2008年04期

4 梁偉;李晗;;網絡流量識別方法研究[J];通信技術;2008年11期

5 張玲;李君;孫雁飛;;快速應用層流量識別方法的研究與實現[J];電信快報;2009年10期

6 葛體富;;網絡流量識別技術以及實現方案淺議[J];電腦知識與技術;2011年22期

7 侯艷;;基于深度包和流的流量識別系統(tǒng)設計[J];電子設計工程;2013年22期

8 馬保雷;宋穎慧;劉亞維;;基于概念漂移檢測的自適應流量識別的研究[J];智能計算機與應用;2013年06期

9 張眾;楊建華;謝高崗;;高效可擴展的應用層流量識別架構[J];通信學報;2008年12期

10 吳震;劉興彬;童曉民;;基于信息熵的流量識別方法[J];計算機工程;2009年20期

相關會議論文 前7條

1 馬永立;壽國礎;胡怡紅;錢宗玨;區(qū)海平;;新型網絡流量識別分析系統(tǒng)及其性能評估[A];第六屆全國信息獲取與處理學術會議論文集(2)[C];2008年

2 張娜娜;;P2P流量識別方法研究[A];江蘇省電子學會2010年學術年會論文集[C];2010年

3 高長喜;辛陽;鈕心忻;楊義先;;基于行為特征分析的P2P流量識別技術的研究[A];第一屆中國高校通信類院系學術研討會論文集[C];2007年

4 許劉兵;;基于人工神經網絡的P2P流量識別模型的研究[A];中國電子學會第十五屆信息論學術年會暨第一屆全國網絡編碼學術年會論文集(上冊)[C];2008年

5 賈波;鄒園萍;;基于無監(jiān)督學習的P2P流量識別[A];浙江省信號處理學會2011學術年會論文集[C];2011年

6 王波;周曉光;蘇志遠;;基于節(jié)點狀態(tài)的P2P流量識別系統(tǒng)[A];中國電子學會第十五屆信息論學術年會暨第一屆全國網絡編碼學術年會論文集(下冊)[C];2008年

7 王波;周曉光;蘇志遠;;基于節(jié)點狀態(tài)的P2P流量識別系統(tǒng)[A];2008通信理論與技術新發(fā)展——第十三屆全國青年通信學術會議論文集(下)[C];2008年

相關博士學位論文 前6條

1 林冠洲;網絡流量識別關鍵技術研究[D];北京郵電大學;2011年

2 田旭;互聯網流量識別技術研究[D];北京郵電大學;2012年

3 彭建芬;P2P流量識別關鍵技術研究[D];北京郵電大學;2011年

4 張劍;寬帶接入網流量識別關鍵技術研究[D];北京郵電大學;2011年

5 李冰;VoIP和P2P IPTV流量的識別與測量研究[D];天津大學;2010年

6 郭振濱;互聯網測量與建模研究[D];北京交通大學;2012年

相關碩士學位論文 前10條

1 王曉明;家庭網絡流量識別與QoS控制[D];山東大學;2015年

2 石林;基于DPI的流量識別方法研究與應用[D];江西理工大學;2015年

3 武光達;基于DPI的流量識別系統(tǒng)設計[D];貴州大學;2015年

4 羅平;網絡層流量識別與關鍵內容提取系統(tǒng)設計與實現[D];電子科技大學;2014年

5 白宇;基于馬爾可夫鏈的加密流識別系統(tǒng)研究與實現[D];北京理工大學;2015年

6 譚靜;基于機器學習的P2P流量識別算法研究[D];河南理工大學;2014年

7 練琪;基于聚類分析的應用層流量識別研究[D];湖南大學;2010年

8 朱欣;基于數據流挖掘技術的流量識別[D];蘇州大學;2011年

9 張波;基于流特征的加密流量識別技術研究[D];哈爾濱工業(yè)大學;2012年

10 孫海霞;基于關聯規(guī)則的流量識別方法研究[D];合肥工業(yè)大學;2009年

,

本文編號:1992444

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/guanlilunwen/ydhl/1992444.html


Copyright(c)文論論文網All Rights Reserved | 網站地圖 |

版權申明:資料由用戶8ea66***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com