基于混合方法的網(wǎng)絡(luò)流量分類技術(shù)研究
本文選題:網(wǎng)絡(luò)流量分類 + 重組方法; 參考:《哈爾濱理工大學(xué)》2014年碩士論文
【摘要】:已有的網(wǎng)絡(luò)流量分類技術(shù)包括基于端口、基于載荷、基于流量統(tǒng)計特征、基于行為以及基于流量傳播圖等方法。大部分新的應(yīng)用使用動態(tài)端口,導(dǎo)致基于端口的分類方法準確率低于50%;谳d荷的分類方法由于其較高的時間和空間復(fù)雜度,不適用高速鏈路的分類,也不能識別加密流量;诹髁拷y(tǒng)計特征和機器學(xué)習(xí)的分類方法在實時網(wǎng)絡(luò)流量分類中具有較差的魯棒性;谛袨楹突诹髁總鞑D的分類方法不適用于實時流量分類。因此,研究新的網(wǎng)絡(luò)流量分類方法,尤其是多種分類技術(shù)的混合方法,對滿足當(dāng)今網(wǎng)絡(luò)環(huán)境下快速、準確、應(yīng)用多樣化的流量分類要求很有必要;谡齽t表達式的分類方法需要順序的載荷,基于流量統(tǒng)計特征與機器學(xué)習(xí)的分類方法需要順序的網(wǎng)絡(luò)流特征。然而針對TCP數(shù)據(jù)流,己有的TCP數(shù)據(jù)流重組方法不能處理SYN包丟失、FIN包丟失以及數(shù)據(jù)包丟失的情況。因此,本文首先提出了一種基于滑動窗口的TCP數(shù)據(jù)流重組方法,重點解決在丟包情況下的重組,很大程度上提高了重組效率。單獨的使用基于端口和基于載荷的分類方法不能同時滿足快速和準確的分類要求,因此,本文結(jié)合基于端口分類技術(shù)的快速性和基于載荷分類技術(shù)的準確性,提出了一種基于單向監(jiān)督與概率衰減的分類方法,實現(xiàn)了在實時流量下快速、準確的分類。在該方法基礎(chǔ)之上,本文又提出了一種高性能的層次化網(wǎng)絡(luò)流量分類框架,融合了多種分類技術(shù),不同分類模塊之間反饋分類結(jié)果并相互指導(dǎo),從而滿足快速、準確、應(yīng)用多樣化的分類要求。在該框架基礎(chǔ)之上,本文研究并開發(fā)了一套開源的網(wǎng)絡(luò)流量分類與對比基準平臺OpenNTCB,該平臺包含了從網(wǎng)絡(luò)數(shù)據(jù)的前期預(yù)處理到后期分類結(jié)果展示的所有功能模塊,提供靈活的配置策略和擴展接口。該平臺開發(fā)的目的是為網(wǎng)絡(luò)流量分類領(lǐng)域的研究人員提供對比的基準并促進新的分類技術(shù)的分享,為該領(lǐng)域的發(fā)展提供支持與幫助。
[Abstract]:The existing network traffic classification techniques include port-based, load-based, traffic statistical features, behavior-based and flow-based traffic propagation diagrams. Most of the new applications use dynamic ports, resulting in a classification accuracy of less than 50. Because of its high time and space complexity, the load-based classification method is not suitable for high-speed link classification, nor can it identify encrypted traffic. The classification method based on traffic statistics and machine learning has poor robustness in real-time network traffic classification. Behavior-based and traffic propagation graph based classification methods are not suitable for real-time traffic classification. Therefore, it is necessary to study new network traffic classification methods, especially the mixed methods of various classification techniques, to meet the requirements of fast, accurate and diversified traffic classification in the current network environment. The classification method based on regular expression needs sequential load, and the classification method based on flow statistics and machine learning requires sequential network flow feature. However, for TCP data flow, existing TCP data stream recombination methods can not deal with SYN packet loss and packet loss. Therefore, this paper first proposes a TCP data stream reorganization method based on sliding window, which focuses on solving the recombination in the case of packet loss, which greatly improves the efficiency of recombination. The use of port-based and load-based classification methods alone can not meet the requirements of fast and accurate classification. Therefore, this paper combines the speediness of port-based classification and the accuracy of load-based classification. A classification method based on one-way supervision and probability attenuation is proposed, which realizes fast and accurate classification under real-time traffic. On the basis of this method, a high performance hierarchical network traffic classification framework is proposed, which combines many classification techniques, feedback the classification results and guide each other among different classification modules. Application of diverse classification requirements. On the basis of this framework, this paper studies and develops an open source network traffic classification and comparison benchmark platform, OpenNTCBB, which includes all the functional modules from the pre-processing of network data to the display of post-classification results. Provides flexible configuration policies and extended interfaces. The purpose of this platform is to provide comparative benchmarks for researchers in the field of network traffic classification and to promote the sharing of new classification techniques, and to provide support and help for the development of this field.
【學(xué)位授予單位】:哈爾濱理工大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2014
【分類號】:TP393.06
【相似文獻】
中國期刊全文數(shù)據(jù)庫 前10條
1 王若愚;方芳;葉昭;;流量分類技術(shù)精細管理網(wǎng)絡(luò)[J];中國教育網(wǎng)絡(luò);2012年02期
2 馬明成;莫曉俊;姜洪臣;徐波;;音頻分類技術(shù)在廣播質(zhì)量評估中的應(yīng)用[J];廣播與電視技術(shù);2010年10期
3 黃樹成;曲亞輝;;數(shù)據(jù)流分類技術(shù)研究綜述[J];計算機應(yīng)用研究;2009年10期
4 張俊,石功軍,王中平;信息處理過程中的分類技術(shù)[J];聲學(xué)技術(shù);2003年04期
5 張李,涂曉東,何誠;流分類技術(shù)的研究[J];電子科技大學(xué)學(xué)報;2004年06期
6 李洋;趙驊;;基于信息熵和決策分類技術(shù)的郵件識別研究[J];計算機科學(xué);2008年02期
7 夏雪;肖德寶;顧婷;;基于本體的報警分類技術(shù)在報警評估過程中的應(yīng)用與實現(xiàn)(英文)[J];北京交通大學(xué)學(xué)報;2008年06期
8 黃敏;何中市;;分類技術(shù)在高職教學(xué)質(zhì)量評價分析中的應(yīng)用[J];計算機工程與設(shè)計;2012年03期
9 王與;劉洋;;分類技術(shù)在高校教學(xué)管理中的應(yīng)用[J];滁州學(xué)院學(xué)報;2011年05期
10 段巍巍;許海濱;;基于分類技術(shù)的目標客戶輔助定位方法研究[J];江蘇通信;2008年03期
中國重要會議論文全文數(shù)據(jù)庫 前1條
1 梁曉雯;閔友鋼;;音樂情感分類技術(shù)在媒體資產(chǎn)管理中的應(yīng)用[A];中國新聞技術(shù)工作者聯(lián)合會2008年學(xué)術(shù)年會論文集(下)[C];2008年
中國博士學(xué)位論文全文數(shù)據(jù)庫 前1條
1 畢夏安;高性能包分類技術(shù)及其應(yīng)用研究[D];湖南大學(xué);2012年
中國碩士學(xué)位論文全文數(shù)據(jù)庫 前10條
1 周方;社交網(wǎng)絡(luò)節(jié)點分類技術(shù)研究[D];遼寧大學(xué);2015年
2 李林林;面向不均衡數(shù)據(jù)的半監(jiān)督網(wǎng)絡(luò)流量分類技術(shù)研究與實現(xiàn)[D];解放軍信息工程大學(xué);2014年
3 董輝;基于混合方法的網(wǎng)絡(luò)流量分類技術(shù)研究[D];哈爾濱理工大學(xué);2014年
4 叢蓉;基于采樣的網(wǎng)絡(luò)流量分類技術(shù)研究[D];北京郵電大學(xué);2012年
5 朱秋香;流分類技術(shù)研究及其原型系統(tǒng)的實現(xiàn)[D];東南大學(xué);2004年
6 張海笑;數(shù)據(jù)挖掘分類技術(shù)在高校教學(xué)中的應(yīng)用研究[D];廣東工業(yè)大學(xué);2005年
7 ;;分類技術(shù)在稅收管理中的應(yīng)用[D];鄭州大學(xué);2003年
8 蔣杰;基于分類技術(shù)的電子支付平臺作弊賬戶的識別模型研究[D];浙江工業(yè)大學(xué);2012年
9 陳錚;基于音樂流派分類技術(shù)的音樂庫分類檢索系統(tǒng)的研究與實現(xiàn)[D];華東師范大學(xué);2012年
10 代麗;DFI流量分類技術(shù)的研究和實現(xiàn)[D];北京郵電大學(xué);2011年
,本文編號:1901176
本文鏈接:http://sikaile.net/guanlilunwen/ydhl/1901176.html