大規(guī)模網(wǎng)絡(luò)下復(fù)雜應(yīng)用識別及私有網(wǎng)絡(luò)挖掘技術(shù)研究
發(fā)布時間:2018-06-29 06:18
本文選題:協(xié)議識別 + 復(fù)雜應(yīng)用; 參考:《哈爾濱理工大學(xué)》2016年博士論文
【摘要】:互聯(lián)網(wǎng)的出現(xiàn)為人們帶來了極大的便利,改變了吃穿住行等多個領(lǐng)域的生活方式。隨著互聯(lián)網(wǎng)的日益普及和網(wǎng)絡(luò)技術(shù)的飛速發(fā)展,互聯(lián)網(wǎng)已經(jīng)成為了人們主要的交流溝通工具和信息分享渠道。然而,隨著網(wǎng)絡(luò)用戶規(guī)模的不斷擴大,網(wǎng)絡(luò)新技術(shù)的不斷發(fā)展,給網(wǎng)絡(luò)用戶帶來便利的同時卻是給網(wǎng)絡(luò)管理帶來了巨大的挑戰(zhàn)。傳統(tǒng)的網(wǎng)絡(luò)分析方法在面對大規(guī)模的網(wǎng)絡(luò)流量時,遇到嚴重的困境:首先,新出現(xiàn)的網(wǎng)絡(luò)應(yīng)用大規(guī)模地使用分布式架構(gòu)和加密協(xié)議,并采用復(fù)雜的通信過程保證業(yè)務(wù)的完備性,極大地改變了網(wǎng)絡(luò)流量的組成方式,使得傳統(tǒng)的協(xié)議識別方法無法有效識別關(guān)鍵業(yè)務(wù)和關(guān)鍵應(yīng)用,嚴重影響了網(wǎng)絡(luò)運營商和網(wǎng)絡(luò)服務(wù)商對網(wǎng)絡(luò)環(huán)境的認知,以及對關(guān)鍵服務(wù)的保障,甚至可能帶來嚴重的網(wǎng)絡(luò)安全問題,造成用戶的數(shù)據(jù)丟失和隱私被竊取;其次,大規(guī)模網(wǎng)絡(luò)環(huán)境所帶來的類不平衡問題嚴重影響了基于機器學(xué)習(xí)的協(xié)議識別方法的準確性,降低了其實用效果;再次,隨著網(wǎng)絡(luò)用戶、帶寬和應(yīng)用的快速增長,網(wǎng)絡(luò)流量急劇膨脹,呈現(xiàn)大數(shù)據(jù)的特性,給傳統(tǒng)的網(wǎng)絡(luò)協(xié)議分析方法帶來了嚴重的挑戰(zhàn)。因此,基于上述研究背景及相關(guān)問題,本文的主要工作包括:(1)針對復(fù)雜應(yīng)用識別難的問題,提出了基于流感知的復(fù)雜應(yīng)用識別方法,該方法通過對復(fù)雜應(yīng)用通信特性的分析和研究,從時間、空間以及流量三個維度對復(fù)雜應(yīng)用所產(chǎn)生的網(wǎng)絡(luò)流量進行感知,建立了一個有效的行為模型,能夠有效識別復(fù)雜應(yīng)用,解決了復(fù)雜應(yīng)用識別問題;(2)針對大規(guī)模網(wǎng)絡(luò)環(huán)境中小類別應(yīng)用識別準確率低的問題,提出了基于Min Max原則分類器集成的SAIMM方法。首先分析了大規(guī)模網(wǎng)絡(luò)下正例樣本和反例樣本比例過大所引發(fā)的的正例識別結(jié)果中誤報增多的原因和機理,之后采用分類器集成的方法對數(shù)據(jù)樣本進行處理,提高小類別應(yīng)用流量的識別偏重,在保證總體識別準確率的同時,提高對小類別應(yīng)用流量的識別性能;(3)針對網(wǎng)絡(luò)流量大數(shù)據(jù)分析難和復(fù)雜應(yīng)用私有網(wǎng)絡(luò)挖掘難的問題,提出了網(wǎng)絡(luò)流場方法,將主機、服務(wù)器、網(wǎng)絡(luò)流量等信息抽象成節(jié)點、通信行為等,采用流場挖掘、流量關(guān)聯(lián)的方法對海量的網(wǎng)絡(luò)信息進行挖掘,構(gòu)建普通用戶甚至網(wǎng)絡(luò)運營商所看不到的復(fù)雜應(yīng)用私有網(wǎng)絡(luò),剖析私有網(wǎng)絡(luò)的運行機制;(4)綜合上述三個方面的研究成果,設(shè)計并實現(xiàn)了一套復(fù)雜應(yīng)用識別與分析系統(tǒng)Spider Web,包括網(wǎng)絡(luò)流量預(yù)處理模塊、流感知模型特征提取模塊、復(fù)雜應(yīng)用識別模塊、海量日志存儲模塊、網(wǎng)絡(luò)流場挖掘模塊以及可視化展示模塊等。實驗結(jié)果表明,該系統(tǒng)能夠有效解決大規(guī)模網(wǎng)絡(luò)環(huán)境下的復(fù)雜網(wǎng)絡(luò)識別與分析問題,滿足識別性能和分析的需要。本文提出的復(fù)雜應(yīng)用識別及私有網(wǎng)絡(luò)挖掘技術(shù),解決了大規(guī)模網(wǎng)絡(luò)環(huán)境下復(fù)雜應(yīng)用識別和分析的多個難點和挑戰(zhàn),能夠有效提升網(wǎng)絡(luò)運營商的網(wǎng)絡(luò)管理能力。
[Abstract]:With the rapid development of the Internet and the rapid development of network technology , the Internet has become the main communication tool and information - sharing channel . This paper proposes a network flow field method , which abstracts the information such as host , server and network traffic into nodes , communication behaviors , etc . It uses the method of flow field mining and flow association to excavate the massive network information , analyzes the operation mechanism of the private network , and implements a set of complex application identification and analysis system Spider Web . The experimental results show that the system can effectively solve the problems of complex network identification and analysis in large - scale network environment , and solve the problems and challenges of complex application identification and analysis in large - scale network environment .
【學(xué)位授予單位】:哈爾濱理工大學(xué)
【學(xué)位級別】:博士
【學(xué)位授予年份】:2016
【分類號】:TP393.08;TP311.13
【相似文獻】
相關(guān)期刊論文 前5條
1 鄒強;李楚;;面向復(fù)雜應(yīng)用的存儲負載模型構(gòu)造方法[J];華中科技大學(xué)學(xué)報(自然科學(xué)版);2013年03期
2 ;Think&DO——完美的自控系統(tǒng)解決方案[J];國內(nèi)外機電一體化技術(shù);2000年04期
3 ;ESB實現(xiàn)SOA企業(yè)復(fù)雜應(yīng)用[J];中國計算機用戶;2008年30期
4 馬金霞;;圖結(jié)構(gòu)與GIS組件在復(fù)雜應(yīng)用系統(tǒng)中的應(yīng)用[J];中國新技術(shù)新產(chǎn)品;2009年23期
5 ;[J];;年期
相關(guān)博士學(xué)位論文 前1條
1 張洛什;大規(guī)模網(wǎng)絡(luò)下復(fù)雜應(yīng)用識別及私有網(wǎng)絡(luò)挖掘技術(shù)研究[D];哈爾濱理工大學(xué);2016年
,本文編號:2081189
本文鏈接:http://sikaile.net/guanlilunwen/ydhl/2081189.html
最近更新
教材專著