基于模式匹配和機(jī)器學(xué)習(xí)的協(xié)議識別技術(shù)研究
發(fā)布時間:2020-02-18 00:56
【摘要】:協(xié)議識別技術(shù)是實(shí)現(xiàn)流量監(jiān)控、入侵檢測以及用戶行為分析等應(yīng)用的基礎(chǔ)。隨著互聯(lián)網(wǎng)的發(fā)展,新型的網(wǎng)絡(luò)類型不斷出現(xiàn),新的協(xié)議規(guī)范很多都不再對外公開且使用隨機(jī)的端口。另外,由于信息安全或用戶隱私的問題,有越來越多的網(wǎng)絡(luò)流量被加密,這些都使得協(xié)議識別面臨和需要解決的問題越來越復(fù)雜。所以,尋找更加高效的協(xié)議識別方法有著重要的研究和實(shí)際應(yīng)用意義;趦(nèi)容的協(xié)議識別能夠達(dá)到很高的準(zhǔn)確率,基于流統(tǒng)計(jì)特征的識別可以識別加密流量且有較好的吞吐性,這兩種協(xié)議識別方法是當(dāng)今協(xié)議識別中應(yīng)用最廣泛的。本文主要是通過改進(jìn)這兩種協(xié)議識別方法中的匹配算法的性能來提高協(xié)議識別效率的,具體的研究工作主要包括以下幾個方面:1)提出基于模式匹配和機(jī)器學(xué)習(xí)的協(xié)議識別系統(tǒng)。該系統(tǒng)結(jié)合這兩種協(xié)議識別技術(shù)的優(yōu)點(diǎn),可以通過模式匹配方法實(shí)現(xiàn)對協(xié)議內(nèi)容的高準(zhǔn)確率的識別,也可以利用機(jī)器學(xué)習(xí)方法識別出加密的流量,并可以對協(xié)議特征庫不斷更新。2)研究和分析了常見的模式匹配算法,并提出了一種改進(jìn)的BM算法。該算法可以減少算法預(yù)處理復(fù)雜度,并充分利用失配時候的信息,提高最大跳躍距離,并考慮了更多情況,提高模式串達(dá)到最大或者較大跳躍距離的概率,從而提高了匹配的效率。3)提出了一種ESBS-GA特征選擇方法。在現(xiàn)有的特征選擇方法的基礎(chǔ)之上,用遺傳算法對現(xiàn)在常用的一些流量特征進(jìn)一步篩選。ESBS-GA能夠篩選獲得特征個數(shù)更少,且分類效果更佳的流量特征集合,簡化了Kmens分類過程,大大提高了分類性能。4)研究和分析了常見的機(jī)器學(xué)習(xí)算法,針對K-means算法中K值較難確定的缺點(diǎn),提出一種基于二分查找法的K值優(yōu)化方案。通過結(jié)合二分查找法,能夠更迅速的確定出比較接近實(shí)際分類個數(shù)的K值,并且在該K值下,能夠獲得很好分類效果。
【學(xué)位授予單位】:電子科技大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2014
【分類號】:TP393.04;TP181
本文編號:2580562
【學(xué)位授予單位】:電子科技大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2014
【分類號】:TP393.04;TP181
【參考文獻(xiàn)】
相關(guān)期刊論文 前1條
1 揣錦華;鄭景;關(guān)銳;;BM模式匹配算法的研究和改進(jìn)[J];電子設(shè)計(jì)工程;2012年19期
,本文編號:2580562
本文鏈接:http://sikaile.net/guanlilunwen/ydhl/2580562.html
最近更新
教材專著