鏈路層上的協(xié)議幀結(jié)構(gòu)識別技術(shù)研究
發(fā)布時間:2021-03-29 23:37
在信息技術(shù)越來越發(fā)達(dá)的今天,無論是電子對抗中的信號偵查,還是通信網(wǎng)中的安全維護(hù),網(wǎng)絡(luò)目標(biāo)識別都具有迫切的現(xiàn)實(shí)需求,尤其是在軍事領(lǐng)域,未知協(xié)議的使用尤為廣泛。因此,未知協(xié)議的識別工作具有十分重要的研究意義。特別是以比特流形式存在的鏈路層協(xié)議,因其不具有任何的語義特征,且高層協(xié)議總是以數(shù)據(jù)形式封裝在其協(xié)議幀中,在協(xié)議識別領(lǐng)域占據(jù)著重要地位,故本文的研究對象為鏈路層以比特流形式存在的未知協(xié)議。當(dāng)前鏈路層未知協(xié)議識別的算法主要是基于模式匹配和數(shù)據(jù)挖掘,其基本流程為:模式序列統(tǒng)計(jì)、頻繁序列挖掘、關(guān)聯(lián)規(guī)則挖掘、鏈路幀切分和協(xié)議格式推測。后續(xù)結(jié)果是否正確總是依賴于前兩個模塊的效果,傳統(tǒng)方案中利用AC(Aho-Corasick)快速統(tǒng)計(jì)進(jìn)行模式序列挖掘時,存在數(shù)據(jù)庫操作次數(shù)過大的缺點(diǎn),基于枚舉樹剪枝的頻繁序列挖掘也存在剪枝周期選擇困難、存儲結(jié)構(gòu)復(fù)雜的弊端,故本文分別對模式序列統(tǒng)計(jì)、頻繁序列挖掘和關(guān)聯(lián)規(guī)則挖掘模塊進(jìn)行了改進(jìn)。首先,對于模式序列統(tǒng)計(jì)和頻繁序列挖掘模塊,本文提出了基于統(tǒng)計(jì)的改進(jìn)AC算法,該算法遍歷一次目標(biāo)序列僅統(tǒng)計(jì)最大長度的模式序列,其余短模式序列均通過統(tǒng)計(jì)公式計(jì)算獲得。由于算法數(shù)據(jù)庫操作次...
【文章來源】:電子科技大學(xué)四川省 211工程院校 985工程院校 教育部直屬院校
【文章頁數(shù)】:81 頁
【學(xué)位級別】:碩士
【部分圖文】:
協(xié)議識別框架
電子科技大學(xué)碩士學(xué)位論文24第三章頻繁序列挖掘技術(shù)從第1.3.3節(jié)的分析中可以看到,現(xiàn)有文獻(xiàn)中基于模式匹配和數(shù)據(jù)挖掘的未知協(xié)議識別算法仍然有許多不可忽略的缺點(diǎn),故從第三章開始,本文將進(jìn)一步的改進(jìn)相關(guān)的算法,其基本流程如圖3-1所示。本章將介紹模式序列統(tǒng)計(jì)和頻繁序列挖掘兩個模塊。對于模式序列的統(tǒng)計(jì),現(xiàn)有的方案多是利用基于AC的快速統(tǒng)計(jì)算法,本文則將之改進(jìn),提出了基于統(tǒng)計(jì)的改進(jìn)AC算法;對于頻繁序列的挖掘,現(xiàn)有方案的典型代表為基于閾值的枚舉樹剪枝算法,鑒于本章首先改進(jìn)了模式序列的統(tǒng)計(jì)算法,使之性能明顯提升,故后續(xù)不再使用剪枝算法,直接利用閾值進(jìn)行頻繁序列的挖掘。圖3-1基于模式匹配和數(shù)據(jù)挖掘的未知協(xié)議識別算法流程3.1相關(guān)定義和概念為了便于理解和敘述,首先明確一些比特流相關(guān)的概念:定義3-1[27]:對于兩個模式序列110...mpppP和110...rqqqQ,若mr且110110......rrpppqqq,則稱P為Q的父序列,Q為P的子序列。
第三章頻繁序列挖掘技術(shù)333.4.2算法性能驗(yàn)證為了對改進(jìn)頻繁序列挖掘算法的性能進(jìn)行驗(yàn)證,現(xiàn)利用Wireshark軟件捕捉ARP協(xié)議數(shù)據(jù)幀,進(jìn)行3-8比特頻繁序列的統(tǒng)計(jì),需要注意的是,利用Wireshark軟件捕捉的ARP協(xié)議,不包含F(xiàn)CS字段,所有,每一個ARP數(shù)據(jù)幀的長度為60字節(jié),即480比特。從前面算法的分析中可以看出,篩選系數(shù)1對頻繁序列的篩選結(jié)果造成了很大的影響,為了更直觀的分析其造成的影響,本文在不同篩選系數(shù)的作用下,對100個ARP協(xié)議數(shù)據(jù)幀進(jìn)行了3-8比特頻繁序列的挖掘,并定義篩選率為頻繁序列與模式序列總數(shù)的差值占模式序列總數(shù)的百分比。其結(jié)果如圖如圖3-4和表3-5所示。表3-5400幀ARP協(xié)議的頻繁序列篩選率篩選系數(shù)10.40.81.21.622.42.83.2模式序列數(shù)499499499499499499499499頻繁序列數(shù)320169936648393125篩選率(%)35.8766.1381.3686.7790.3892.1893.7994.99圖3-4400幀ARP協(xié)議的頻繁序列篩選率
本文編號:3108408
【文章來源】:電子科技大學(xué)四川省 211工程院校 985工程院校 教育部直屬院校
【文章頁數(shù)】:81 頁
【學(xué)位級別】:碩士
【部分圖文】:
協(xié)議識別框架
電子科技大學(xué)碩士學(xué)位論文24第三章頻繁序列挖掘技術(shù)從第1.3.3節(jié)的分析中可以看到,現(xiàn)有文獻(xiàn)中基于模式匹配和數(shù)據(jù)挖掘的未知協(xié)議識別算法仍然有許多不可忽略的缺點(diǎn),故從第三章開始,本文將進(jìn)一步的改進(jìn)相關(guān)的算法,其基本流程如圖3-1所示。本章將介紹模式序列統(tǒng)計(jì)和頻繁序列挖掘兩個模塊。對于模式序列的統(tǒng)計(jì),現(xiàn)有的方案多是利用基于AC的快速統(tǒng)計(jì)算法,本文則將之改進(jìn),提出了基于統(tǒng)計(jì)的改進(jìn)AC算法;對于頻繁序列的挖掘,現(xiàn)有方案的典型代表為基于閾值的枚舉樹剪枝算法,鑒于本章首先改進(jìn)了模式序列的統(tǒng)計(jì)算法,使之性能明顯提升,故后續(xù)不再使用剪枝算法,直接利用閾值進(jìn)行頻繁序列的挖掘。圖3-1基于模式匹配和數(shù)據(jù)挖掘的未知協(xié)議識別算法流程3.1相關(guān)定義和概念為了便于理解和敘述,首先明確一些比特流相關(guān)的概念:定義3-1[27]:對于兩個模式序列110...mpppP和110...rqqqQ,若mr且110110......rrpppqqq,則稱P為Q的父序列,Q為P的子序列。
第三章頻繁序列挖掘技術(shù)333.4.2算法性能驗(yàn)證為了對改進(jìn)頻繁序列挖掘算法的性能進(jìn)行驗(yàn)證,現(xiàn)利用Wireshark軟件捕捉ARP協(xié)議數(shù)據(jù)幀,進(jìn)行3-8比特頻繁序列的統(tǒng)計(jì),需要注意的是,利用Wireshark軟件捕捉的ARP協(xié)議,不包含F(xiàn)CS字段,所有,每一個ARP數(shù)據(jù)幀的長度為60字節(jié),即480比特。從前面算法的分析中可以看出,篩選系數(shù)1對頻繁序列的篩選結(jié)果造成了很大的影響,為了更直觀的分析其造成的影響,本文在不同篩選系數(shù)的作用下,對100個ARP協(xié)議數(shù)據(jù)幀進(jìn)行了3-8比特頻繁序列的挖掘,并定義篩選率為頻繁序列與模式序列總數(shù)的差值占模式序列總數(shù)的百分比。其結(jié)果如圖如圖3-4和表3-5所示。表3-5400幀ARP協(xié)議的頻繁序列篩選率篩選系數(shù)10.40.81.21.622.42.83.2模式序列數(shù)499499499499499499499499頻繁序列數(shù)320169936648393125篩選率(%)35.8766.1381.3686.7790.3892.1893.7994.99圖3-4400幀ARP協(xié)議的頻繁序列篩選率
本文編號:3108408
本文鏈接:http://sikaile.net/kejilunwen/ruanjiangongchenglunwen/3108408.html
最近更新
教材專著