基于機(jī)器學(xué)習(xí)的二進(jìn)制漏洞挖掘技術(shù)研究
發(fā)布時(shí)間:2021-03-07 11:48
傳統(tǒng)的軟件漏洞挖掘技術(shù)是包括模糊測(cè)試、符號(hào)執(zhí)行、模型檢測(cè)和污點(diǎn)分析等在內(nèi)的技術(shù)。近年來,大數(shù)據(jù)和機(jī)器學(xué)習(xí)的興起又引導(dǎo)了新一輪的軟件漏洞挖掘技術(shù)研究。目前,使用機(jī)器學(xué)習(xí)或數(shù)據(jù)挖掘進(jìn)行軟件漏洞挖掘的研究主要分為三大類:基于軟件度量的漏洞預(yù)測(cè)技術(shù)、基于異常檢測(cè)的漏洞預(yù)測(cè)技術(shù)及基于漏洞代碼模式識(shí)別的漏洞預(yù)測(cè)技術(shù)等。但是,先前的大多數(shù)研究都是針對(duì)源代碼的,只有很少一部分是針對(duì)二進(jìn)制軟件的。并且,大多數(shù)的研究都是基于粗粒度的,以軟件組件為粒度的漏洞挖掘不利于精確定位到漏洞的具體位置,以函數(shù)為粒度的漏洞挖掘?qū)⒙┒茨J骄窒拊诤瘮?shù)內(nèi)部。本文主要研究了以下內(nèi)容:(1)分析當(dāng)前主流的軟件漏洞的產(chǎn)生原因,總結(jié)緩沖區(qū)溢出、整數(shù)溢出、釋放后重用漏洞在匯編層面上的特點(diǎn),了解程序運(yùn)行時(shí)可能接收到的信號(hào)以及部分軟件保護(hù)機(jī)制,通過靜態(tài)分析和動(dòng)態(tài)分析的常用手段實(shí)現(xiàn)對(duì)程序進(jìn)行跟蹤和自動(dòng)化分析。(2)在樣本收集方面,本文認(rèn)為函數(shù)調(diào)用序列不足以刻畫漏洞,因而提出一種基于代碼塊粒度的樣本收集方法,創(chuàng)新性地以匯編代碼塊為粒度,對(duì)于漏洞程序,提取從數(shù)據(jù)引入到程序崩潰之間的代碼片段;對(duì)于正常程序,提取從數(shù)據(jù)引入點(diǎn)到程序退出之間的代碼片段...
【文章來源】:西安電子科技大學(xué)陜西省 211工程院校 教育部直屬院校
【文章頁數(shù)】:79 頁
【學(xué)位級(jí)別】:碩士
【部分圖文】:
歷年漏洞收集數(shù)量曲線圖
gram 模型則通過一個(gè)詞來預(yù)測(cè)其前后 N 個(gè)詞。當(dāng) N=2 時(shí),兩種模型的結(jié)構(gòu)分別如圖2.1 所示:圖2.1 兩種 Word2Vec 訓(xùn)練模型以 CBOW 模型為例,假設(shè)其上下文窗口大小為 k,對(duì)于每一個(gè)詞 的預(yù)測(cè),其上下文為 ,那么在上下文是 的情況下,中心詞為 的概率可以表示為 ( )。這個(gè)概率 p 越接近 1 就表示預(yù)測(cè)結(jié)果越準(zhǔn)確。那么問題就可以轉(zhuǎn)化為對(duì)所有的 ( )求對(duì)數(shù)似然概率之和,使其最大,當(dāng)然也可以取其平均值。對(duì)于一個(gè)大小為 T 的詞庫,其平均對(duì)數(shù)似然概率 的計(jì)算公式如下: = ( ) (2-1)其中
西班牙神經(jīng)生物學(xué)家 Rafael Lorente de Nó 發(fā)現(xiàn)大腦皮層的解在神經(jīng)回路中循環(huán)傳遞,并由此提出反響回路假設(shè)[22],該假說被認(rèn)為記憶的重要原因 。990 年,Elman 對(duì) Jordan 網(wǎng)絡(luò)[23]進(jìn)行了改進(jìn),提出了簡(jiǎn)單循環(huán)網(wǎng)絡(luò)[24]。lman 網(wǎng)絡(luò)如圖 2.2 所示,兩個(gè)網(wǎng)絡(luò)均包含三層結(jié)構(gòu),分別為:輸入層層。不同的是,Jordan 網(wǎng)絡(luò)的關(guān)聯(lián)層(Context Units,一種特殊的隱連接,存儲(chǔ)來自上一時(shí)刻輸出層的值 ,而 Elman 網(wǎng)絡(luò)的關(guān)聯(lián)層與儲(chǔ)來自上一時(shí)刻隱含層的輸出值 。因而,處于 t 時(shí)刻的隱含層在當(dāng)前時(shí)刻的輸入 和前一時(shí)刻的輸出 ,這里的 泛指Jordan網(wǎng)絡(luò)an 網(wǎng)絡(luò)中的 ,它們均保存在當(dāng)前時(shí)刻的關(guān)聯(lián)層中。這樣的設(shè)計(jì)使輸出不僅和當(dāng)前時(shí)刻的輸入有關(guān),還和以往時(shí)刻的輸入都有關(guān)。比于 Jordan 網(wǎng)絡(luò),Elman 網(wǎng)絡(luò)更加易于擴(kuò)展,因?yàn)?Elman 網(wǎng)絡(luò)中的層的自循環(huán),因而網(wǎng)絡(luò)結(jié)構(gòu)的設(shè)計(jì)可以更加靈活。而且,Jordan 網(wǎng)絡(luò)層的維度不一致時(shí)還需要進(jìn)行額外的調(diào)整。
【參考文獻(xiàn)】:
期刊論文
[1]人工智能技術(shù)在安全漏洞領(lǐng)域的應(yīng)用[J]. 孫鴻宇,何遠(yuǎn),王基策,董穎,朱立鵬,王鶴,張玉清. 通信學(xué)報(bào). 2018(08)
[2]卷積神經(jīng)網(wǎng)絡(luò)研究綜述[J]. 周飛燕,金林鵬,董軍. 計(jì)算機(jī)學(xué)報(bào). 2017(06)
[3]淺談緩沖區(qū)溢出[J]. 于棣維,劉永隆. 硅谷. 2009(14)
[4]緩沖區(qū)溢出攻擊:原理,防御及檢測(cè)[J]. 蔣衛(wèi)華,李偉華,杜君. 計(jì)算機(jī)工程. 2003(10)
[5]軟件度量學(xué)綜述[J]. 邢大紅,曹佳冬,汪和才,劉宗田. 計(jì)算機(jī)工程與應(yīng)用. 2001(01)
碩士論文
[1]基于代碼屬性圖的軟件安全漏洞挖掘方法研究[D]. 楊克.燕山大學(xué) 2015
本文編號(hào):3069033
【文章來源】:西安電子科技大學(xué)陜西省 211工程院校 教育部直屬院校
【文章頁數(shù)】:79 頁
【學(xué)位級(jí)別】:碩士
【部分圖文】:
歷年漏洞收集數(shù)量曲線圖
gram 模型則通過一個(gè)詞來預(yù)測(cè)其前后 N 個(gè)詞。當(dāng) N=2 時(shí),兩種模型的結(jié)構(gòu)分別如圖2.1 所示:圖2.1 兩種 Word2Vec 訓(xùn)練模型以 CBOW 模型為例,假設(shè)其上下文窗口大小為 k,對(duì)于每一個(gè)詞 的預(yù)測(cè),其上下文為 ,那么在上下文是 的情況下,中心詞為 的概率可以表示為 ( )。這個(gè)概率 p 越接近 1 就表示預(yù)測(cè)結(jié)果越準(zhǔn)確。那么問題就可以轉(zhuǎn)化為對(duì)所有的 ( )求對(duì)數(shù)似然概率之和,使其最大,當(dāng)然也可以取其平均值。對(duì)于一個(gè)大小為 T 的詞庫,其平均對(duì)數(shù)似然概率 的計(jì)算公式如下: = ( ) (2-1)其中
西班牙神經(jīng)生物學(xué)家 Rafael Lorente de Nó 發(fā)現(xiàn)大腦皮層的解在神經(jīng)回路中循環(huán)傳遞,并由此提出反響回路假設(shè)[22],該假說被認(rèn)為記憶的重要原因 。990 年,Elman 對(duì) Jordan 網(wǎng)絡(luò)[23]進(jìn)行了改進(jìn),提出了簡(jiǎn)單循環(huán)網(wǎng)絡(luò)[24]。lman 網(wǎng)絡(luò)如圖 2.2 所示,兩個(gè)網(wǎng)絡(luò)均包含三層結(jié)構(gòu),分別為:輸入層層。不同的是,Jordan 網(wǎng)絡(luò)的關(guān)聯(lián)層(Context Units,一種特殊的隱連接,存儲(chǔ)來自上一時(shí)刻輸出層的值 ,而 Elman 網(wǎng)絡(luò)的關(guān)聯(lián)層與儲(chǔ)來自上一時(shí)刻隱含層的輸出值 。因而,處于 t 時(shí)刻的隱含層在當(dāng)前時(shí)刻的輸入 和前一時(shí)刻的輸出 ,這里的 泛指Jordan網(wǎng)絡(luò)an 網(wǎng)絡(luò)中的 ,它們均保存在當(dāng)前時(shí)刻的關(guān)聯(lián)層中。這樣的設(shè)計(jì)使輸出不僅和當(dāng)前時(shí)刻的輸入有關(guān),還和以往時(shí)刻的輸入都有關(guān)。比于 Jordan 網(wǎng)絡(luò),Elman 網(wǎng)絡(luò)更加易于擴(kuò)展,因?yàn)?Elman 網(wǎng)絡(luò)中的層的自循環(huán),因而網(wǎng)絡(luò)結(jié)構(gòu)的設(shè)計(jì)可以更加靈活。而且,Jordan 網(wǎng)絡(luò)層的維度不一致時(shí)還需要進(jìn)行額外的調(diào)整。
【參考文獻(xiàn)】:
期刊論文
[1]人工智能技術(shù)在安全漏洞領(lǐng)域的應(yīng)用[J]. 孫鴻宇,何遠(yuǎn),王基策,董穎,朱立鵬,王鶴,張玉清. 通信學(xué)報(bào). 2018(08)
[2]卷積神經(jīng)網(wǎng)絡(luò)研究綜述[J]. 周飛燕,金林鵬,董軍. 計(jì)算機(jī)學(xué)報(bào). 2017(06)
[3]淺談緩沖區(qū)溢出[J]. 于棣維,劉永隆. 硅谷. 2009(14)
[4]緩沖區(qū)溢出攻擊:原理,防御及檢測(cè)[J]. 蔣衛(wèi)華,李偉華,杜君. 計(jì)算機(jī)工程. 2003(10)
[5]軟件度量學(xué)綜述[J]. 邢大紅,曹佳冬,汪和才,劉宗田. 計(jì)算機(jī)工程與應(yīng)用. 2001(01)
碩士論文
[1]基于代碼屬性圖的軟件安全漏洞挖掘方法研究[D]. 楊克.燕山大學(xué) 2015
本文編號(hào):3069033
本文鏈接:http://sikaile.net/kejilunwen/ruanjiangongchenglunwen/3069033.html
最近更新
教材專著