基于機器學(xué)習(xí)的二進制軟件漏洞挖掘技術(shù)研究
發(fā)布時間:2022-01-10 20:51
隨著代碼量和代碼復(fù)雜度的不斷提高,存在越來越多容易被攻擊者所利用而導(dǎo)致原始程序邏輯錯誤的漏洞。為了能盡早發(fā)現(xiàn)并修補軟件中存在的漏洞,二進制軟件漏洞挖掘技術(shù)成為了安全研究領(lǐng)域的熱點課題之一。使用機器學(xué)習(xí)的二進制漏洞檢測模型有著能批量處理大規(guī)模數(shù)據(jù),檢測速度快,檢測成本低的優(yōu)勢。但是因為二進制級別的軟件不能直接表達程序信息,無法從中提取有效的特征集,導(dǎo)致現(xiàn)有的基于機器學(xué)習(xí)的二進制漏洞挖掘方法往往具有較高的漏報率和誤報率。在此情形下,本文結(jié)合機器學(xué)習(xí)和自然語言處理技術(shù),提出一種二進制特征提取的方法并在Android平臺上設(shè)計和實現(xiàn)了一個漏洞檢測系統(tǒng)。本文的主要工作及成果如下:1、通過對二進制文件預(yù)處理和詞嵌入技術(shù)的研究,提出一種基于底層語言的特征向量化模型,使用這種模型可以從二進制文件中初步構(gòu)建出包含匯編指令內(nèi)上下文關(guān)系的特征向量。2、通過對深度神經(jīng)網(wǎng)絡(luò)的研究,提出Att-BLSTM特征提取模型,該模型的核心是雙向長短期記憶網(wǎng)絡(luò)(BLSTM)及注意力(Attention)機制,通過這種模型可以從二進制文件中提取出包含豐富程序語義信息的二進制特征向量。3、經(jīng)過研究,本文并未在網(wǎng)上和其他論文中找...
【文章來源】:北京郵電大學(xué)北京市 211工程院校 教育部直屬院校
【文章頁數(shù)】:71 頁
【學(xué)位級別】:碩士
【部分圖文】:
圖2-1?—般神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)圖??
與前一時序元胞的狀態(tài)信息有關(guān),公式如下:??(2.3)??其中,f是非線性激活函數(shù)。如圖2-2解釋了信息在一層元胞間的流動方式,??在一個最基本的標準RNN中,只有一個簡單的神經(jīng)網(wǎng)絡(luò)層。該層每一個元胞的??輸入除了原本的輸入意外還有前一個元胞的狀態(tài)信息,這兩個信息組合后通過??tanh操作,輸出新的狀態(tài)h(t+l)。?????????f??、廣?— ̄ ̄^?廣?'??tanh?tanli?tanli??——.__?L___.??v?J?v?j?v?J?????????圖2-2?—層神經(jīng)網(wǎng)絡(luò)的RNN元胞示意圖??RNN可以通過訓(xùn)練預(yù)測序列中的下一個符號來學(xué)習(xí)一個序列上的概率分布??[31],這種情況下,時序t經(jīng)過softmax層的輸出為;?(xj?。結(jié)合所有時序??的概率,序列X的概率分布為:??17??
????圖2-3?LSTM結(jié)構(gòu)圖??一個典型的LSTM網(wǎng)絡(luò)結(jié)構(gòu)中包含多個不同的單元塊,如圖2-3中的藍色??方塊。LSTM的每一個單元(cell)都保存兩種狀態(tài),即單元狀態(tài)c和隱藏狀態(tài)h,??然后將這兩種狀態(tài)傳輸?shù)较乱粋單元。通過這兩種狀態(tài)的保存和更新,LSTM的??18??
【參考文獻】:
期刊論文
[1]An Integration Testing Framework and Evaluation Metric for Vulnerability Mining Methods[J]. Jin Li,Jinfu Chen,Minhuan Huang,Minmin Zhou,Wanggen Xie,Zhifeng Zeng,Shujie Chen,Zufa Zhang. 中國通信. 2018(02)
[2]一種基于靜、動態(tài)分析相結(jié)合的漏洞挖掘分析方法[J]. 傅濤,孫文靜. 軟件. 2016(08)
[3]機器學(xué)習(xí)及其算法和發(fā)展研究[J]. 張潤,王永濱. 中國傳媒大學(xué)學(xué)報(自然科學(xué)版). 2016(02)
[4]軟件漏洞分析技術(shù)進展[J]. 吳世忠,郭濤,董國偉,王嘉捷. 清華大學(xué)學(xué)報(自然科學(xué)版). 2012(10)
[5]PIC16C84單片機的硬件、軟件及其應(yīng)用(四)[J]. 李學(xué)海. 電子制作. 2001(04)
碩士論文
[1]基于深度學(xué)習(xí)的二進制程序漏洞分析與檢測方法研究[D]. 吳芳.北京交通大學(xué) 2018
[2]基于LSTM的漢語語義角色標注研究[D]. 鄭亞楠.西藏大學(xué) 2017
本文編號:3581396
【文章來源】:北京郵電大學(xué)北京市 211工程院校 教育部直屬院校
【文章頁數(shù)】:71 頁
【學(xué)位級別】:碩士
【部分圖文】:
圖2-1?—般神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)圖??
與前一時序元胞的狀態(tài)信息有關(guān),公式如下:??(2.3)??其中,f是非線性激活函數(shù)。如圖2-2解釋了信息在一層元胞間的流動方式,??在一個最基本的標準RNN中,只有一個簡單的神經(jīng)網(wǎng)絡(luò)層。該層每一個元胞的??輸入除了原本的輸入意外還有前一個元胞的狀態(tài)信息,這兩個信息組合后通過??tanh操作,輸出新的狀態(tài)h(t+l)。?????????f??、廣?— ̄ ̄^?廣?'??tanh?tanli?tanli??——.__?L___.??v?J?v?j?v?J?????????圖2-2?—層神經(jīng)網(wǎng)絡(luò)的RNN元胞示意圖??RNN可以通過訓(xùn)練預(yù)測序列中的下一個符號來學(xué)習(xí)一個序列上的概率分布??[31],這種情況下,時序t經(jīng)過softmax層的輸出為;?(xj?。結(jié)合所有時序??的概率,序列X的概率分布為:??17??
????圖2-3?LSTM結(jié)構(gòu)圖??一個典型的LSTM網(wǎng)絡(luò)結(jié)構(gòu)中包含多個不同的單元塊,如圖2-3中的藍色??方塊。LSTM的每一個單元(cell)都保存兩種狀態(tài),即單元狀態(tài)c和隱藏狀態(tài)h,??然后將這兩種狀態(tài)傳輸?shù)较乱粋單元。通過這兩種狀態(tài)的保存和更新,LSTM的??18??
【參考文獻】:
期刊論文
[1]An Integration Testing Framework and Evaluation Metric for Vulnerability Mining Methods[J]. Jin Li,Jinfu Chen,Minhuan Huang,Minmin Zhou,Wanggen Xie,Zhifeng Zeng,Shujie Chen,Zufa Zhang. 中國通信. 2018(02)
[2]一種基于靜、動態(tài)分析相結(jié)合的漏洞挖掘分析方法[J]. 傅濤,孫文靜. 軟件. 2016(08)
[3]機器學(xué)習(xí)及其算法和發(fā)展研究[J]. 張潤,王永濱. 中國傳媒大學(xué)學(xué)報(自然科學(xué)版). 2016(02)
[4]軟件漏洞分析技術(shù)進展[J]. 吳世忠,郭濤,董國偉,王嘉捷. 清華大學(xué)學(xué)報(自然科學(xué)版). 2012(10)
[5]PIC16C84單片機的硬件、軟件及其應(yīng)用(四)[J]. 李學(xué)海. 電子制作. 2001(04)
碩士論文
[1]基于深度學(xué)習(xí)的二進制程序漏洞分析與檢測方法研究[D]. 吳芳.北京交通大學(xué) 2018
[2]基于LSTM的漢語語義角色標注研究[D]. 鄭亞楠.西藏大學(xué) 2017
本文編號:3581396
本文鏈接:http://sikaile.net/kejilunwen/ruanjiangongchenglunwen/3581396.html
最近更新
教材專著