基于圖神經(jīng)網(wǎng)絡(luò)的二進(jìn)制函數(shù)相似度檢測(cè)算法研究及實(shí)現(xiàn)
發(fā)布時(shí)間:2022-07-22 14:08
二進(jìn)制函數(shù)相似度檢測(cè)是指檢測(cè)不同平臺(tái),不同編譯器,不同優(yōu)化選項(xiàng),不同軟件版本的兩個(gè)二進(jìn)制函數(shù)是否相似。因其能夠在無法獲得源碼的情況下分析二進(jìn)制函數(shù),所以常用在網(wǎng)絡(luò)安全和知識(shí)產(chǎn)權(quán)保護(hù)領(lǐng)域中,例如惡意軟件分析,漏洞檢測(cè),版權(quán)糾紛等問題,F(xiàn)有檢測(cè)方法一部分依賴于圖匹配算法,這種方法時(shí)間復(fù)雜度高且難以遷移到新任務(wù);另一部分是基于神經(jīng)網(wǎng)絡(luò)的圖嵌入方法,這種方法將二進(jìn)制函數(shù)轉(zhuǎn)換成屬性控制流程圖,并將其輸入到神經(jīng)網(wǎng)絡(luò)轉(zhuǎn)換成高維向量。它通過將圖匹配過程轉(zhuǎn)換成向量之間的數(shù)值運(yùn)算,提高了相似度的檢測(cè)效率。但在當(dāng)前的圖嵌入方法中,對(duì)屬性流程圖的特征抽取方法通常是人工提取,會(huì)引入人為偏差,且在轉(zhuǎn)換過程中沒有考慮到不同結(jié)點(diǎn)的重要性差異,因此降低了轉(zhuǎn)換過程的準(zhǔn)確性。為了改進(jìn)人工提取特征引入人為偏差的缺陷,本文設(shè)計(jì)并實(shí)現(xiàn)了基于標(biāo)準(zhǔn)化的無監(jiān)督特征提取方法。該方法不僅能夠避免產(chǎn)生人為偏差,還能夠更好的遷移到不同的應(yīng)用領(lǐng)域。另外本文基于傳統(tǒng)的structure2vec網(wǎng)絡(luò),通過引入注意力機(jī)制來自動(dòng)學(xué)習(xí)函數(shù)屬性流程圖中不同結(jié)點(diǎn)之間的影響權(quán)重。進(jìn)一步提高了檢測(cè)精確度。本文主要工作如下:1.提出通用的二進(jìn)制函數(shù)相似度檢測(cè)框架F...
【文章頁數(shù)】:79 頁
【學(xué)位級(jí)別】:碩士
【文章目錄】:
摘要
Abstract
第1章 緒論
1.1 課題背景及意義
1.2 國內(nèi)外研究現(xiàn)狀
1.3 本文主要工作與創(chuàng)新點(diǎn)
1.3.1 本文主要工作
1.3.2 本文創(chuàng)新點(diǎn)
1.4 本文的組織結(jié)構(gòu)
第2章 二進(jìn)制代碼相似度相關(guān)研究綜述
2.1 基于圖匹配的相似度檢測(cè)
2.1.1 SIGMA
2.1.2 discovRE
2.1.3 BinGold
2.2 基于圖嵌入的相似度檢測(cè)
2.2.1 Genius
2.2.2 Gemini
2.2.3 VulSeeker
2.3 基于深度神經(jīng)網(wǎng)絡(luò)的相似度檢測(cè)
2.3.1 αDiff
2.3.2 Zeek
2.3.3 SAFE
2.4 本章小結(jié)
第3章 基于圖神經(jīng)網(wǎng)絡(luò)的相似度檢測(cè)算法
3.1 FuncSim總體架構(gòu)
3.2 流程圖抽取
3.2.1 控制流程圖
3.2.2 數(shù)據(jù)流程圖
3.3 特征抽取
3.3.1 人工特征抽取
3.3.2 無監(jiān)督特征學(xué)習(xí)
3.4 語義轉(zhuǎn)換網(wǎng)絡(luò)
3.4.1 基本structure2vec網(wǎng)絡(luò)
3.4.2 圖注意力機(jī)制
3.4.3 改進(jìn)后的語義轉(zhuǎn)換網(wǎng)絡(luò)
3.4.4 孿生網(wǎng)絡(luò)學(xué)習(xí)參數(shù)
3.5 本章小結(jié)
第4章 性能評(píng)估實(shí)驗(yàn)
4.1 實(shí)驗(yàn)設(shè)置及環(huán)境說明
4.2 數(shù)據(jù)集介紹
4.2.1 數(shù)據(jù)集一:OpensslBusybox數(shù)據(jù)集
4.2.2 數(shù)據(jù)集二:CVE數(shù)據(jù)集
4.3 基線選擇
4.4 評(píng)價(jià)指標(biāo)描述
4.4.1 ROC與AUC
4.4.2 精確率與召回率
4.4.3 nDCG
4.5 實(shí)驗(yàn)?zāi)康恼f明
4.6 實(shí)驗(yàn)一: 超參數(shù)選擇實(shí)驗(yàn)
4.6.1 訓(xùn)練周期數(shù)
4.6.2 迭代次數(shù)T
4.6.3 多頭數(shù)量
4.6.4 嵌入維度P
4.7 實(shí)驗(yàn)二: 模塊性能提升實(shí)驗(yàn)
4.7.1 無監(jiān)督特征抽取的性能提升實(shí)驗(yàn)
4.7.2 網(wǎng)絡(luò)改進(jìn)的性能提升實(shí)驗(yàn)
4.8 實(shí)驗(yàn)三: 總體性能提升實(shí)驗(yàn)
4.8.1 平臺(tái)性能提升實(shí)驗(yàn)
4.8.2 不同基本塊數(shù)量的性能提升實(shí)驗(yàn)
4.9 實(shí)驗(yàn)四: 時(shí)間效率實(shí)驗(yàn)
4.9.1 特征抽取時(shí)間
4.9.2 訓(xùn)練時(shí)間
4.10 實(shí)驗(yàn)五:函數(shù)查找性能實(shí)驗(yàn)
4.10.1 實(shí)驗(yàn)過程描述
4.10.2 總體查找性能結(jié)果及分析
4.11 實(shí)驗(yàn)六:漏洞查找性能實(shí)驗(yàn)
4.11.1 Heartbleed漏洞查找結(jié)果
4.11.2 總體查找性能結(jié)果及分析
4.12 實(shí)驗(yàn)七:語義轉(zhuǎn)換結(jié)果可視化
4.13 本章總結(jié)
第5章 總結(jié)與展望
5.1 本文工作總結(jié)
5.2 未來工作展望
參考文獻(xiàn)
攻讀碩士學(xué)位期間的主要研究成果
致謝
本文編號(hào):3664750
【文章頁數(shù)】:79 頁
【學(xué)位級(jí)別】:碩士
【文章目錄】:
摘要
Abstract
第1章 緒論
1.1 課題背景及意義
1.2 國內(nèi)外研究現(xiàn)狀
1.3 本文主要工作與創(chuàng)新點(diǎn)
1.3.1 本文主要工作
1.3.2 本文創(chuàng)新點(diǎn)
1.4 本文的組織結(jié)構(gòu)
第2章 二進(jìn)制代碼相似度相關(guān)研究綜述
2.1 基于圖匹配的相似度檢測(cè)
2.1.1 SIGMA
2.1.2 discovRE
2.1.3 BinGold
2.2 基于圖嵌入的相似度檢測(cè)
2.2.1 Genius
2.2.2 Gemini
2.2.3 VulSeeker
2.3 基于深度神經(jīng)網(wǎng)絡(luò)的相似度檢測(cè)
2.3.1 αDiff
2.3.2 Zeek
2.3.3 SAFE
2.4 本章小結(jié)
第3章 基于圖神經(jīng)網(wǎng)絡(luò)的相似度檢測(cè)算法
3.1 FuncSim總體架構(gòu)
3.2 流程圖抽取
3.2.1 控制流程圖
3.2.2 數(shù)據(jù)流程圖
3.3 特征抽取
3.3.1 人工特征抽取
3.3.2 無監(jiān)督特征學(xué)習(xí)
3.4 語義轉(zhuǎn)換網(wǎng)絡(luò)
3.4.1 基本structure2vec網(wǎng)絡(luò)
3.4.2 圖注意力機(jī)制
3.4.3 改進(jìn)后的語義轉(zhuǎn)換網(wǎng)絡(luò)
3.4.4 孿生網(wǎng)絡(luò)學(xué)習(xí)參數(shù)
3.5 本章小結(jié)
第4章 性能評(píng)估實(shí)驗(yàn)
4.1 實(shí)驗(yàn)設(shè)置及環(huán)境說明
4.2 數(shù)據(jù)集介紹
4.2.1 數(shù)據(jù)集一:OpensslBusybox數(shù)據(jù)集
4.2.2 數(shù)據(jù)集二:CVE數(shù)據(jù)集
4.3 基線選擇
4.4 評(píng)價(jià)指標(biāo)描述
4.4.1 ROC與AUC
4.4.2 精確率與召回率
4.4.3 nDCG
4.5 實(shí)驗(yàn)?zāi)康恼f明
4.6 實(shí)驗(yàn)一: 超參數(shù)選擇實(shí)驗(yàn)
4.6.1 訓(xùn)練周期數(shù)
4.6.2 迭代次數(shù)T
4.6.3 多頭數(shù)量
4.6.4 嵌入維度P
4.7 實(shí)驗(yàn)二: 模塊性能提升實(shí)驗(yàn)
4.7.1 無監(jiān)督特征抽取的性能提升實(shí)驗(yàn)
4.7.2 網(wǎng)絡(luò)改進(jìn)的性能提升實(shí)驗(yàn)
4.8 實(shí)驗(yàn)三: 總體性能提升實(shí)驗(yàn)
4.8.1 平臺(tái)性能提升實(shí)驗(yàn)
4.8.2 不同基本塊數(shù)量的性能提升實(shí)驗(yàn)
4.9 實(shí)驗(yàn)四: 時(shí)間效率實(shí)驗(yàn)
4.9.1 特征抽取時(shí)間
4.9.2 訓(xùn)練時(shí)間
4.10 實(shí)驗(yàn)五:函數(shù)查找性能實(shí)驗(yàn)
4.10.1 實(shí)驗(yàn)過程描述
4.10.2 總體查找性能結(jié)果及分析
4.11 實(shí)驗(yàn)六:漏洞查找性能實(shí)驗(yàn)
4.11.1 Heartbleed漏洞查找結(jié)果
4.11.2 總體查找性能結(jié)果及分析
4.12 實(shí)驗(yàn)七:語義轉(zhuǎn)換結(jié)果可視化
4.13 本章總結(jié)
第5章 總結(jié)與展望
5.1 本文工作總結(jié)
5.2 未來工作展望
參考文獻(xiàn)
攻讀碩士學(xué)位期間的主要研究成果
致謝
本文編號(hào):3664750
本文鏈接:http://sikaile.net/kejilunwen/shengwushengchang/3664750.html
最近更新
教材專著