基于深度學習的代碼漏洞檢測
發(fā)布時間:2021-04-26 13:42
軟件安全是軟件開發(fā)工作的重中之重,因為軟件安全漏洞不僅會損耗不必要的資源,還會給公司或組織帶來嚴重的經(jīng)濟財產損失。然而對于開發(fā)者而言,發(fā)現(xiàn)漏洞并不是一件容易的事,因為漏洞代碼和安全代碼并沒有明顯的差異。對于代碼分析這類時序任務,循環(huán)神經(jīng)網(wǎng)絡經(jīng)大量科研工作者的驗證,已經(jīng)是成熟的應用方案。但是最近有不少的研究將卷積網(wǎng)絡用于音頻合成和機器翻譯等時序任務中,取得了比循環(huán)網(wǎng)絡更好的效果。在使用機器學習檢測代碼漏洞的任務中,代碼的預處理和神經(jīng)網(wǎng)絡的選擇是影響檢測精度的關鍵因素。論文首先提出了一種將程序代碼轉換為單詞向量序列的方法,該方法可以兼顧保留程序語義和處理的簡潔性,包含了代碼切割、單詞編碼等過程。然后建立了一個基于卷積神經(jīng)網(wǎng)絡的代碼漏洞檢測模型,不同于其他基于循環(huán)網(wǎng)絡的方法,該模型使用卷積神經(jīng)網(wǎng)絡對單詞級的函數(shù)對象進行分析。模型結合了多種有效的技術,包括因果卷積、擴張卷積以及殘差單元等,并盡量保證網(wǎng)絡的簡潔。最后,在使用多種超參數(shù)對模型的性能進行測試后,給出了兼顧效率與準確度的卷積網(wǎng)絡超參數(shù)調整原則,為模型處理更多的數(shù)據(jù)集預留了擴展性。實驗用三種數(shù)據(jù)集來測試模型性能,代碼漏洞檢測模型在精確率...
【文章來源】:華中科技大學湖北省 211工程院校 985工程院校 教育部直屬院校
【文章頁數(shù)】:59 頁
【學位級別】:碩士
【文章目錄】:
摘要
Abstract
1 緒論
1.1 課題背景及研究意義
1.2 研究概況
1.3 研究內容
1.4 論文組織結構
2 相關理論和技術
2.1 傳統(tǒng)代碼異常檢測
2.2 自然語言處理
2.3 循環(huán)神經(jīng)網(wǎng)絡
2.4 卷積神經(jīng)網(wǎng)絡
2.5 本章小結
3 基于深度學習的代碼漏洞檢測模型
3.1 模型總體架構
3.2 代碼編碼預處理
3.3 時序卷積神經(jīng)網(wǎng)絡
3.4 時序卷積神經(jīng)網(wǎng)絡調參準則
3.5 本章小結
4 代碼漏洞檢測模型的實現(xiàn)
4.1 代碼編碼預處理
4.2 時序卷積神經(jīng)網(wǎng)絡
4.3 本章小結
5 模型測試與結果分析
5.1 實驗環(huán)境
5.2 實驗數(shù)據(jù)
5.3 實驗結果及分析
5.4 本章小結
6 總結與展望
6.1 工作總結
6.2 工作展望
致謝
參考文獻
本文編號:3161512
【文章來源】:華中科技大學湖北省 211工程院校 985工程院校 教育部直屬院校
【文章頁數(shù)】:59 頁
【學位級別】:碩士
【文章目錄】:
摘要
Abstract
1 緒論
1.1 課題背景及研究意義
1.2 研究概況
1.3 研究內容
1.4 論文組織結構
2 相關理論和技術
2.1 傳統(tǒng)代碼異常檢測
2.2 自然語言處理
2.3 循環(huán)神經(jīng)網(wǎng)絡
2.4 卷積神經(jīng)網(wǎng)絡
2.5 本章小結
3 基于深度學習的代碼漏洞檢測模型
3.1 模型總體架構
3.2 代碼編碼預處理
3.3 時序卷積神經(jīng)網(wǎng)絡
3.4 時序卷積神經(jīng)網(wǎng)絡調參準則
3.5 本章小結
4 代碼漏洞檢測模型的實現(xiàn)
4.1 代碼編碼預處理
4.2 時序卷積神經(jīng)網(wǎng)絡
4.3 本章小結
5 模型測試與結果分析
5.1 實驗環(huán)境
5.2 實驗數(shù)據(jù)
5.3 實驗結果及分析
5.4 本章小結
6 總結與展望
6.1 工作總結
6.2 工作展望
致謝
參考文獻
本文編號:3161512
本文鏈接:http://sikaile.net/kejilunwen/zidonghuakongzhilunwen/3161512.html
最近更新
教材專著