基于CNN的JS代碼混淆檢測方法

發(fā)布時間：2020-03-31 12:47

【摘要】：目前,互聯(lián)網給人類帶來了極大的便利,但與此同時,惡意網頁攻擊事件頻繁發(fā)生,其中大部分的JavaScript攻擊代碼都是通過混淆實施的。為了進一步對抗惡意網頁攻擊,保護用戶的個人財產安全,檢測JavaScript混淆腳本已成為當前的一個重要方向。傳統(tǒng)的JavaScript代碼混淆檢測方法主要采用一些淺層機器學習模型或者度量法,它們都需要事先對JavaScript代碼混淆有一定的深入研究,對特征要求嚴格,特征提取過程復雜,并且特征選擇的好壞影響著檢測的精確率。據此,論文提出了一種基于Bigram的字符矩陣特征提取方法,以簡化特征提取過程。同時提出一種基于CNN(卷積神經網絡)的JS(JavaScript)代碼混淆檢測方法,以提高檢測的精確率。首先,針對傳統(tǒng)JavaScript代碼混淆特征提取方法存在過程復雜,需要對JavaScript代碼混淆有長時間的研究以及不具有普適性等問題,論文提出了一種基于Bigram的字符矩陣特征提取方法。該方法受Bigram語義模型與馬爾科夫概率矩陣啟發(fā),在字符級別上對JavaScript代碼進行特征提取,簡化了特征提取過程,提高了普適性。其次,針對傳統(tǒng)機器學習檢測方法大都是一些淺層模型,對特征要求高,且檢測精確率低的問題,論文提出了一種基于CNN的JavaScript代碼混淆檢測方法,利用CNN對矩陣特征向量強大的學習能力,不僅降低了對特征的要求,還有效的提高了檢測JavaScript代碼混淆的精確率。最后,論文對提出的特征提取方法以及卷積神經網絡檢測JavaScript代碼混淆方法進行了實驗。實驗表明,論文提出的字符矩陣特征提取方法具有明顯的區(qū)分能力,并且是傳統(tǒng)特征提取方法耗時的一半。同時,相比于傳統(tǒng)的機器學習檢測方法,卷積神經網絡檢測方法提升了0.6%精確率。
【圖文】：

框架結構,論文,框架結構,檢測方法

圖 1.1 論文框架結構第 3 章分析總結了當前機器學習檢測方法的不足，在第 2 章提取的矩陣特征基礎上，提出了一種基于卷積神經網絡的 JavaScript 代碼混淆檢測方法，闡述了CNN 較其他淺層機器學習的優(yōu)勢，最后詳細描述了基于卷積神經網絡的JavaScript 代碼混淆檢測方法的具體過程。第 4 章主要描述了基于 Bigram 的字符矩陣特征提取方法以及基于卷積神經網絡的檢測方法的實驗過程，將所提取的字符矩陣特征進行可視化并與其他特征提取方法進行比較，同時分別進行了卷積神經網絡檢測 JavaScript 代碼混淆方法與淺層機器學習檢測 JavaScript 代碼混淆方法的實驗，根據實驗結果，證明了論文提出特征提取方法可以有效減少特征提取時間，并且論文提出的檢測方法，，可以有效的提高檢測的精確率。最后，對全文基于 CNN 的 JS 代碼混淆檢測方法進行了總結，并且闡述了本文存在的一些不足，同時，對這些不足提出了后期的計劃。

基于CNN的JS代碼混淆檢測方法

隨機混淆
【學位授予單位】：哈爾濱工程大學
【學位級別】：碩士
【學位授予年份】：2018
【分類號】：TP393.08

【參考文獻】

相關期刊論文前2條

1 宣以廣;周華;;基于字符熵的JavaScript代碼混淆自動檢測方法[J];計算機應用與軟件;2015年01期

2 劉建偉;劉媛;羅雄麟;;深度學習研究進展[J];計算機應用研究;2014年07期

本文編號：2609094

資料下載

論文發(fā)表

支付寶下載

Download by Alipay
微信下載

Download by Wechat
會員下載

Download by Member

本文鏈接：http://sikaile.net/guanlilunwen/ydhl/2609094.html

上一篇：移動流量中基于用戶訪問序列的表示學習及其應用
下一篇：基于局部鄰域重構的跨網絡關聯(lián)

論文發(fā)表

·知網|萬方|維普|龍源|省級|國家級|科技核心|北大核心|南大核心CSSCI|EI|SCI|SSCI|

天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

基于CNN的JS代碼混淆檢測方法