基于CNN的JS代碼混淆檢測方法
發(fā)布時間:2020-03-31 12:47
【摘要】:目前,互聯(lián)網(wǎng)給人類帶來了極大的便利,但與此同時,惡意網(wǎng)頁攻擊事件頻繁發(fā)生,其中大部分的JavaScript攻擊代碼都是通過混淆實施的。為了進一步對抗惡意網(wǎng)頁攻擊,保護用戶的個人財產(chǎn)安全,檢測JavaScript混淆腳本已成為當(dāng)前的一個重要方向。傳統(tǒng)的JavaScript代碼混淆檢測方法主要采用一些淺層機器學(xué)習(xí)模型或者度量法,它們都需要事先對JavaScript代碼混淆有一定的深入研究,對特征要求嚴(yán)格,特征提取過程復(fù)雜,并且特征選擇的好壞影響著檢測的精確率。據(jù)此,論文提出了一種基于Bigram的字符矩陣特征提取方法,以簡化特征提取過程。同時提出一種基于CNN(卷積神經(jīng)網(wǎng)絡(luò))的JS(JavaScript)代碼混淆檢測方法,以提高檢測的精確率。首先,針對傳統(tǒng)JavaScript代碼混淆特征提取方法存在過程復(fù)雜,需要對JavaScript代碼混淆有長時間的研究以及不具有普適性等問題,論文提出了一種基于Bigram的字符矩陣特征提取方法。該方法受Bigram語義模型與馬爾科夫概率矩陣啟發(fā),在字符級別上對JavaScript代碼進行特征提取,簡化了特征提取過程,提高了普適性。其次,針對傳統(tǒng)機器學(xué)習(xí)檢測方法大都是一些淺層模型,對特征要求高,且檢測精確率低的問題,論文提出了一種基于CNN的JavaScript代碼混淆檢測方法,利用CNN對矩陣特征向量強大的學(xué)習(xí)能力,不僅降低了對特征的要求,還有效的提高了檢測JavaScript代碼混淆的精確率。最后,論文對提出的特征提取方法以及卷積神經(jīng)網(wǎng)絡(luò)檢測JavaScript代碼混淆方法進行了實驗。實驗表明,論文提出的字符矩陣特征提取方法具有明顯的區(qū)分能力,并且是傳統(tǒng)特征提取方法耗時的一半。同時,相比于傳統(tǒng)的機器學(xué)習(xí)檢測方法,卷積神經(jīng)網(wǎng)絡(luò)檢測方法提升了0.6%精確率。
【圖文】:
圖 1.1 論文框架結(jié)構(gòu)第 3 章分析總結(jié)了當(dāng)前機器學(xué)習(xí)檢測方法的不足,在第 2 章提取的矩陣特征基礎(chǔ)上,提出了一種基于卷積神經(jīng)網(wǎng)絡(luò)的 JavaScript 代碼混淆檢測方法,闡述了CNN 較其他淺層機器學(xué)習(xí)的優(yōu)勢,最后詳細描述了基于卷積神經(jīng)網(wǎng)絡(luò)的JavaScript 代碼混淆檢測方法的具體過程。第 4 章主要描述了基于 Bigram 的字符矩陣特征提取方法以及基于卷積神經(jīng)網(wǎng)絡(luò)的檢測方法的實驗過程,將所提取的字符矩陣特征進行可視化并與其他特征提取方法進行比較,同時分別進行了卷積神經(jīng)網(wǎng)絡(luò)檢測 JavaScript 代碼混淆方法與淺層機器學(xué)習(xí)檢測 JavaScript 代碼混淆方法的實驗,根據(jù)實驗結(jié)果,證明了論文提出特征提取方法可以有效減少特征提取時間,并且論文提出的檢測方法,,可以有效的提高檢測的精確率。最后,對全文基于 CNN 的 JS 代碼混淆檢測方法進行了總結(jié),并且闡述了本文存在的一些不足,同時,對這些不足提出了后期的計劃。
隨機混淆
【學(xué)位授予單位】:哈爾濱工程大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2018
【分類號】:TP393.08
本文編號:2609094
【圖文】:
圖 1.1 論文框架結(jié)構(gòu)第 3 章分析總結(jié)了當(dāng)前機器學(xué)習(xí)檢測方法的不足,在第 2 章提取的矩陣特征基礎(chǔ)上,提出了一種基于卷積神經(jīng)網(wǎng)絡(luò)的 JavaScript 代碼混淆檢測方法,闡述了CNN 較其他淺層機器學(xué)習(xí)的優(yōu)勢,最后詳細描述了基于卷積神經(jīng)網(wǎng)絡(luò)的JavaScript 代碼混淆檢測方法的具體過程。第 4 章主要描述了基于 Bigram 的字符矩陣特征提取方法以及基于卷積神經(jīng)網(wǎng)絡(luò)的檢測方法的實驗過程,將所提取的字符矩陣特征進行可視化并與其他特征提取方法進行比較,同時分別進行了卷積神經(jīng)網(wǎng)絡(luò)檢測 JavaScript 代碼混淆方法與淺層機器學(xué)習(xí)檢測 JavaScript 代碼混淆方法的實驗,根據(jù)實驗結(jié)果,證明了論文提出特征提取方法可以有效減少特征提取時間,并且論文提出的檢測方法,,可以有效的提高檢測的精確率。最后,對全文基于 CNN 的 JS 代碼混淆檢測方法進行了總結(jié),并且闡述了本文存在的一些不足,同時,對這些不足提出了后期的計劃。
隨機混淆
【學(xué)位授予單位】:哈爾濱工程大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2018
【分類號】:TP393.08
【參考文獻】
相關(guān)期刊論文 前2條
1 宣以廣;周華;;基于字符熵的JavaScript代碼混淆自動檢測方法[J];計算機應(yīng)用與軟件;2015年01期
2 劉建偉;劉媛;羅雄麟;;深度學(xué)習(xí)研究進展[J];計算機應(yīng)用研究;2014年07期
本文編號:2609094
本文鏈接:http://sikaile.net/guanlilunwen/ydhl/2609094.html
最近更新
教材專著