基于統(tǒng)計(jì)方法與深度學(xué)習(xí)的Webshell檢測(cè)模型研究與實(shí)現(xiàn)
發(fā)布時(shí)間:2021-10-02 08:19
隨著互聯(lián)網(wǎng)的高速發(fā)展,新興產(chǎn)業(yè)迅速崛起,Web系統(tǒng)廣泛應(yīng)用于社交和銀行等重要業(yè)務(wù)。但是,Web系統(tǒng)容易遭受攻擊,嚴(yán)重影響經(jīng)濟(jì)安全和社會(huì)穩(wěn)定。惡意代碼攻擊是主要的Web攻擊手段之一,因此,惡意代碼的檢測(cè)研究是當(dāng)前信息安全領(lǐng)域的研究熱點(diǎn)。Webshell是一種典型的惡意代碼,它是一種基于Web服務(wù)器的后門程序,具有隱蔽性高、危害性大的特點(diǎn)。基于Webshell的典型攻擊方式、逃逸手段和現(xiàn)有檢測(cè)方法,本文提出一種綜合統(tǒng)計(jì)方法和深度學(xué)習(xí)的Webshell檢測(cè)模型,特征向量包括語(yǔ)法特征和語(yǔ)義特征。在統(tǒng)計(jì)方法中,以關(guān)鍵詞、特殊函數(shù)、最長(zhǎng)單詞等為語(yǔ)法特征,以Webshell代碼的操作碼序列的詞頻作為語(yǔ)義特征。在深度學(xué)習(xí)時(shí),使用詞向量編碼方式對(duì)Webshell代碼的操作碼序列進(jìn)行編碼,將序列中的每個(gè)操作碼編碼成固定維度的特征向量。統(tǒng)計(jì)方法選擇隨機(jī)森林算法進(jìn)行檢測(cè),深度學(xué)習(xí)選擇長(zhǎng)短期記憶網(wǎng)絡(luò)(lstm)算法進(jìn)行訓(xùn)練。從github上收集正常PHP文件和Webshell共五千多個(gè)樣本集,實(shí)驗(yàn)表明,將兩種模型融合后,檢測(cè)效果更佳。
【文章來(lái)源】:江西師范大學(xué)江西省
【文章頁(yè)數(shù)】:51 頁(yè)
【學(xué)位級(jí)別】:碩士
【文章目錄】:
摘要
Abstract
1 緒論
1.1 背景分析
1.1.1 Web安全
1.2 研究現(xiàn)狀
1.3 主要研究?jī)?nèi)容
1.4 論文的結(jié)構(gòu)
2 相關(guān)技術(shù)
2.1 Webshell
2.1.1 Webshell的特點(diǎn)
2.1.2 Webshell的分類
2.1.3 Webshell功能
2.1.4 Webshell攻擊原理
2.2 Webshell的檢測(cè)與逃逸技術(shù)
2.2.1 Webshell的檢測(cè)思路
2.2.2 代碼反檢測(cè)技術(shù)
2.3 數(shù)據(jù)流分析
2.3.1 控制流程圖
2.3.2 抽象語(yǔ)法樹(AST)
2.3.3 Opcode
2.4 機(jī)器學(xué)習(xí)算法
2.4.1 分類器
2.4.2 集成分類器
2.4.3 LSTM
2.5 特征提取
3 Webshell檢測(cè)模型
3.1 總體架構(gòu)
3.2 數(shù)據(jù)預(yù)處理
3.3 統(tǒng)計(jì)模型
3.3.1 語(yǔ)義特征提取與選擇
3.3.2 語(yǔ)法特征的選擇
3.4.深度學(xué)習(xí)模型
3.4.1 模型訓(xùn)練
3.4.2 模型檢測(cè)
3.5 模型融合
3.6 模型評(píng)價(jià)指標(biāo)
4 Webshell檢測(cè)模型的實(shí)現(xiàn)
4.1 統(tǒng)計(jì)檢測(cè)模型
4.1.1 操作碼序列詞頻特征
4.1.2 統(tǒng)計(jì)分類方法
4.1.3 統(tǒng)計(jì)模型實(shí)現(xiàn)
4.2 深度學(xué)習(xí)檢測(cè)模型
4.3 模型融合
5 系統(tǒng)的測(cè)試與評(píng)價(jià)
5.1 系統(tǒng)運(yùn)行環(huán)境
5.2 實(shí)驗(yàn)過(guò)程
5.2.1 基于語(yǔ)法特征匹配
5.2.2 基于操作碼序列詞頻
5.2.3 深度學(xué)習(xí)檢測(cè)
5.2.4 統(tǒng)計(jì)檢測(cè)模型
5.2.5 融合模型方法
5.2.6 融合模型
6 總結(jié)
參考文獻(xiàn)
致謝
在讀期間公開發(fā)表論文(著)及科研情況
本文編號(hào):3418319
【文章來(lái)源】:江西師范大學(xué)江西省
【文章頁(yè)數(shù)】:51 頁(yè)
【學(xué)位級(jí)別】:碩士
【文章目錄】:
摘要
Abstract
1 緒論
1.1 背景分析
1.1.1 Web安全
1.2 研究現(xiàn)狀
1.3 主要研究?jī)?nèi)容
1.4 論文的結(jié)構(gòu)
2 相關(guān)技術(shù)
2.1 Webshell
2.1.1 Webshell的特點(diǎn)
2.1.2 Webshell的分類
2.1.3 Webshell功能
2.1.4 Webshell攻擊原理
2.2 Webshell的檢測(cè)與逃逸技術(shù)
2.2.1 Webshell的檢測(cè)思路
2.2.2 代碼反檢測(cè)技術(shù)
2.3 數(shù)據(jù)流分析
2.3.1 控制流程圖
2.3.2 抽象語(yǔ)法樹(AST)
2.3.3 Opcode
2.4 機(jī)器學(xué)習(xí)算法
2.4.1 分類器
2.4.2 集成分類器
2.4.3 LSTM
2.5 特征提取
3 Webshell檢測(cè)模型
3.1 總體架構(gòu)
3.2 數(shù)據(jù)預(yù)處理
3.3 統(tǒng)計(jì)模型
3.3.1 語(yǔ)義特征提取與選擇
3.3.2 語(yǔ)法特征的選擇
3.4.深度學(xué)習(xí)模型
3.4.1 模型訓(xùn)練
3.4.2 模型檢測(cè)
3.5 模型融合
3.6 模型評(píng)價(jià)指標(biāo)
4 Webshell檢測(cè)模型的實(shí)現(xiàn)
4.1 統(tǒng)計(jì)檢測(cè)模型
4.1.1 操作碼序列詞頻特征
4.1.2 統(tǒng)計(jì)分類方法
4.1.3 統(tǒng)計(jì)模型實(shí)現(xiàn)
4.2 深度學(xué)習(xí)檢測(cè)模型
4.3 模型融合
5 系統(tǒng)的測(cè)試與評(píng)價(jià)
5.1 系統(tǒng)運(yùn)行環(huán)境
5.2 實(shí)驗(yàn)過(guò)程
5.2.1 基于語(yǔ)法特征匹配
5.2.2 基于操作碼序列詞頻
5.2.3 深度學(xué)習(xí)檢測(cè)
5.2.4 統(tǒng)計(jì)檢測(cè)模型
5.2.5 融合模型方法
5.2.6 融合模型
6 總結(jié)
參考文獻(xiàn)
致謝
在讀期間公開發(fā)表論文(著)及科研情況
本文編號(hào):3418319
本文鏈接:http://sikaile.net/kejilunwen/ruanjiangongchenglunwen/3418319.html
最近更新
教材專著