基于TF-IDF的Webshell文件檢測(cè)
發(fā)布時(shí)間:2021-05-10 00:10
隨著互聯(lián)網(wǎng)的飛速發(fā)展,網(wǎng)絡(luò)攻擊行為日益頻繁。Webshell是常見(jiàn)的網(wǎng)絡(luò)攻擊方式,而傳統(tǒng)的檢測(cè)手段已無(wú)法應(yīng)對(duì)復(fù)雜靈活的變種Webshell攻擊。為解決這一問(wèn)題,提出了一種基于TF-IDF的Webshell文件檢測(cè)方法。系統(tǒng)首先對(duì)不同類(lèi)型的Webshell文件進(jìn)行分類(lèi),并對(duì)不同文件進(jìn)行相應(yīng)的預(yù)處理轉(zhuǎn)碼,以降低混淆干擾技術(shù)對(duì)檢測(cè)的影響;隨后建立詞袋模型,并采用TF-IDF算法加權(quán)提取相關(guān)特征;最后使用XGBoost算法訓(xùn)練得到檢測(cè)模型。與傳統(tǒng)機(jī)器學(xué)習(xí)算法進(jìn)行的10折交叉驗(yàn)證對(duì)比測(cè)試表明,使用TF-IDF算法預(yù)處理后結(jié)合XGBoost算法的Webshell文件檢測(cè)模型性能出色,檢測(cè)效果相較于傳統(tǒng)檢測(cè)方法在準(zhǔn)確率、精確率、召回率等方面均有所提高,同時(shí)具備更強(qiáng)的魯棒性與泛化能力,其中對(duì)PHP類(lèi)型文件檢測(cè)的準(zhǔn)確率達(dá)到了98.09%,對(duì)JSP類(lèi)型文件檢測(cè)準(zhǔn)確率達(dá)到了97.09%。
【文章來(lái)源】:計(jì)算機(jī)科學(xué). 2020,47(S2)北大核心CSCD
【文章頁(yè)數(shù)】:5 頁(yè)
【文章目錄】:
1 概述
2 相關(guān)研究
3 基于TF-IDF的Webshell檢測(cè)模型
3.1 Webshell文件預(yù)處理
3.1.1 TF-IDF算法模型
3.1.2 JSP類(lèi)型Webshell的特征提取
3.1.3 PHP類(lèi)型Webshell的特征提取
3.2 分類(lèi)器模型
3.2.1 SVM、隨機(jī)森林、XGBoost算法模型
3.2.2 XGBoost訓(xùn)練模型的參數(shù)設(shè)置
4 模型測(cè)試
4.1 實(shí)驗(yàn)數(shù)據(jù)
4.2 實(shí)驗(yàn)環(huán)境
4.3 性能測(cè)試
4.3.1 性能評(píng)價(jià)指標(biāo)
4.3.2 PHP類(lèi)型Webshell文件的檢測(cè)
4.3.3 JSP類(lèi)型Webshell文件的檢測(cè)
【參考文獻(xiàn)】:
期刊論文
[1]基于支持向量機(jī)與Adaboost的入侵檢測(cè)系統(tǒng)[J]. 池亞平,凌志婷,王志強(qiáng),楊建喜. 計(jì)算機(jī)工程. 2019(10)
[2]基于大規(guī)模時(shí)間序列的井漏事故預(yù)警方法[J]. 涂曦予,于露,耿子辰,薛質(zhì),張保穩(wěn). 信息技術(shù). 2018(12)
[3]基于CNN的Webshell文件檢測(cè)[J]. 傅建明,黎琳,王應(yīng)軍. 鄭州大學(xué)學(xué)報(bào)(理學(xué)版). 2019(02)
[4]智能檢測(cè)WebShell的機(jī)器學(xué)習(xí)算法[J]. 戴樺,李景,盧新岱,孫歆. 網(wǎng)絡(luò)與信息安全學(xué)報(bào). 2017(04)
[5]基于Web日志的Webshell檢測(cè)方法研究[J]. 石劉洋,方勇. 信息安全研究. 2016(01)
[6]基于支持向量機(jī)的Webshell黑盒檢測(cè)[J]. 葉飛,龔儉,楊望. 南京航空航天大學(xué)學(xué)報(bào). 2015(06)
[7]Linux下基于SVM分類(lèi)器的WebShell檢測(cè)方法研究[J]. 孟正,梅瑞,張濤,文偉平. 信息網(wǎng)絡(luò)安全. 2014(05)
[8]幾種交叉驗(yàn)證檢驗(yàn)的可重復(fù)性[J]. 李艷芳,王鈺,李濟(jì)洪. 太原師范學(xué)院學(xué)報(bào)(自然科學(xué)版). 2013(04)
本文編號(hào):3178287
【文章來(lái)源】:計(jì)算機(jī)科學(xué). 2020,47(S2)北大核心CSCD
【文章頁(yè)數(shù)】:5 頁(yè)
【文章目錄】:
1 概述
2 相關(guān)研究
3 基于TF-IDF的Webshell檢測(cè)模型
3.1 Webshell文件預(yù)處理
3.1.1 TF-IDF算法模型
3.1.2 JSP類(lèi)型Webshell的特征提取
3.1.3 PHP類(lèi)型Webshell的特征提取
3.2 分類(lèi)器模型
3.2.1 SVM、隨機(jī)森林、XGBoost算法模型
3.2.2 XGBoost訓(xùn)練模型的參數(shù)設(shè)置
4 模型測(cè)試
4.1 實(shí)驗(yàn)數(shù)據(jù)
4.2 實(shí)驗(yàn)環(huán)境
4.3 性能測(cè)試
4.3.1 性能評(píng)價(jià)指標(biāo)
4.3.2 PHP類(lèi)型Webshell文件的檢測(cè)
4.3.3 JSP類(lèi)型Webshell文件的檢測(cè)
【參考文獻(xiàn)】:
期刊論文
[1]基于支持向量機(jī)與Adaboost的入侵檢測(cè)系統(tǒng)[J]. 池亞平,凌志婷,王志強(qiáng),楊建喜. 計(jì)算機(jī)工程. 2019(10)
[2]基于大規(guī)模時(shí)間序列的井漏事故預(yù)警方法[J]. 涂曦予,于露,耿子辰,薛質(zhì),張保穩(wěn). 信息技術(shù). 2018(12)
[3]基于CNN的Webshell文件檢測(cè)[J]. 傅建明,黎琳,王應(yīng)軍. 鄭州大學(xué)學(xué)報(bào)(理學(xué)版). 2019(02)
[4]智能檢測(cè)WebShell的機(jī)器學(xué)習(xí)算法[J]. 戴樺,李景,盧新岱,孫歆. 網(wǎng)絡(luò)與信息安全學(xué)報(bào). 2017(04)
[5]基于Web日志的Webshell檢測(cè)方法研究[J]. 石劉洋,方勇. 信息安全研究. 2016(01)
[6]基于支持向量機(jī)的Webshell黑盒檢測(cè)[J]. 葉飛,龔儉,楊望. 南京航空航天大學(xué)學(xué)報(bào). 2015(06)
[7]Linux下基于SVM分類(lèi)器的WebShell檢測(cè)方法研究[J]. 孟正,梅瑞,張濤,文偉平. 信息網(wǎng)絡(luò)安全. 2014(05)
[8]幾種交叉驗(yàn)證檢驗(yàn)的可重復(fù)性[J]. 李艷芳,王鈺,李濟(jì)洪. 太原師范學(xué)院學(xué)報(bào)(自然科學(xué)版). 2013(04)
本文編號(hào):3178287
本文鏈接:http://sikaile.net/guanlilunwen/ydhl/3178287.html
最近更新
教材專(zhuān)著