基于多特征的惡意代碼分類研究
發(fā)布時間:2021-03-04 19:33
隨著信息技術進入新的時代尤其是5G技術的發(fā)展,信息傳遞進入高速共享的階段。各種未知形式未知領域的惡意代碼層出不窮,使得惡意代碼的檢測工作面臨巨大挑戰(zhàn)。傳統(tǒng)的惡意代碼特征匹配檢測方法針對當今網(wǎng)絡環(huán)境中形式豐富的惡意代碼顯得無所適從。越來越多的計算機新技術應用到惡意代碼檢測當中,針對惡意代碼及其變種取得了較好的檢測效果,將機器學習算法和深度學習算法應用到惡意代碼檢測當中是時下熱門的研究內容。針對傳統(tǒng)惡意代碼分類效率低,特征提取單一,準確性差的的問題。本文提出了兩種分類方式,第一種人工提取多種特征且不局限于文本特征結合隨機森林算法進行惡意代碼分類。本文選擇將匯編操作碼抽象為灰度圖像,圖像可視化的特點可以有效地發(fā)現(xiàn)新的特征。本文將惡意軟件源文件經(jīng)過IDA反編譯后生成.bytes文件和.asm文件,.asm文件可以從兩個角度提取特征。首先可以通過N-Gram算法提取文本特征,其次可以將.asm文件圖像化轉化成為灰度圖像,灰度圖像可以提取兩方面的特征分別是顏色特征和紋理特征,最后結合隨機森林算法進行分類。然而人工提取特征需要花費大量的時間對隨機森林的各個參數(shù)進行調整,才能使不同的特征構建的隨機森林...
【文章來源】:武漢郵電科學研究院湖北省
【文章頁數(shù)】:76 頁
【學位級別】:碩士
【部分圖文】:
傳統(tǒng)模式
武漢郵電科學研究院碩士學位論文18所欠缺,其檢測流程如圖2-1所示。圖2-1傳統(tǒng)模式本文的核心思路是轉變傳統(tǒng)單一切入點的弊病,著眼于多角度結合多方位特征選取結合機器學習算法和深度學習算法在處理數(shù)據(jù)時的特殊優(yōu)勢,提高準確率和效率。由此本文選擇兩種方案進行惡意代碼分類,第一種方案是多特征結合隨機森林算法完成惡意代碼分類,這種方案特征矩陣的構建尤為重要。增加特征選擇的切入角度,將特征選擇總體上分為局部特征和全面特征,又根據(jù)匯編操作碼的抽象形式不同細化的分為文本特征和圖像特征。N-Gram算法在處理語法和語音分析方面具有獨特的優(yōu)勢能夠最大程度展現(xiàn)詞與詞之間的關聯(lián)程度可以作為文本特征的選取方式,而針對圖像特征,灰度圖像可以直觀的從色彩、灰度級和灰度圖本身所具有的一些參數(shù)來輔助分析惡意代碼抽象化后的圖像特征,圖2-3是第一種方案的設計流程圖。第二種方案利用B2M算法將惡意代碼的轉化為灰度圖像,然后設計一個卷積神經(jīng)網(wǎng)絡結構,實現(xiàn)數(shù)據(jù)的自動訓練和特征挖掘最終輸出分類結果如圖2-2所示。圖2-2灰度圖像+卷積神經(jīng)網(wǎng)絡
多特征+隨機森林算法
【參考文獻】:
期刊論文
[1]基于交叉驗證網(wǎng)格尋優(yōu)隨機森林的黑產用戶識別方法[J]. 章文俊,韓曉龍. 科技視界. 2019(28)
[2]基于N-gram的惡意代碼分類系統(tǒng)設計研究[J]. 蘇晗舶,黃迎春. 網(wǎng)絡安全技術與應用. 2019(07)
[3]基于矩陣分解與隨機森林的多準則推薦算法[J]. 林栢全,肖菁. 華南師范大學學報(自然科學版). 2019(02)
[4]基于大樣本的隨機森林惡意代碼檢測與分類算法[J]. 李雪虎,王發(fā)明,戰(zhàn)凱. 信息技術與網(wǎng)絡安全. 2018(07)
[5]基于隨機森林的惡意代碼檢測[J]. 戴逸輝,殷旭東. 網(wǎng)絡空間安全. 2018(02)
[6]機器學習中的特征選擇方法研究及展望[J]. 崔鴻雁,徐帥,張利鋒,Roy E.Welsch,Berthold K.P.Horn. 北京郵電大學學報. 2018(01)
[7]基于N-Gram與加權分類器集成的惡意代碼檢測[J]. 王衛(wèi)紅,朱雨辰. 浙江工業(yè)大學學報. 2017(06)
[8]基于改進隨機森林算法的Android惡意軟件檢測[J]. 楊宏宇,徐晉. 通信學報. 2017(04)
[9]熵可視化方法在惡意代碼分類中的應用[J]. 任卓君,陳光. 計算機工程. 2017(09)
[10]基于詞素特征的輕量級域名檢測算法[J]. 張維維,龔儉,劉茜,劉尚東,胡曉艷. 軟件學報. 2016(09)
碩士論文
[1]基于灰度共生矩陣木材表面紋理模式識別方法的研究[D]. 王輝.東北林業(yè)大學 2007
本文編號:3063783
【文章來源】:武漢郵電科學研究院湖北省
【文章頁數(shù)】:76 頁
【學位級別】:碩士
【部分圖文】:
傳統(tǒng)模式
武漢郵電科學研究院碩士學位論文18所欠缺,其檢測流程如圖2-1所示。圖2-1傳統(tǒng)模式本文的核心思路是轉變傳統(tǒng)單一切入點的弊病,著眼于多角度結合多方位特征選取結合機器學習算法和深度學習算法在處理數(shù)據(jù)時的特殊優(yōu)勢,提高準確率和效率。由此本文選擇兩種方案進行惡意代碼分類,第一種方案是多特征結合隨機森林算法完成惡意代碼分類,這種方案特征矩陣的構建尤為重要。增加特征選擇的切入角度,將特征選擇總體上分為局部特征和全面特征,又根據(jù)匯編操作碼的抽象形式不同細化的分為文本特征和圖像特征。N-Gram算法在處理語法和語音分析方面具有獨特的優(yōu)勢能夠最大程度展現(xiàn)詞與詞之間的關聯(lián)程度可以作為文本特征的選取方式,而針對圖像特征,灰度圖像可以直觀的從色彩、灰度級和灰度圖本身所具有的一些參數(shù)來輔助分析惡意代碼抽象化后的圖像特征,圖2-3是第一種方案的設計流程圖。第二種方案利用B2M算法將惡意代碼的轉化為灰度圖像,然后設計一個卷積神經(jīng)網(wǎng)絡結構,實現(xiàn)數(shù)據(jù)的自動訓練和特征挖掘最終輸出分類結果如圖2-2所示。圖2-2灰度圖像+卷積神經(jīng)網(wǎng)絡
多特征+隨機森林算法
【參考文獻】:
期刊論文
[1]基于交叉驗證網(wǎng)格尋優(yōu)隨機森林的黑產用戶識別方法[J]. 章文俊,韓曉龍. 科技視界. 2019(28)
[2]基于N-gram的惡意代碼分類系統(tǒng)設計研究[J]. 蘇晗舶,黃迎春. 網(wǎng)絡安全技術與應用. 2019(07)
[3]基于矩陣分解與隨機森林的多準則推薦算法[J]. 林栢全,肖菁. 華南師范大學學報(自然科學版). 2019(02)
[4]基于大樣本的隨機森林惡意代碼檢測與分類算法[J]. 李雪虎,王發(fā)明,戰(zhàn)凱. 信息技術與網(wǎng)絡安全. 2018(07)
[5]基于隨機森林的惡意代碼檢測[J]. 戴逸輝,殷旭東. 網(wǎng)絡空間安全. 2018(02)
[6]機器學習中的特征選擇方法研究及展望[J]. 崔鴻雁,徐帥,張利鋒,Roy E.Welsch,Berthold K.P.Horn. 北京郵電大學學報. 2018(01)
[7]基于N-Gram與加權分類器集成的惡意代碼檢測[J]. 王衛(wèi)紅,朱雨辰. 浙江工業(yè)大學學報. 2017(06)
[8]基于改進隨機森林算法的Android惡意軟件檢測[J]. 楊宏宇,徐晉. 通信學報. 2017(04)
[9]熵可視化方法在惡意代碼分類中的應用[J]. 任卓君,陳光. 計算機工程. 2017(09)
[10]基于詞素特征的輕量級域名檢測算法[J]. 張維維,龔儉,劉茜,劉尚東,胡曉艷. 軟件學報. 2016(09)
碩士論文
[1]基于灰度共生矩陣木材表面紋理模式識別方法的研究[D]. 王輝.東北林業(yè)大學 2007
本文編號:3063783
本文鏈接:http://sikaile.net/guanlilunwen/ydhl/3063783.html
最近更新
教材專著