面向Android惡意應(yīng)用靜態(tài)檢測的特征頻數(shù)差異增強(qiáng)算法
發(fā)布時間:2021-08-05 16:45
隨著Android應(yīng)用程序數(shù)量的快速增長,面向Android應(yīng)用程序的安全性檢測已成為網(wǎng)絡(luò)安全領(lǐng)域的熱點研究問題之一。針對惡意應(yīng)用靜態(tài)檢測的特征選擇,給出了良性特征、惡意特征、良性典型特征、惡意典型特征、非典型特征等概念,設(shè)計提出了特征頻數(shù)差異增強(qiáng)算法FDE。FDE算法通過計算特征出現(xiàn)在良性與惡意應(yīng)用中的頻數(shù),去除靜態(tài)特征中的非典型特征。為合理驗證算法的目標(biāo)效果和性能優(yōu)劣,分別設(shè)計了基于平衡數(shù)據(jù)與非平衡數(shù)據(jù)的實驗,對于非平衡數(shù)據(jù),引入了權(quán)重?fù)p失函數(shù)。實驗結(jié)果表明,FDE算法可有效去除靜態(tài)特征中的非典型特征,篩選出有效特征,權(quán)重?fù)p失函數(shù)可有效提高非平衡數(shù)據(jù)中的惡意數(shù)據(jù)識別率。
【文章來源】:計算機(jī)工程與科學(xué). 2020,42(06)北大核心CSCD
【文章頁數(shù)】:10 頁
【部分圖文】:
FDE算法與其他特征選擇算法對比實驗結(jié)果
表2 實例數(shù)據(jù)及FDE計算分析Table 2 Instance data and calculation analysis of FDE algorithm 序號 特征信息 序號 Nm Nb 序號 S值 卡方值 序號 1 Landroid/net/SSLSessionCache 1 541 1 1 0.054 0 568.838 422 60 / 2 Ljava/util/concurrent/ThreadPoolExecutor 2 4 815 2 294 2 0.252 1 893.999 296 70 2 3 Landroid/animation/Obj- ectAnimator → 統(tǒng)計特 征信息 3 4 441 71 → 計算各 特征S值 3 0.427 0 3 953.360 798 00 → 選擇符合 條件特征 3 4 Landroid/graphics/Typeface 4 1 871 2 265 4 0.039 4 64.005 596 88 5 5 Landroid/content/res/XmlResourceParser 5 4 745 2 900 5 0.184 5 445.261 608 90 /為比較FDE算法和其他特征選擇算法的性能差別,選擇卡方校驗、信息增益、FrequenSel和FDE算法在SVM、KNN、CNN 3種分類器上進(jìn)行實驗對比,實驗結(jié)果如圖2所示。由于FrequenSel無法自主選擇特征數(shù)量,經(jīng)參數(shù)調(diào)整特征數(shù)量最低為930個,將單獨把FrequenSel選擇的930個特征和卡方校驗、信息增益、FDE等選擇的778個特征作比較。
實驗中,采用FDE+CNN組合的方法驗證引入權(quán)重?fù)p失函數(shù)的效果。圖3展示了FDE+CNN組合方法下各權(quán)重誤報率和準(zhǔn)確率變化情況,其中,良性類別權(quán)重為BW,惡意類別權(quán)重為MW。誤報率可以反映測試集中惡意樣本被錯分為良性應(yīng)用的比例。由圖3a和圖3b可見,隨著迭代次數(shù)的增加,誤報率呈現(xiàn)先下降后升高的趨勢,且隨著惡意樣本類權(quán)重數(shù)值的增大,誤報率整體呈下降趨勢,但準(zhǔn)確率呈先上升后下降的趨勢。這表明惡意類別權(quán)重數(shù)值增大可以減少誤報率,但權(quán)重超過一定數(shù)值,會降低整體準(zhǔn)確率。
【參考文獻(xiàn)】:
期刊論文
[1]基于隨機(jī)森林算法的Android惡意行為識別與分類方法[J]. 柯懂湘,潘麗敏,羅森林,張寒青. 浙江大學(xué)學(xué)報(工學(xué)版). 2019(10)
[2]一種基于改進(jìn)的樸素貝葉斯算法的Android釣魚網(wǎng)站檢測方案[J]. 馬剛,劉鋒,朱二周. 計算機(jī)工程與科學(xué). 2018(08)
[3]基于混合特征的惡意安卓程序檢測方法[J]. 徐林溪,郭帆. 計算機(jī)工程與科學(xué). 2017(10)
本文編號:3324105
【文章來源】:計算機(jī)工程與科學(xué). 2020,42(06)北大核心CSCD
【文章頁數(shù)】:10 頁
【部分圖文】:
FDE算法與其他特征選擇算法對比實驗結(jié)果
表2 實例數(shù)據(jù)及FDE計算分析Table 2 Instance data and calculation analysis of FDE algorithm 序號 特征信息 序號 Nm Nb 序號 S值 卡方值 序號 1 Landroid/net/SSLSessionCache 1 541 1 1 0.054 0 568.838 422 60 / 2 Ljava/util/concurrent/ThreadPoolExecutor 2 4 815 2 294 2 0.252 1 893.999 296 70 2 3 Landroid/animation/Obj- ectAnimator → 統(tǒng)計特 征信息 3 4 441 71 → 計算各 特征S值 3 0.427 0 3 953.360 798 00 → 選擇符合 條件特征 3 4 Landroid/graphics/Typeface 4 1 871 2 265 4 0.039 4 64.005 596 88 5 5 Landroid/content/res/XmlResourceParser 5 4 745 2 900 5 0.184 5 445.261 608 90 /為比較FDE算法和其他特征選擇算法的性能差別,選擇卡方校驗、信息增益、FrequenSel和FDE算法在SVM、KNN、CNN 3種分類器上進(jìn)行實驗對比,實驗結(jié)果如圖2所示。由于FrequenSel無法自主選擇特征數(shù)量,經(jīng)參數(shù)調(diào)整特征數(shù)量最低為930個,將單獨把FrequenSel選擇的930個特征和卡方校驗、信息增益、FDE等選擇的778個特征作比較。
實驗中,采用FDE+CNN組合的方法驗證引入權(quán)重?fù)p失函數(shù)的效果。圖3展示了FDE+CNN組合方法下各權(quán)重誤報率和準(zhǔn)確率變化情況,其中,良性類別權(quán)重為BW,惡意類別權(quán)重為MW。誤報率可以反映測試集中惡意樣本被錯分為良性應(yīng)用的比例。由圖3a和圖3b可見,隨著迭代次數(shù)的增加,誤報率呈現(xiàn)先下降后升高的趨勢,且隨著惡意樣本類權(quán)重數(shù)值的增大,誤報率整體呈下降趨勢,但準(zhǔn)確率呈先上升后下降的趨勢。這表明惡意類別權(quán)重數(shù)值增大可以減少誤報率,但權(quán)重超過一定數(shù)值,會降低整體準(zhǔn)確率。
【參考文獻(xiàn)】:
期刊論文
[1]基于隨機(jī)森林算法的Android惡意行為識別與分類方法[J]. 柯懂湘,潘麗敏,羅森林,張寒青. 浙江大學(xué)學(xué)報(工學(xué)版). 2019(10)
[2]一種基于改進(jìn)的樸素貝葉斯算法的Android釣魚網(wǎng)站檢測方案[J]. 馬剛,劉鋒,朱二周. 計算機(jī)工程與科學(xué). 2018(08)
[3]基于混合特征的惡意安卓程序檢測方法[J]. 徐林溪,郭帆. 計算機(jī)工程與科學(xué). 2017(10)
本文編號:3324105
本文鏈接:http://sikaile.net/guanlilunwen/ydhl/3324105.html
最近更新
教材專著