類別不平衡學(xué)習(xí)方法及其在Android惡意應(yīng)用檢測中的應(yīng)用
發(fā)布時間:2023-03-27 04:13
隨著移動設(shè)備的普及和移動應(yīng)用用戶數(shù)量的爆發(fā)式增長,移動智能終端安全面臨著巨大挑戰(zhàn)。機(jī)器學(xué)習(xí)作為人工智能領(lǐng)域的重要方法,近年來在通過分析網(wǎng)絡(luò)行為進(jìn)行移動惡意應(yīng)用檢測的研究中得到了廣泛應(yīng)用。然而,由于網(wǎng)絡(luò)流量天然存在的類別分布不平衡特性和持續(xù)到達(dá)特性,給機(jī)器學(xué)習(xí)模型訓(xùn)練帶來了諸多困難與挑戰(zhàn)。首先,在真實環(huán)境中,正常行為的網(wǎng)絡(luò)流量數(shù)量要遠(yuǎn)遠(yuǎn)多于惡意行為的網(wǎng)絡(luò)流量數(shù)量,這種類別不均勻分布的數(shù)據(jù)集使得傳統(tǒng)的基于數(shù)據(jù)集類別均勻分布假設(shè)所設(shè)計的分類算法無法達(dá)到預(yù)期的分類效果。其次,網(wǎng)絡(luò)流量每時每刻源源不斷地產(chǎn)生,數(shù)據(jù)規(guī)模越來越大,給機(jī)器學(xué)習(xí)模型構(gòu)建帶來了巨大困難。本文針對基于網(wǎng)絡(luò)流量進(jìn)行的Android惡意應(yīng)用檢測領(lǐng)域中遇到的上述關(guān)鍵問題,從普適的類別不平衡學(xué)習(xí)方法入手,到Android惡意應(yīng)用檢測領(lǐng)域中特有的類別不平衡學(xué)習(xí)方法,最后到大數(shù)據(jù)環(huán)境下的類別不平衡學(xué)習(xí)方法,由簡入繁,系統(tǒng)地開展了以下研究工作:(1)針對于類別不平衡學(xué)習(xí)問題,提出一個基于自適應(yīng)加權(quán)和高斯概率密度函數(shù)的過采樣算法。該算法通過分析位置和樣本數(shù)量兩種因素,給每一個少數(shù)類樣本分配不同的權(quán)重,然后根據(jù)此權(quán)重,結(jié)合高斯概率密度函數(shù),合...
【文章頁數(shù)】:78 頁
【學(xué)位級別】:碩士
【文章目錄】:
摘要
abstract
第一章 緒論
1.1 研究背景及意義
1.2 國內(nèi)外研究現(xiàn)狀
1.3 研究內(nèi)容和創(chuàng)新點
1.4 論文組織結(jié)構(gòu)
第二章 相關(guān)研究綜述
2.1 類別不平衡學(xué)習(xí)問題
2.1.1 問題定義
2.1.2 評價策略
2.1.3 類別不平衡學(xué)習(xí)方法
2.2 大數(shù)據(jù)環(huán)境下的類別不平衡學(xué)習(xí)方法
2.3 本章小結(jié)
第三章 基于自適應(yīng)加權(quán)和高斯密度概率函數(shù)的過采樣模型
3.1 相關(guān)研究
3.2 模型描述
3.2.1 少數(shù)類樣本加權(quán)
3.2.2 合成少數(shù)類樣本
3.2.3 數(shù)據(jù)清洗
3.2.4 案例學(xué)習(xí)
3.3 模型性能評估與實驗
3.3.1 實驗數(shù)據(jù)
3.3.2 實驗參數(shù)
3.3.3 結(jié)果與分析
3.4 類別不平衡Android惡意應(yīng)用檢測實驗
3.4.1 實驗數(shù)據(jù)
3.4.2 結(jié)果與分析
3.5 本章小結(jié)
第四章 基于多樣性測量和PBIL進(jìn)化的類別不平衡學(xué)習(xí)方法
4.1 相關(guān)研究
4.1.1 Q統(tǒng)計量
4.1.2 EUSBoost
4.2 模型描述
4.2.1 基于樣本歐式距離的多樣性評估算法
4.2.2 基于PBIL的進(jìn)化欠采樣算法
4.2.3 自適應(yīng)加權(quán)投票策略
4.3 模型性能評估與實驗
4.3.1 實驗數(shù)據(jù)
4.3.2 實驗參數(shù)
4.3.3 多樣性評估算法性能評估與分析
4.3.4 類別不平衡集成學(xué)習(xí)模型性能評估與分析
4.4 類別不平衡Android惡意應(yīng)用檢測實驗
4.5 本章小結(jié)
第五章 基于signature輔助的隨機(jī)過采樣模型
5.1 研究背景
5.2 模型描述
5.2.1 基于HTTP協(xié)議的網(wǎng)絡(luò)行為聚類
5.2.2 signature提取
5.2.3 HTTP請求頭URL模擬
5.2.4 Android惡意應(yīng)用檢測模型構(gòu)建
5.3 模型性能評估與實驗
5.3.1 實驗數(shù)據(jù)
5.3.2 實驗參數(shù)
5.3.3 結(jié)果與分析
5.4 本章小結(jié)
第六章 基于分布式框架的類別不平衡學(xué)習(xí)模型
6.1 相關(guān)研究
6.1.1 分布式平臺框架
6.1.2 分布式類別不平衡學(xué)習(xí)模型相關(guān)研究
6.2 模型描述
6.2.1 模型構(gòu)建
6.2.2 模型測試
6.3 模型評估與實驗
6.3.1 實驗環(huán)境
6.3.2 實驗數(shù)據(jù)
6.3.3 實驗參數(shù)
6.3.4 結(jié)果與分析
6.4 本章小結(jié)
第七章 結(jié)論與展望
參考文獻(xiàn)
致謝
附錄
本文編號:3772367
【文章頁數(shù)】:78 頁
【學(xué)位級別】:碩士
【文章目錄】:
摘要
abstract
第一章 緒論
1.1 研究背景及意義
1.2 國內(nèi)外研究現(xiàn)狀
1.3 研究內(nèi)容和創(chuàng)新點
1.4 論文組織結(jié)構(gòu)
第二章 相關(guān)研究綜述
2.1 類別不平衡學(xué)習(xí)問題
2.1.1 問題定義
2.1.2 評價策略
2.1.3 類別不平衡學(xué)習(xí)方法
2.2 大數(shù)據(jù)環(huán)境下的類別不平衡學(xué)習(xí)方法
2.3 本章小結(jié)
第三章 基于自適應(yīng)加權(quán)和高斯密度概率函數(shù)的過采樣模型
3.1 相關(guān)研究
3.2 模型描述
3.2.1 少數(shù)類樣本加權(quán)
3.2.2 合成少數(shù)類樣本
3.2.3 數(shù)據(jù)清洗
3.2.4 案例學(xué)習(xí)
3.3 模型性能評估與實驗
3.3.1 實驗數(shù)據(jù)
3.3.2 實驗參數(shù)
3.3.3 結(jié)果與分析
3.4 類別不平衡Android惡意應(yīng)用檢測實驗
3.4.1 實驗數(shù)據(jù)
3.4.2 結(jié)果與分析
3.5 本章小結(jié)
第四章 基于多樣性測量和PBIL進(jìn)化的類別不平衡學(xué)習(xí)方法
4.1 相關(guān)研究
4.1.1 Q統(tǒng)計量
4.1.2 EUSBoost
4.2 模型描述
4.2.1 基于樣本歐式距離的多樣性評估算法
4.2.2 基于PBIL的進(jìn)化欠采樣算法
4.2.3 自適應(yīng)加權(quán)投票策略
4.3 模型性能評估與實驗
4.3.1 實驗數(shù)據(jù)
4.3.2 實驗參數(shù)
4.3.3 多樣性評估算法性能評估與分析
4.3.4 類別不平衡集成學(xué)習(xí)模型性能評估與分析
4.4 類別不平衡Android惡意應(yīng)用檢測實驗
4.5 本章小結(jié)
第五章 基于signature輔助的隨機(jī)過采樣模型
5.1 研究背景
5.2 模型描述
5.2.1 基于HTTP協(xié)議的網(wǎng)絡(luò)行為聚類
5.2.2 signature提取
5.2.3 HTTP請求頭URL模擬
5.2.4 Android惡意應(yīng)用檢測模型構(gòu)建
5.3 模型性能評估與實驗
5.3.1 實驗數(shù)據(jù)
5.3.2 實驗參數(shù)
5.3.3 結(jié)果與分析
5.4 本章小結(jié)
第六章 基于分布式框架的類別不平衡學(xué)習(xí)模型
6.1 相關(guān)研究
6.1.1 分布式平臺框架
6.1.2 分布式類別不平衡學(xué)習(xí)模型相關(guān)研究
6.2 模型描述
6.2.1 模型構(gòu)建
6.2.2 模型測試
6.3 模型評估與實驗
6.3.1 實驗環(huán)境
6.3.2 實驗數(shù)據(jù)
6.3.3 實驗參數(shù)
6.3.4 結(jié)果與分析
6.4 本章小結(jié)
第七章 結(jié)論與展望
參考文獻(xiàn)
致謝
附錄
本文編號:3772367
本文鏈接:http://sikaile.net/kejilunwen/zidonghuakongzhilunwen/3772367.html
最近更新
教材專著