基于半監(jiān)督學習的惡意URL檢測方法
發(fā)布時間:2024-02-02 13:56
檢測惡意URL對防御網(wǎng)絡攻擊有著重要意義.針對有監(jiān)督學習需要大量有標簽樣本這一問題,本文采用半監(jiān)督學習方式訓練惡意URL檢測模型,減少了為數(shù)據(jù)打標簽帶來的成本開銷.在傳統(tǒng)半監(jiān)督學習協(xié)同訓練(co-training)的基礎上進行了算法改進,利用專家知識與Doc2Vec兩種方法預處理的數(shù)據(jù)訓練兩個分類器,篩選兩個分類器預測結(jié)果相同且置信度高的數(shù)據(jù)打上偽標簽(pseudo-labeled)后用于分類器繼續(xù)學習.實驗結(jié)果表明,本文方法只用0.67%的有標簽數(shù)據(jù)即可訓練出檢測精確度(precision)分別達到99.42%和95.23%的兩個不同類型分類器,與有監(jiān)督學習性能相近,比自訓練與協(xié)同訓練表現(xiàn)更優(yōu)異.
【文章頁數(shù)】:10 頁
本文編號:3892775
【文章頁數(shù)】:10 頁
本文編號:3892775
本文鏈接:http://sikaile.net/guanlilunwen/ydhl/3892775.html
最近更新
教材專著