基于mRMR-RF特征選擇和XGBoost模型的釣魚網(wǎng)站檢測(cè)
發(fā)布時(shí)間:2023-04-12 03:05
針對(duì)大量冗余數(shù)據(jù)帶來的釣魚網(wǎng)站檢測(cè)準(zhǔn)確率不夠、誤判率較高等問題,提出一種基于最大相關(guān)最小冗余(mRMR)和隨機(jī)森林(RF)相結(jié)合的特征選擇方法(mRMR-RF),并利用極端梯度提升(XGBoost)算法構(gòu)建釣魚網(wǎng)站檢測(cè)模型。利用mRMR和RF算法分別對(duì)特征進(jìn)行排序;綜合兩種特征排序得出最終的排序結(jié)果,并根據(jù)實(shí)驗(yàn)得出的最佳特征數(shù)選出XGBoost模型所需的最優(yōu)特征子集;使用最優(yōu)特征子集對(duì)XGBoost分類模型進(jìn)行訓(xùn)練。實(shí)驗(yàn)結(jié)果表明,該方法相比其他分類方法可以提高釣魚網(wǎng)站檢測(cè)的準(zhǔn)確率,具有實(shí)際意義。
【文章頁(yè)數(shù)】:6 頁(yè)
【文章目錄】:
0 引 言
1 基礎(chǔ)理論
1.1 互信息
1.2 最大相關(guān)最小冗余(mRMR)算法
1.3 隨機(jī)森林
2 mRMR-RF特征選擇方法在XGBoost中的應(yīng)用
2.1 XGBoost算法
2.2 釣魚網(wǎng)站檢測(cè)模型
3 實(shí) 驗(yàn)
3.1 實(shí)驗(yàn)數(shù)據(jù)及說明
3.2 評(píng)價(jià)指標(biāo)
3.3 實(shí)驗(yàn)結(jié)果及分析
(1) 實(shí)驗(yàn)一 利用mRMR-RF算法進(jìn)行特征篩選。
(2) 實(shí)驗(yàn)二 利用XGBoost模型進(jìn)行釣魚網(wǎng)站檢測(cè)。
4 結(jié) 語(yǔ)
本文編號(hào):3790299
【文章頁(yè)數(shù)】:6 頁(yè)
【文章目錄】:
0 引 言
1 基礎(chǔ)理論
1.1 互信息
1.2 最大相關(guān)最小冗余(mRMR)算法
1.3 隨機(jī)森林
2 mRMR-RF特征選擇方法在XGBoost中的應(yīng)用
2.1 XGBoost算法
2.2 釣魚網(wǎng)站檢測(cè)模型
3 實(shí) 驗(yàn)
3.1 實(shí)驗(yàn)數(shù)據(jù)及說明
3.2 評(píng)價(jià)指標(biāo)
3.3 實(shí)驗(yàn)結(jié)果及分析
(1) 實(shí)驗(yàn)一 利用mRMR-RF算法進(jìn)行特征篩選。
(2) 實(shí)驗(yàn)二 利用XGBoost模型進(jìn)行釣魚網(wǎng)站檢測(cè)。
4 結(jié) 語(yǔ)
本文編號(hào):3790299
本文鏈接:http://sikaile.net/guanlilunwen/ydhl/3790299.html
最近更新
教材專著