基于LSTM的釣魚郵件檢測系統(tǒng)
發(fā)布時(shí)間:2021-08-20 00:19
提出了一種基于LSTM的釣魚郵件檢測方式.該方式主要由兩部分構(gòu)成:分別為數(shù)據(jù)擴(kuò)充部分及模型訓(xùn)練部分.數(shù)據(jù)擴(kuò)展部分中,通過KNN與K-means算法擴(kuò)大訓(xùn)練數(shù)據(jù)集,保證數(shù)據(jù)的數(shù)量能夠滿足深度學(xué)習(xí)算法的需要.在模型訓(xùn)練部分中,通過對數(shù)據(jù)進(jìn)行預(yù)處理并將其轉(zhuǎn)化為詞向量矩陣,最后將轉(zhuǎn)化完詞向量通過訓(xùn)練得到LSTM神經(jīng)網(wǎng)絡(luò)模型.最終,可以根據(jù)訓(xùn)練好的LSTM模型將郵件分為正常郵件以及釣魚郵件.通過實(shí)驗(yàn)對提出的算法進(jìn)行了評估,實(shí)驗(yàn)結(jié)果顯示提出的算法準(zhǔn)確率可以達(dá)到95%.
【文章來源】:北京理工大學(xué)學(xué)報(bào). 2020,40(12)北大核心EICSCD
【文章頁數(shù)】:6 頁
【部分圖文】:
基于惡意附件的釣魚郵件
基于惡意鏈接的釣魚郵件
提出的系統(tǒng)框架如圖3所示,主要由3個(gè)部分組成:郵件預(yù)處理與特征提取部分、數(shù)據(jù)擴(kuò)充與聚類部分以及判別部分. 下面分別對這3個(gè)部分進(jìn)行介紹.在郵件預(yù)處理與特征提取部分中,通過常規(guī)郵件以及攻擊性郵件篩選縮減需要被訓(xùn)練以及被檢測的郵件數(shù)量,從而提高檢測模型的準(zhǔn)確率以及檢測模型效率. 在聚類算法部分中,借助于K-means[14]與KNN[15]算法對郵件進(jìn)行精準(zhǔn)標(biāo)注以及數(shù)據(jù)擴(kuò)增. 深度學(xué)習(xí)模型部分中,通過分詞,詞向量訓(xùn)練完成郵件正文到詞向量的轉(zhuǎn)化. 最終高效地實(shí)現(xiàn)釣魚郵件的檢測.
【參考文獻(xiàn)】:
期刊論文
[1]一種新的場景文本識別模型[J]. 王茂森,蔣小森,牛少彰. 北京理工大學(xué)學(xué)報(bào). 2019(03)
[2]基于二次訓(xùn)練技術(shù)的入侵檢測方法研究[J]. 李龍杰,于洋,白伸伸,侯元偉,郝永樂. 北京理工大學(xué)學(xué)報(bào). 2017(12)
[3]基于卷積神經(jīng)網(wǎng)絡(luò)的入侵檢測算法[J]. 賈凡,孔令智. 北京理工大學(xué)學(xué)報(bào). 2017(12)
本文編號:3352424
【文章來源】:北京理工大學(xué)學(xué)報(bào). 2020,40(12)北大核心EICSCD
【文章頁數(shù)】:6 頁
【部分圖文】:
基于惡意附件的釣魚郵件
基于惡意鏈接的釣魚郵件
提出的系統(tǒng)框架如圖3所示,主要由3個(gè)部分組成:郵件預(yù)處理與特征提取部分、數(shù)據(jù)擴(kuò)充與聚類部分以及判別部分. 下面分別對這3個(gè)部分進(jìn)行介紹.在郵件預(yù)處理與特征提取部分中,通過常規(guī)郵件以及攻擊性郵件篩選縮減需要被訓(xùn)練以及被檢測的郵件數(shù)量,從而提高檢測模型的準(zhǔn)確率以及檢測模型效率. 在聚類算法部分中,借助于K-means[14]與KNN[15]算法對郵件進(jìn)行精準(zhǔn)標(biāo)注以及數(shù)據(jù)擴(kuò)增. 深度學(xué)習(xí)模型部分中,通過分詞,詞向量訓(xùn)練完成郵件正文到詞向量的轉(zhuǎn)化. 最終高效地實(shí)現(xiàn)釣魚郵件的檢測.
【參考文獻(xiàn)】:
期刊論文
[1]一種新的場景文本識別模型[J]. 王茂森,蔣小森,牛少彰. 北京理工大學(xué)學(xué)報(bào). 2019(03)
[2]基于二次訓(xùn)練技術(shù)的入侵檢測方法研究[J]. 李龍杰,于洋,白伸伸,侯元偉,郝永樂. 北京理工大學(xué)學(xué)報(bào). 2017(12)
[3]基于卷積神經(jīng)網(wǎng)絡(luò)的入侵檢測算法[J]. 賈凡,孔令智. 北京理工大學(xué)學(xué)報(bào). 2017(12)
本文編號:3352424
本文鏈接:http://sikaile.net/guanlilunwen/ydhl/3352424.html
最近更新
教材專著