基于URL和網(wǎng)頁(yè)特征的釣魚檢測(cè)技術(shù)
發(fā)布時(shí)間:2021-06-10 22:04
釣魚網(wǎng)站,通過模仿一些合法網(wǎng)站,如銀行等,欺詐互聯(lián)網(wǎng)用戶,非法獲取其財(cái)產(chǎn),并一直威脅著人們的網(wǎng)絡(luò)空間安全。因此人們需要更有效的技術(shù)來防御釣魚網(wǎng)站攻擊。本文設(shè)計(jì)了基于URL的特征以及結(jié)合URL和網(wǎng)頁(yè)特征的檢測(cè)方法。網(wǎng)站URL特征可以大致分為三類;基礎(chǔ)特征、字母頻率特征、編輯距離,其中編輯距離特征提取策略為本文創(chuàng)新特征。實(shí)驗(yàn)證明,該特征可以有效提高模型準(zhǔn)確率,最終分別在4000和40000條網(wǎng)址數(shù)據(jù)集上準(zhǔn)確率為0.946和0.959。特別是使用Aho-Corasick算法進(jìn)行URL特征自動(dòng)提取,平均處理時(shí)間為14.1 ms/條。本文還提出了三類網(wǎng)頁(yè)特征:網(wǎng)站內(nèi)外鏈數(shù)目、前向鏈接和站內(nèi)鏈接、是否包含登錄窗口。通過對(duì)GBDT分類器模型進(jìn)行參數(shù)調(diào)優(yōu),最終結(jié)合URL和網(wǎng)頁(yè)特征,模型準(zhǔn)確率為0.976,可以有效抵御網(wǎng)絡(luò)釣魚攻擊。由于網(wǎng)頁(yè)特征提取耗時(shí)較久,本文提出基于MongoDB+ES,對(duì)海量網(wǎng)站特征值進(jìn)行預(yù)存儲(chǔ)和查詢。其同步特征值和查詢平均時(shí)間為0.317 ms/條和17.914 ms/條,大大提升了檢測(cè)效率。由于網(wǎng)頁(yè)訪問的不確定性,本文訓(xùn)練了基于URL特征的GBDT分類器A和基于全部特征的GBD...
【文章來源】:廣東工業(yè)大學(xué)廣東省
【文章頁(yè)數(shù)】:81 頁(yè)
【學(xué)位級(jí)別】:碩士
【部分圖文】:
釣魚網(wǎng)站仿冒對(duì)象情況
第一章 緒論來越多的研究人員開始探索解決此問題的方法。在過去兩年中,公司 Riskified 和網(wǎng)絡(luò)情報(bào)公司 IntSights 發(fā)布的聯(lián)合報(bào)告指出[5],并收集客戶信息的攻擊網(wǎng)站數(shù)量正在增加。在對(duì) 2017年第三季度的數(shù)據(jù)對(duì)比后,兩家公司發(fā)現(xiàn)網(wǎng)絡(luò)釣魚網(wǎng)站的數(shù)量增加了 297%出,這些網(wǎng)絡(luò)釣魚網(wǎng)站如今被設(shè)計(jì)的越來越細(xì)致,似乎與普通購(gòu)
圖 3-1 Aho-Corasick 算法字典樹Figure 3-1 Aho-Corasick algorithm dictionary tree為字典樹添加失敗路徑。具體而言,對(duì)于直接與根節(jié)點(diǎn)相連的節(jié)點(diǎn)匹配失敗,則他們的 Fail 指針直接指向 root 即可,如圖 3-1點(diǎn)的 Fail 指針設(shè)置如下:假設(shè)當(dāng)前為父節(jié)點(diǎn),記為 father,其子當(dāng)前 child 節(jié)點(diǎn)的 Fail 指針時(shí),首先需要查詢其 father 節(jié)點(diǎn)的 點(diǎn),假如是 root,則檢查 root 的所有 child 中是否存在和當(dāng)前 c母一樣的節(jié)點(diǎn),如果能夠找到,則該節(jié)點(diǎn)即為 child 的 Fail 指針1 中 ,3 號(hào)節(jié)點(diǎn)為 7 號(hào)、9 號(hào)節(jié)點(diǎn)的 Fail 指針?biāo)腹?jié)點(diǎn)。如果沒有ther → Fail → Fail 節(jié)點(diǎn)。不斷重復(fù)上述過程,如果一直都找不到
【參考文獻(xiàn)】:
期刊論文
[1]魚叉式網(wǎng)絡(luò)釣魚攻擊檢測(cè)方法[J]. 池亞平,凌志婷,許萍,楊建喜. 計(jì)算機(jī)工程與設(shè)計(jì). 2018(11)
[2]科技期刊釣魚網(wǎng)站常用技術(shù)手段分析及防范措施[J]. 胡國(guó)強(qiáng),楊彥榮,馬秋明. 中國(guó)科技期刊研究. 2018(10)
[3]OAuth 2.0授權(quán)協(xié)議常見安全問題及修復(fù)建議[J]. 邱永哲. 無(wú)線互聯(lián)科技. 2018(07)
[4]基于分類置信度和網(wǎng)站特征的釣魚檢測(cè)系統(tǒng)[J]. 陳旭,黎宇坤,袁華平,劉文印. 信息網(wǎng)絡(luò)安全. 2017(09)
[5]一種基于內(nèi)容分析的高性能反釣魚識(shí)別引擎[J]. 王惟. 軟件導(dǎo)刊. 2015(04)
[6]基于改進(jìn)編輯距離的字符串相似度求解算法[J]. 姜華,韓安琪,王美佳,王崢,吳雲(yún)玲. 計(jì)算機(jī)工程. 2014(01)
碩士論文
[1]客戶端釣魚網(wǎng)站智能檢測(cè)系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)[D]. 程思宇.華北電力大學(xué) 2015
[2]基于登錄頁(yè)面及Logo圖標(biāo)檢測(cè)的反釣魚方案[D]. 楊明星.太原理工大學(xué) 2015
[3]基于AdaBoost算法的網(wǎng)絡(luò)釣魚檢測(cè)系統(tǒng)的研究[D]. 李思強(qiáng).江西理工大學(xué) 2015
本文編號(hào):3223182
【文章來源】:廣東工業(yè)大學(xué)廣東省
【文章頁(yè)數(shù)】:81 頁(yè)
【學(xué)位級(jí)別】:碩士
【部分圖文】:
釣魚網(wǎng)站仿冒對(duì)象情況
第一章 緒論來越多的研究人員開始探索解決此問題的方法。在過去兩年中,公司 Riskified 和網(wǎng)絡(luò)情報(bào)公司 IntSights 發(fā)布的聯(lián)合報(bào)告指出[5],并收集客戶信息的攻擊網(wǎng)站數(shù)量正在增加。在對(duì) 2017年第三季度的數(shù)據(jù)對(duì)比后,兩家公司發(fā)現(xiàn)網(wǎng)絡(luò)釣魚網(wǎng)站的數(shù)量增加了 297%出,這些網(wǎng)絡(luò)釣魚網(wǎng)站如今被設(shè)計(jì)的越來越細(xì)致,似乎與普通購(gòu)
圖 3-1 Aho-Corasick 算法字典樹Figure 3-1 Aho-Corasick algorithm dictionary tree為字典樹添加失敗路徑。具體而言,對(duì)于直接與根節(jié)點(diǎn)相連的節(jié)點(diǎn)匹配失敗,則他們的 Fail 指針直接指向 root 即可,如圖 3-1點(diǎn)的 Fail 指針設(shè)置如下:假設(shè)當(dāng)前為父節(jié)點(diǎn),記為 father,其子當(dāng)前 child 節(jié)點(diǎn)的 Fail 指針時(shí),首先需要查詢其 father 節(jié)點(diǎn)的 點(diǎn),假如是 root,則檢查 root 的所有 child 中是否存在和當(dāng)前 c母一樣的節(jié)點(diǎn),如果能夠找到,則該節(jié)點(diǎn)即為 child 的 Fail 指針1 中 ,3 號(hào)節(jié)點(diǎn)為 7 號(hào)、9 號(hào)節(jié)點(diǎn)的 Fail 指針?biāo)腹?jié)點(diǎn)。如果沒有ther → Fail → Fail 節(jié)點(diǎn)。不斷重復(fù)上述過程,如果一直都找不到
【參考文獻(xiàn)】:
期刊論文
[1]魚叉式網(wǎng)絡(luò)釣魚攻擊檢測(cè)方法[J]. 池亞平,凌志婷,許萍,楊建喜. 計(jì)算機(jī)工程與設(shè)計(jì). 2018(11)
[2]科技期刊釣魚網(wǎng)站常用技術(shù)手段分析及防范措施[J]. 胡國(guó)強(qiáng),楊彥榮,馬秋明. 中國(guó)科技期刊研究. 2018(10)
[3]OAuth 2.0授權(quán)協(xié)議常見安全問題及修復(fù)建議[J]. 邱永哲. 無(wú)線互聯(lián)科技. 2018(07)
[4]基于分類置信度和網(wǎng)站特征的釣魚檢測(cè)系統(tǒng)[J]. 陳旭,黎宇坤,袁華平,劉文印. 信息網(wǎng)絡(luò)安全. 2017(09)
[5]一種基于內(nèi)容分析的高性能反釣魚識(shí)別引擎[J]. 王惟. 軟件導(dǎo)刊. 2015(04)
[6]基于改進(jìn)編輯距離的字符串相似度求解算法[J]. 姜華,韓安琪,王美佳,王崢,吳雲(yún)玲. 計(jì)算機(jī)工程. 2014(01)
碩士論文
[1]客戶端釣魚網(wǎng)站智能檢測(cè)系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)[D]. 程思宇.華北電力大學(xué) 2015
[2]基于登錄頁(yè)面及Logo圖標(biāo)檢測(cè)的反釣魚方案[D]. 楊明星.太原理工大學(xué) 2015
[3]基于AdaBoost算法的網(wǎng)絡(luò)釣魚檢測(cè)系統(tǒng)的研究[D]. 李思強(qiáng).江西理工大學(xué) 2015
本文編號(hào):3223182
本文鏈接:http://sikaile.net/guanlilunwen/ydhl/3223182.html
最近更新
教材專著