基于URL的釣魚目標(biāo)識別的研究
發(fā)布時間:2021-04-07 17:03
釣魚網(wǎng)站是網(wǎng)絡(luò)攻擊的主要形式之一,為了維護(hù)信息安全,各類釣魚檢測技術(shù)在不斷改進(jìn),但目前針對釣魚網(wǎng)站攻擊目標(biāo)的識別缺少專門的研究和解決方法,而確定攻擊目標(biāo)對有針對性地提醒用戶和被攻擊網(wǎng)站,使他們提前做出防范措施,及指導(dǎo)未來釣魚網(wǎng)站的研究方向有重要意義。研究人員主要從URL、網(wǎng)頁特征這兩個角度進(jìn)行釣魚網(wǎng)站識別,而對其攻擊目標(biāo)進(jìn)行識別只是作為釣魚檢測的一個附加功能,也是從URL和網(wǎng)頁特征中進(jìn)行初步的識別,準(zhǔn)確率較低,而且特征提取的復(fù)雜度較高。同時,攻擊者也在不斷更新攻擊方式來逃避各種釣魚網(wǎng)站識別技術(shù)。為了應(yīng)對釣魚者的檢測逃避策略,同時準(zhǔn)確識別出其意圖攻擊的目標(biāo),本文對此展開釣魚目標(biāo)識別的研究,本文主要內(nèi)容如下:(1)提出基于URL相似性的目標(biāo)識別算法。通過對URL中域名字符串的相似性分析,改進(jìn)編輯距離的計算方式來識別利用填充字符實現(xiàn)逃避檢測的釣魚網(wǎng)站,另外通過確定候選目標(biāo)減少編輯距離的計算次數(shù),提高算法的整體效率。(2)提出基于URL語言特征的釣魚網(wǎng)站識別算法。對于無法從URL上直接識別出目標(biāo)的網(wǎng)站,通過分析URL蘊(yùn)含的語言特征選擇可以有效分類的域名特征,利用域名特征建立決策樹分類模型實現(xiàn)對...
【文章來源】:中國礦業(yè)大學(xué)江蘇省 211工程院校 教育部直屬院校
【文章頁數(shù)】:82 頁
【學(xué)位級別】:碩士
【部分圖文】:
釣魚網(wǎng)站實例Figure5-1Examplesofphishingwebsites標(biāo)簽下是網(wǎng)頁的主要內(nèi)容,可以通過瀏覽器呈現(xiàn)給用戶,里面常包含
5 基于搜索引擎的目標(biāo)識別釣魚檢測,直接將整個標(biāo)題內(nèi)容轉(zhuǎn)換成 unicode 編碼形式如圖 5-2 (a),或者只轉(zhuǎn)換其中的敏感字符串如圖 5-2 (b),僅將“paypal”轉(zhuǎn)換成了 unicode 編碼,這樣既能迷惑用戶又可以逃避檢測。在對最近仍然存活的釣魚網(wǎng)站進(jìn)行分析時發(fā)現(xiàn),這類釣魚網(wǎng)站的數(shù)量不在少數(shù),unicode 編碼形式已經(jīng)成為釣魚者逃避檢測的新策略。
圖 5-4 準(zhǔn)確率隨 n 的變化Figure 5-4 The change of Acc with n從總體上來說,利用上述三種搜索引擎進(jìn)行目標(biāo)識別的準(zhǔn)備率隨 n 的增加加。其中,Yahoo 的準(zhǔn)確率穩(wěn)步增加;Google 的準(zhǔn)確率呈波動上升趨勢,這為有些釣魚網(wǎng)站在 Google 的排名較高,被誤判為合法網(wǎng)站,基于此實驗結(jié)果了降低整體的誤判率,在綜合利用三種搜索引擎進(jìn)行目標(biāo)識別時,若某條記出現(xiàn)在 Google 的前 top-n 個返回的結(jié)果中,而未出現(xiàn)在另外兩個搜索引擎的結(jié)果中時,仍然判斷其為釣魚網(wǎng)站;百度的準(zhǔn)確率在 n=1 時明顯低于另外搜索引擎,可能是因為一些網(wǎng)站為了獲取點擊量和贏利會利用各種手段提高,而官方網(wǎng)站的排名通常在第三名左右,當(dāng) n>3 時,百度的準(zhǔn)確率有明顯提高 n>6 時,三種搜索引擎的準(zhǔn)確率都達(dá)到穩(wěn)定狀態(tài),沒有明顯變化。因此綜合搜索引擎的實驗結(jié)果,文中將 n 的值設(shè)置為 6。4.3 性能分析1)標(biāo)簽對比Baidu Google Yahoo
【參考文獻(xiàn)】:
期刊論文
[1]深度神經(jīng)網(wǎng)絡(luò)并行化研究綜述[J]. 朱虎明,李佩,焦李成,楊淑媛,侯彪. 計算機(jī)學(xué)報. 2018(08)
[2]基于改進(jìn)的C4.5算法對車輛加速性能分類研究[J]. 陸寶紅,陳晨,曹曦文,陳眺,曾潔,史昇,宋雪樺. 軟件導(dǎo)刊. 2018(01)
[3]一種利用關(guān)聯(lián)規(guī)則挖掘的多標(biāo)記分類算法[J]. 劉軍煜,賈修一. 軟件學(xué)報. 2017(11)
[4]短規(guī)則有效的快速多模式匹配算法[J]. 夏念,嵩天. 計算機(jī)工程與應(yīng)用. 2017(07)
[5]基于頁面敏感特征的金融類釣魚網(wǎng)頁檢測方法[J]. 胡向東,劉可,張峰,林家富,付俊,郭智慧. 網(wǎng)絡(luò)與信息安全學(xué)報. 2017(02)
[6]基于分割的字符串相似性查找算法[J]. 劉慧婷,黃厚柱,劉志中,趙鵬. 計算機(jī)科學(xué)與探索. 2018(01)
[7]基于頁面布局相似性的釣魚網(wǎng)頁發(fā)現(xiàn)方法[J]. 鄒學(xué)強(qiáng),張鵬,黃彩云,陳志鵬,孫永,劉慶云. 通信學(xué)報. 2016(S1)
[8]基于詞素特征的輕量級域名檢測算法[J]. 張維維,龔儉,劉茜,劉尚東,胡曉艷. 軟件學(xué)報. 2016(09)
[9]一種改進(jìn)的C4.5決策樹算法[J]. 王志春,劉麗娜. 電子技術(shù)與軟件工程. 2016(09)
[10]決策樹C4.5算法的優(yōu)化與應(yīng)用[J]. 苗煜飛,張霄宏. 計算機(jī)工程與應(yīng)用. 2015(13)
碩士論文
[1]基于K-Means和SVM的釣魚網(wǎng)站識別的研究[D]. 趙加林.西南交通大學(xué) 2016
本文編號:3123846
【文章來源】:中國礦業(yè)大學(xué)江蘇省 211工程院校 教育部直屬院校
【文章頁數(shù)】:82 頁
【學(xué)位級別】:碩士
【部分圖文】:
釣魚網(wǎng)站實例Figure5-1Examplesofphishingwebsites標(biāo)簽下是網(wǎng)頁的主要內(nèi)容,可以通過瀏覽器呈現(xiàn)給用戶,里面常包含
5 基于搜索引擎的目標(biāo)識別釣魚檢測,直接將整個標(biāo)題內(nèi)容轉(zhuǎn)換成 unicode 編碼形式如圖 5-2 (a),或者只轉(zhuǎn)換其中的敏感字符串如圖 5-2 (b),僅將“paypal”轉(zhuǎn)換成了 unicode 編碼,這樣既能迷惑用戶又可以逃避檢測。在對最近仍然存活的釣魚網(wǎng)站進(jìn)行分析時發(fā)現(xiàn),這類釣魚網(wǎng)站的數(shù)量不在少數(shù),unicode 編碼形式已經(jīng)成為釣魚者逃避檢測的新策略。
圖 5-4 準(zhǔn)確率隨 n 的變化Figure 5-4 The change of Acc with n從總體上來說,利用上述三種搜索引擎進(jìn)行目標(biāo)識別的準(zhǔn)備率隨 n 的增加加。其中,Yahoo 的準(zhǔn)確率穩(wěn)步增加;Google 的準(zhǔn)確率呈波動上升趨勢,這為有些釣魚網(wǎng)站在 Google 的排名較高,被誤判為合法網(wǎng)站,基于此實驗結(jié)果了降低整體的誤判率,在綜合利用三種搜索引擎進(jìn)行目標(biāo)識別時,若某條記出現(xiàn)在 Google 的前 top-n 個返回的結(jié)果中,而未出現(xiàn)在另外兩個搜索引擎的結(jié)果中時,仍然判斷其為釣魚網(wǎng)站;百度的準(zhǔn)確率在 n=1 時明顯低于另外搜索引擎,可能是因為一些網(wǎng)站為了獲取點擊量和贏利會利用各種手段提高,而官方網(wǎng)站的排名通常在第三名左右,當(dāng) n>3 時,百度的準(zhǔn)確率有明顯提高 n>6 時,三種搜索引擎的準(zhǔn)確率都達(dá)到穩(wěn)定狀態(tài),沒有明顯變化。因此綜合搜索引擎的實驗結(jié)果,文中將 n 的值設(shè)置為 6。4.3 性能分析1)標(biāo)簽對比Baidu Google Yahoo
【參考文獻(xiàn)】:
期刊論文
[1]深度神經(jīng)網(wǎng)絡(luò)并行化研究綜述[J]. 朱虎明,李佩,焦李成,楊淑媛,侯彪. 計算機(jī)學(xué)報. 2018(08)
[2]基于改進(jìn)的C4.5算法對車輛加速性能分類研究[J]. 陸寶紅,陳晨,曹曦文,陳眺,曾潔,史昇,宋雪樺. 軟件導(dǎo)刊. 2018(01)
[3]一種利用關(guān)聯(lián)規(guī)則挖掘的多標(biāo)記分類算法[J]. 劉軍煜,賈修一. 軟件學(xué)報. 2017(11)
[4]短規(guī)則有效的快速多模式匹配算法[J]. 夏念,嵩天. 計算機(jī)工程與應(yīng)用. 2017(07)
[5]基于頁面敏感特征的金融類釣魚網(wǎng)頁檢測方法[J]. 胡向東,劉可,張峰,林家富,付俊,郭智慧. 網(wǎng)絡(luò)與信息安全學(xué)報. 2017(02)
[6]基于分割的字符串相似性查找算法[J]. 劉慧婷,黃厚柱,劉志中,趙鵬. 計算機(jī)科學(xué)與探索. 2018(01)
[7]基于頁面布局相似性的釣魚網(wǎng)頁發(fā)現(xiàn)方法[J]. 鄒學(xué)強(qiáng),張鵬,黃彩云,陳志鵬,孫永,劉慶云. 通信學(xué)報. 2016(S1)
[8]基于詞素特征的輕量級域名檢測算法[J]. 張維維,龔儉,劉茜,劉尚東,胡曉艷. 軟件學(xué)報. 2016(09)
[9]一種改進(jìn)的C4.5決策樹算法[J]. 王志春,劉麗娜. 電子技術(shù)與軟件工程. 2016(09)
[10]決策樹C4.5算法的優(yōu)化與應(yīng)用[J]. 苗煜飛,張霄宏. 計算機(jī)工程與應(yīng)用. 2015(13)
碩士論文
[1]基于K-Means和SVM的釣魚網(wǎng)站識別的研究[D]. 趙加林.西南交通大學(xué) 2016
本文編號:3123846
本文鏈接:http://sikaile.net/kejilunwen/sousuoyinqinglunwen/3123846.html
最近更新
教材專著