基于URL混淆技術(shù)識(shí)別的釣魚(yú)網(wǎng)頁(yè)檢測(cè)方法
本文選題:釣魚(yú)網(wǎng)頁(yè) 切入點(diǎn):統(tǒng)一資源定位符(URL)混淆技術(shù) 出處:《計(jì)算機(jī)工程與應(yīng)用》2017年20期 論文類型:期刊論文
【摘要】:針對(duì)釣魚(yú)URL常用的混淆技術(shù),提出一種基于規(guī)則匹配和邏輯回歸的釣魚(yú)網(wǎng)頁(yè)檢測(cè)方法(RMLR)。首先,使用針對(duì)違反URL命名標(biāo)準(zhǔn)及隱藏釣魚(yú)目標(biāo)詞等混淆技術(shù)所構(gòu)建的規(guī)則庫(kù)對(duì)給定網(wǎng)頁(yè)分類,若可判定其為釣魚(yú)網(wǎng)址,則省略后續(xù)的特征提取及檢測(cè)過(guò)程,以滿足實(shí)時(shí)檢測(cè)的需要。若未能直接判定為釣魚(yú)網(wǎng)址,則提取該URL的相關(guān)特征,并使用邏輯回歸分類器進(jìn)行二次檢測(cè),以提升檢測(cè)的適應(yīng)性和準(zhǔn)確率,并降低因規(guī)則庫(kù)規(guī)模不足導(dǎo)致的誤報(bào)率。同時(shí),RMLR引入基于字符串相似度的Jaccard隨機(jī)域名識(shí)別方法來(lái)輔助檢測(cè)釣魚(yú)URL。實(shí)驗(yàn)結(jié)果表明,RMLR準(zhǔn)確率達(dá)到98.7%,具有良好的檢測(cè)效果。
[Abstract]:Aiming at the obfuscation technique commonly used in phishing URL, a method of fishing page detection based on rule matching and logical regression is proposed. A rule base based on the obfuscation techniques such as violating the URL naming standard and hiding the phishing target words is used to classify a given web page. If it can be judged as a phishing site, it omits the subsequent feature extraction and detection process. In order to meet the needs of real-time detection, if not directly identified as a fishing site, the relevant features of the URL are extracted, and the second detection is carried out by using a logical regression classifier to improve the adaptability and accuracy of the detection. At the same time, the Jaccard random domain name recognition method based on string similarity is introduced to assist the detection of phishing URLs. The experimental results show that the accuracy of Jaccard is 98.7 and has good detection effect.
【作者單位】: 新疆大學(xué)信息科學(xué)與工程學(xué)院;
【基金】:國(guó)家自然科學(xué)基金(No.61303231,No.61433012,No.U1435215)
【分類號(hào)】:TP393.08
【相似文獻(xiàn)】
相關(guān)期刊論文 前10條
1 李廣麗;劉覺(jué)夫;;面向URL的網(wǎng)絡(luò)機(jī)器人軟件模型的研究與實(shí)現(xiàn)[J];華東交通大學(xué)學(xué)報(bào);2007年01期
2 任兀;;易開(kāi)發(fā),易優(yōu)化——ASP.NET4.0中的URL路由[J];科技信息;2010年28期
3 劉國(guó)卿;;基于MD5的URL防篡改算法設(shè)計(jì)[J];科技信息;2011年03期
4 海心閣 ,糯米;看懂網(wǎng)址 小心URL欺騙[J];中國(guó)會(huì)計(jì)電算化;2003年08期
5 耿長(zhǎng)欣,劉培玉;URL凈化算法的探討及改進(jìn)[J];計(jì)算機(jī)工程與設(shè)計(jì);2004年08期
6 曾義聰;楊貫中;周志光;曾強(qiáng)聰;;基于層次語(yǔ)義的URL排序方法研究[J];計(jì)算機(jī)工程與設(shè)計(jì);2008年13期
7 劉勝利;楊龍;;基于網(wǎng)絡(luò)通信行為分析的竊密木馬檢測(cè)技術(shù)[J];保密科學(xué)技術(shù);2012年12期
8 楊陽(yáng);基于URL的Web服務(wù)器數(shù)據(jù)訪問(wèn)[J];電腦編程技巧與維護(hù);2003年10期
9 ;迅雷URL掃描 誰(shuí)家的“杯具”[J];電腦愛(ài)好者;2010年09期
10 曹玖新;董丹;毛波;王田峰;;基于URL特征的Phishing檢測(cè)方法(英文)[J];Journal of Southeast University(English Edition);2013年02期
相關(guān)重要報(bào)紙文章 前1條
1 海心閣 糯米;看懂網(wǎng)址,,小心URL欺騙[N];電腦報(bào);2003年
相關(guān)碩士學(xué)位論文 前5條
1 崔靜靜;基于I-K-Means聚類的樸素貝葉斯HRNB分類算法在入侵檢測(cè)中的應(yīng)用研究[D];河南理工大學(xué);2014年
2 張瑞琴;基于信息熵聚類的異常檢測(cè)方法研究[D];北京交通大學(xué);2016年
3 丁興旺;面向網(wǎng)絡(luò)爬蟲(chóng)的海量URL數(shù)據(jù)管理技術(shù)研究[D];哈爾濱工業(yè)大學(xué);2008年
4 謝豪;近似字符串匹配研究及其在URL檢測(cè)中的應(yīng)用[D];華南理工大學(xué);2011年
5 郝建波;微博突發(fā)話題檢測(cè)、跟蹤與傳播預(yù)測(cè)技術(shù)研究[D];哈爾濱工程大學(xué);2013年
本文編號(hào):1649044
本文鏈接:http://sikaile.net/guanlilunwen/ydhl/1649044.html