基于K-Means和SVM的釣魚網(wǎng)站識別的研究
本文關(guān)鍵詞:基于K-Means和SVM的釣魚網(wǎng)站識別的研究
更多相關(guān)文章: K-Means算法 SVM 釣魚網(wǎng)站 分類
【摘要】:傳統(tǒng)的單純基于URL黑名單識別方式在今天海量的釣魚網(wǎng)站面前以顯得力不從心,必須配合其他識別方式才能很好地工作。隨后出現(xiàn)了許多新的識別方法,比如基于網(wǎng)頁結(jié)構(gòu)的識別方法,但是語言表達(dá)方式的多樣性使得此種方法相當(dāng)不可靠,幾乎不可用。而基于圖像識別的釣魚網(wǎng)站識別方式衍生出多種識別方法,但是受制于圖像識別本身的缺陷,其在識別時需要做到精確匹配,那么就要求釣魚網(wǎng)站和被模仿的網(wǎng)站完全相似。因此對一大部分假冒購物網(wǎng)站就不能做到很好的識別,且工作時速度很慢。基于樸素貝葉斯的識別方法由于原理的限制使得工作時的效果不穩(wěn)定,因此我們在這里探究新的使用K-Means與SVM相結(jié)合的算法,利用K-Means的優(yōu)點,在識別網(wǎng)站之前對其進(jìn)行一個分組,如果待識別網(wǎng)站是容易被模仿的釣魚網(wǎng)站類型,那么就使用對應(yīng)組別的特征參數(shù)對其進(jìn)行識別即可。同時結(jié)合傳統(tǒng)的URL黑名單機(jī)制和網(wǎng)頁灰度匹配模塊,這樣就可以避免將新建立的部分合法網(wǎng)站錯誤識別為釣魚網(wǎng)站。而要完成此種識別方式,總共完成了四部分的工作,即:一是流行樣本庫,專門收集當(dāng)季典型流行釣魚網(wǎng)站,于此同時獲取網(wǎng)頁有效內(nèi)容并對其進(jìn)行分詞、刪除停用詞等操作并且分析總結(jié)出網(wǎng)站的一系列典型特征;二是對獲取到的網(wǎng)頁進(jìn)行分組,并使用分析得到的特征建立樣本模板;三是分組完畢后使用SVM分類算法對特征進(jìn)行選取,獲取有效的特征;四是在訪問目標(biāo)鏈接時實時收集目標(biāo)網(wǎng)站的各個特征,然后使用SVM算法對其計算信譽(yù)度。通過這四部分的工作組成了釣魚網(wǎng)站識別的完整流程。
【關(guān)鍵詞】:K-Means算法 SVM 釣魚網(wǎng)站 分類
【學(xué)位授予單位】:西南交通大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2016
【分類號】:TP393.092
【目錄】:
- 摘要6-7
- Abstract7-10
- 第1章 緒論10-19
- 1.1 研究意義10-13
- 1.2 國內(nèi)外反釣魚機(jī)構(gòu)現(xiàn)狀13-15
- 1.3 反釣魚技術(shù)的研究現(xiàn)狀15-17
- 1.4 本論文主要研究內(nèi)容17
- 1.5 本文組織結(jié)構(gòu)17-19
- 第2章 釣魚網(wǎng)站特征分析及檢測原理19-30
- 2.1 釣魚網(wǎng)站傳播方式19
- 2.2 常見幾類釣魚網(wǎng)站19-24
- 2.3 反釣魚系統(tǒng)改進(jìn)思路24
- 2.4 聚類中心的獲取24-26
- 2.4.1 K-Means算法25
- 2.4.2 基于模擬退火算法的K-Means算法25-26
- 2.5 SVM算法26-29
- 2.5.1 SVM算法簡介26
- 2.5.2 SVM工作的核心思路26-29
- 2.6 本章小結(jié)29-30
- 第3章 新型釣魚網(wǎng)站識別模塊設(shè)計30-42
- 3.1 目標(biāo)網(wǎng)站的獲取及內(nèi)容處理30-33
- 3.2 計算網(wǎng)頁之間的相似度33-35
- 3.3 網(wǎng)站特征提取35-38
- 3.4 K-Means與SVM相結(jié)合38-40
- 3.5 基于模擬退火的K-Means40-41
- 3.6 本章小結(jié)41-42
- 第4章 系統(tǒng)設(shè)計42-51
- 4.1 系統(tǒng)結(jié)構(gòu)42-49
- 4.1.1 URL黑名單匹配模塊42-43
- 4.1.2 樣本及特征收集模塊43-45
- 4.1.3 保存文本過程中網(wǎng)頁編碼轉(zhuǎn)換45
- 4.1.4 聚類及分組模塊45-46
- 4.1.5 計算域名相似度46-47
- 4.1.6 計算灰度相似度47-48
- 4.1.7 SVM模塊48
- 4.1.8 系統(tǒng)完整工作流程48-49
- 4.2 縮放特征49-50
- 4.3 特征選擇50
- 4.4 本章小結(jié)50-51
- 第5章 實驗結(jié)果及分析51-55
- 5.1 實驗條件51
- 5.2 實驗結(jié)果51-53
- 5.3 實驗結(jié)果分析53-54
- 5.4 本章小結(jié)54-55
- 結(jié)論55-56
- 致謝56-57
- 參考文獻(xiàn)57-61
- 攻讀碩士學(xué)位期間發(fā)表的論文及科研成果61
【相似文獻(xiàn)】
中國期刊全文數(shù)據(jù)庫 前10條
1 賈敬華;;整治釣魚網(wǎng)站還需從長計議[J];互聯(lián)網(wǎng)天地;2010年10期
2 ;“假蘋果”、“假賭博”釣魚網(wǎng)站肆虐[J];電腦愛好者;2010年23期
3 程科;;新型電信詐騙:“釣魚網(wǎng)站”初探[J];中國公共安全(學(xué)術(shù)版);2011年03期
4 周耀鵬;;淺談釣魚網(wǎng)站的技術(shù)原理及防護(hù)[J];黑龍江科技信息;2011年29期
5 ;四招輕松識破假冒釣魚網(wǎng)站[J];計算機(jī)與網(wǎng)絡(luò);2011年02期
6 李倩;;釣魚網(wǎng)站技術(shù)與防護(hù)[J];硅谷;2012年01期
7 李群;;反釣魚聯(lián)盟累計處理釣魚網(wǎng)站7萬個,呈三大特點[J];網(wǎng)絡(luò)與信息;2012年02期
8 ;今年上半年我國共處理13923個釣魚網(wǎng)站[J];金融科技時代;2012年08期
9 ;識破釣魚網(wǎng)站避免上當(dāng)?shù)膸讉方法[J];計算機(jī)與網(wǎng)絡(luò);2013年01期
10 ;警惕無孔不入的釣魚網(wǎng)站[J];微電腦世界;2013年07期
中國重要會議論文全文數(shù)據(jù)庫 前1條
1 李晨;陳星霖;;一種多階段控制方法在對抗釣魚攻擊中的應(yīng)用[A];第26次全國計算機(jī)安全學(xué)術(shù)交流會論文集[C];2011年
中國重要報紙全文數(shù)據(jù)庫 前10條
1 方輝;釣魚網(wǎng)站為何泛濫[N];人民郵電;2010年
2 記者 程武;支付交易類釣魚網(wǎng)站激增[N];中華工商時報;2010年
3 喬銳;三季度釣魚網(wǎng)站數(shù)量急劇增多[N];人民郵電;2010年
4 本報記者 周靜;釣魚網(wǎng)站半年釣走120億 亞運門票銷售被盯上[N];通信信息報;2010年
5 記者 李雪昆;10月釣魚網(wǎng)站數(shù)量同比增八成[N];中國新聞出版報;2010年
6 本報記者 陳鄧新;釣魚網(wǎng)站量產(chǎn)的秘密[N];電腦報;2010年
7 本報記者 杜峰;釣魚網(wǎng)站借“月餅”偷網(wǎng)銀 誰為網(wǎng)購添加安全鎖?[N];通信信息報;2011年
8 本報記者 李藝玲;節(jié)前釣魚網(wǎng)站頻頻放餌 消費者網(wǎng)上購票謹(jǐn)防被騙[N];通信信息報;2011年
9 雷文君;釣魚網(wǎng)站手段花樣不斷翻新[N];人民郵電;2011年
10 本報記者 趙海霞;微博釣魚網(wǎng)站玩“潛伏” 用戶小心提防勿上鉤[N];通信信息報;2011年
中國碩士學(xué)位論文全文數(shù)據(jù)庫 前10條
1 程思宇;客戶端釣魚網(wǎng)站智能檢測系統(tǒng)的設(shè)計與實現(xiàn)[D];華北電力大學(xué);2015年
2 殷蘭芳;融合網(wǎng)頁噪聲和n-gram的釣魚網(wǎng)站檢測研究[D];中南林業(yè)科技大學(xué);2015年
3 趙加林;基于K-Means和SVM的釣魚網(wǎng)站識別的研究[D];西南交通大學(xué);2016年
4 劉昂;基于文本匹配的釣魚網(wǎng)站檢測系統(tǒng)的設(shè)計和實現(xiàn)[D];北京郵電大學(xué);2013年
5 初一;基于Web頁面特征的反釣魚系統(tǒng)的設(shè)計與實現(xiàn)[D];北京郵電大學(xué);2014年
6 馬亞燕;基于專家知識庫的反釣魚系統(tǒng)的設(shè)計與實現(xiàn)[D];北京郵電大學(xué);2014年
7 朱百祿;基于Web社區(qū)的釣魚網(wǎng)站檢測研究[D];天津理工大學(xué);2013年
8 譚光林;反釣魚系統(tǒng)的研究與設(shè)計[D];北京郵電大學(xué);2013年
9 楊明星;基于登錄頁面及Logo圖標(biāo)檢測的反釣魚方案[D];太原理工大學(xué);2015年
10 李濤賢;基于最近鄰及相似度測量檢測釣魚網(wǎng)頁技術(shù)的研究[D];南京郵電大學(xué);2012年
,本文編號:561371
本文鏈接:http://sikaile.net/guanlilunwen/ydhl/561371.html