天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

基于K-Means和SVM的釣魚網(wǎng)站識別的研究

發(fā)布時(shí)間:2017-07-19 05:16

  本文關(guān)鍵詞:基于K-Means和SVM的釣魚網(wǎng)站識別的研究


  更多相關(guān)文章: K-Means算法 SVM 釣魚網(wǎng)站 分類


【摘要】:傳統(tǒng)的單純基于URL黑名單識別方式在今天海量的釣魚網(wǎng)站面前以顯得力不從心,必須配合其他識別方式才能很好地工作。隨后出現(xiàn)了許多新的識別方法,比如基于網(wǎng)頁結(jié)構(gòu)的識別方法,但是語言表達(dá)方式的多樣性使得此種方法相當(dāng)不可靠,幾乎不可用。而基于圖像識別的釣魚網(wǎng)站識別方式衍生出多種識別方法,但是受制于圖像識別本身的缺陷,其在識別時(shí)需要做到精確匹配,那么就要求釣魚網(wǎng)站和被模仿的網(wǎng)站完全相似。因此對一大部分假冒購物網(wǎng)站就不能做到很好的識別,且工作時(shí)速度很慢;跇闼刎惾~斯的識別方法由于原理的限制使得工作時(shí)的效果不穩(wěn)定,因此我們在這里探究新的使用K-Means與SVM相結(jié)合的算法,利用K-Means的優(yōu)點(diǎn),在識別網(wǎng)站之前對其進(jìn)行一個(gè)分組,如果待識別網(wǎng)站是容易被模仿的釣魚網(wǎng)站類型,那么就使用對應(yīng)組別的特征參數(shù)對其進(jìn)行識別即可。同時(shí)結(jié)合傳統(tǒng)的URL黑名單機(jī)制和網(wǎng)頁灰度匹配模塊,這樣就可以避免將新建立的部分合法網(wǎng)站錯(cuò)誤識別為釣魚網(wǎng)站。而要完成此種識別方式,總共完成了四部分的工作,即:一是流行樣本庫,專門收集當(dāng)季典型流行釣魚網(wǎng)站,于此同時(shí)獲取網(wǎng)頁有效內(nèi)容并對其進(jìn)行分詞、刪除停用詞等操作并且分析總結(jié)出網(wǎng)站的一系列典型特征;二是對獲取到的網(wǎng)頁進(jìn)行分組,并使用分析得到的特征建立樣本模板;三是分組完畢后使用SVM分類算法對特征進(jìn)行選取,獲取有效的特征;四是在訪問目標(biāo)鏈接時(shí)實(shí)時(shí)收集目標(biāo)網(wǎng)站的各個(gè)特征,然后使用SVM算法對其計(jì)算信譽(yù)度。通過這四部分的工作組成了釣魚網(wǎng)站識別的完整流程。
【關(guān)鍵詞】:K-Means算法 SVM 釣魚網(wǎng)站 分類
【學(xué)位授予單位】:西南交通大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2016
【分類號】:TP393.092
【目錄】:
  • 摘要6-7
  • Abstract7-10
  • 第1章 緒論10-19
  • 1.1 研究意義10-13
  • 1.2 國內(nèi)外反釣魚機(jī)構(gòu)現(xiàn)狀13-15
  • 1.3 反釣魚技術(shù)的研究現(xiàn)狀15-17
  • 1.4 本論文主要研究內(nèi)容17
  • 1.5 本文組織結(jié)構(gòu)17-19
  • 第2章 釣魚網(wǎng)站特征分析及檢測原理19-30
  • 2.1 釣魚網(wǎng)站傳播方式19
  • 2.2 常見幾類釣魚網(wǎng)站19-24
  • 2.3 反釣魚系統(tǒng)改進(jìn)思路24
  • 2.4 聚類中心的獲取24-26
  • 2.4.1 K-Means算法25
  • 2.4.2 基于模擬退火算法的K-Means算法25-26
  • 2.5 SVM算法26-29
  • 2.5.1 SVM算法簡介26
  • 2.5.2 SVM工作的核心思路26-29
  • 2.6 本章小結(jié)29-30
  • 第3章 新型釣魚網(wǎng)站識別模塊設(shè)計(jì)30-42
  • 3.1 目標(biāo)網(wǎng)站的獲取及內(nèi)容處理30-33
  • 3.2 計(jì)算網(wǎng)頁之間的相似度33-35
  • 3.3 網(wǎng)站特征提取35-38
  • 3.4 K-Means與SVM相結(jié)合38-40
  • 3.5 基于模擬退火的K-Means40-41
  • 3.6 本章小結(jié)41-42
  • 第4章 系統(tǒng)設(shè)計(jì)42-51
  • 4.1 系統(tǒng)結(jié)構(gòu)42-49
  • 4.1.1 URL黑名單匹配模塊42-43
  • 4.1.2 樣本及特征收集模塊43-45
  • 4.1.3 保存文本過程中網(wǎng)頁編碼轉(zhuǎn)換45
  • 4.1.4 聚類及分組模塊45-46
  • 4.1.5 計(jì)算域名相似度46-47
  • 4.1.6 計(jì)算灰度相似度47-48
  • 4.1.7 SVM模塊48
  • 4.1.8 系統(tǒng)完整工作流程48-49
  • 4.2 縮放特征49-50
  • 4.3 特征選擇50
  • 4.4 本章小結(jié)50-51
  • 第5章 實(shí)驗(yàn)結(jié)果及分析51-55
  • 5.1 實(shí)驗(yàn)條件51
  • 5.2 實(shí)驗(yàn)結(jié)果51-53
  • 5.3 實(shí)驗(yàn)結(jié)果分析53-54
  • 5.4 本章小結(jié)54-55
  • 結(jié)論55-56
  • 致謝56-57
  • 參考文獻(xiàn)57-61
  • 攻讀碩士學(xué)位期間發(fā)表的論文及科研成果61

【相似文獻(xiàn)】

中國期刊全文數(shù)據(jù)庫 前10條

1 賈敬華;;整治釣魚網(wǎng)站還需從長計(jì)議[J];互聯(lián)網(wǎng)天地;2010年10期

2 ;“假蘋果”、“假賭博”釣魚網(wǎng)站肆虐[J];電腦愛好者;2010年23期

3 程科;;新型電信詐騙:“釣魚網(wǎng)站”初探[J];中國公共安全(學(xué)術(shù)版);2011年03期

4 周耀鵬;;淺談釣魚網(wǎng)站的技術(shù)原理及防護(hù)[J];黑龍江科技信息;2011年29期

5 ;四招輕松識破假冒釣魚網(wǎng)站[J];計(jì)算機(jī)與網(wǎng)絡(luò);2011年02期

6 李倩;;釣魚網(wǎng)站技術(shù)與防護(hù)[J];硅谷;2012年01期

7 李群;;反釣魚聯(lián)盟累計(jì)處理釣魚網(wǎng)站7萬個(gè),呈三大特點(diǎn)[J];網(wǎng)絡(luò)與信息;2012年02期

8 ;今年上半年我國共處理13923個(gè)釣魚網(wǎng)站[J];金融科技時(shí)代;2012年08期

9 ;識破釣魚網(wǎng)站避免上當(dāng)?shù)膸讉(gè)方法[J];計(jì)算機(jī)與網(wǎng)絡(luò);2013年01期

10 ;警惕無孔不入的釣魚網(wǎng)站[J];微電腦世界;2013年07期

中國重要會(huì)議論文全文數(shù)據(jù)庫 前1條

1 李晨;陳星霖;;一種多階段控制方法在對抗釣魚攻擊中的應(yīng)用[A];第26次全國計(jì)算機(jī)安全學(xué)術(shù)交流會(huì)論文集[C];2011年

中國重要報(bào)紙全文數(shù)據(jù)庫 前10條

1 方輝;釣魚網(wǎng)站為何泛濫[N];人民郵電;2010年

2 記者 程武;支付交易類釣魚網(wǎng)站激增[N];中華工商時(shí)報(bào);2010年

3 喬銳;三季度釣魚網(wǎng)站數(shù)量急劇增多[N];人民郵電;2010年

4 本報(bào)記者 周靜;釣魚網(wǎng)站半年釣走120億 亞運(yùn)門票銷售被盯上[N];通信信息報(bào);2010年

5 記者 李雪昆;10月釣魚網(wǎng)站數(shù)量同比增八成[N];中國新聞出版報(bào);2010年

6 本報(bào)記者 陳鄧新;釣魚網(wǎng)站量產(chǎn)的秘密[N];電腦報(bào);2010年

7 本報(bào)記者 杜峰;釣魚網(wǎng)站借“月餅”偷網(wǎng)銀 誰為網(wǎng)購添加安全鎖?[N];通信信息報(bào);2011年

8 本報(bào)記者 李藝玲;節(jié)前釣魚網(wǎng)站頻頻放餌 消費(fèi)者網(wǎng)上購票謹(jǐn)防被騙[N];通信信息報(bào);2011年

9 雷文君;釣魚網(wǎng)站手段花樣不斷翻新[N];人民郵電;2011年

10 本報(bào)記者 趙海霞;微博釣魚網(wǎng)站玩“潛伏” 用戶小心提防勿上鉤[N];通信信息報(bào);2011年

中國碩士學(xué)位論文全文數(shù)據(jù)庫 前10條

1 程思宇;客戶端釣魚網(wǎng)站智能檢測系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)[D];華北電力大學(xué);2015年

2 殷蘭芳;融合網(wǎng)頁噪聲和n-gram的釣魚網(wǎng)站檢測研究[D];中南林業(yè)科技大學(xué);2015年

3 趙加林;基于K-Means和SVM的釣魚網(wǎng)站識別的研究[D];西南交通大學(xué);2016年

4 劉昂;基于文本匹配的釣魚網(wǎng)站檢測系統(tǒng)的設(shè)計(jì)和實(shí)現(xiàn)[D];北京郵電大學(xué);2013年

5 初一;基于Web頁面特征的反釣魚系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)[D];北京郵電大學(xué);2014年

6 馬亞燕;基于專家知識庫的反釣魚系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)[D];北京郵電大學(xué);2014年

7 朱百祿;基于Web社區(qū)的釣魚網(wǎng)站檢測研究[D];天津理工大學(xué);2013年

8 譚光林;反釣魚系統(tǒng)的研究與設(shè)計(jì)[D];北京郵電大學(xué);2013年

9 楊明星;基于登錄頁面及Logo圖標(biāo)檢測的反釣魚方案[D];太原理工大學(xué);2015年

10 李濤賢;基于最近鄰及相似度測量檢測釣魚網(wǎng)頁技術(shù)的研究[D];南京郵電大學(xué);2012年



本文編號:561371

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/guanlilunwen/ydhl/561371.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶c47dd***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請E-mail郵箱bigeng88@qq.com