天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

基于深度學(xué)習(xí)的釣魚網(wǎng)頁識別研究

發(fā)布時間:2020-04-09 02:29
【摘要】:隨著網(wǎng)絡(luò)和計(jì)算機(jī)的普及,網(wǎng)絡(luò)安全問題也隨之出現(xiàn),釣魚網(wǎng)頁的識別則是網(wǎng)絡(luò)安全中急需解決的難題。目前主流的釣魚網(wǎng)頁識別方法通常有四種:黑名單方法,啟發(fā)式方法,圖像識別方法,機(jī)器學(xué)習(xí)方法,每一種都有明顯的缺點(diǎn)。黑名單方法,啟發(fā)式方法,圖像識別方法因?yàn)獒烎~網(wǎng)頁的更新速度快,特征求不及更新,漏判率較高。機(jī)器學(xué)習(xí)方法通常為淺層學(xué)習(xí),對復(fù)雜分類問題泛化能力弱,所以誤判率較高。通過研究發(fā)現(xiàn),深度學(xué)習(xí)可以有效的解決上述的問題。在比較各種深度學(xué)習(xí)模型框架后,采用了自動編碼器模型作為識別釣魚網(wǎng)頁的模型框架。它是一個簡單的3層網(wǎng)絡(luò)模型,分為編碼層,隱藏層,解碼層,特征經(jīng)過編碼與解碼后能夠獲得更本質(zhì)的表達(dá)。本文的識別方法首先通過對網(wǎng)頁URL和網(wǎng)頁源代碼分析,把特征分為URL文本特征,DNS特征,WHOIS特征,排名特征和頁面內(nèi)容特征5大類,通過抽取每一個類別中的特征組成一個52維的特征向量,對有缺失的特征進(jìn)行特征填充。之后把已構(gòu)造好的特征向量作為自動編碼器的輸入。目前在使用深度學(xué)習(xí)模型時,超參數(shù)的調(diào)節(jié)主要有手動法、網(wǎng)格搜索、隨機(jī)搜索三種方法,每一種方法都有很多的缺點(diǎn),本文提出了一種基于節(jié)點(diǎn)權(quán)重相關(guān)性的自適應(yīng)隱藏層節(jié)點(diǎn)數(shù)優(yōu)化算法,通過引入相關(guān)系數(shù)理論來自動調(diào)節(jié)隱藏層的節(jié)點(diǎn)數(shù),使得當(dāng)前層的節(jié)點(diǎn)數(shù)量最優(yōu)。為了證明算法的正確性,本文采用三種數(shù)據(jù)集,對六種性能進(jìn)行分析,分別為準(zhǔn)確率,召回率,假正率,假負(fù)率,真正率,真負(fù)率,證明了算法的有效性。之后再對最優(yōu)網(wǎng)絡(luò)結(jié)構(gòu)的自動編碼器的分類結(jié)果進(jìn)行了集成學(xué)習(xí),對有缺失值的樣本特征采用了一種改進(jìn)的加權(quán)投票法,進(jìn)一步提高了結(jié)果的準(zhǔn)確率。最后使用最優(yōu)結(jié)構(gòu)自動編碼器與傳統(tǒng)機(jī)器學(xué)習(xí)方法中的支持向量機(jī)算法,樸素貝葉斯算法進(jìn)行比較,結(jié)果證明了自動編碼器的有效性。之后對輸入的特征向量分別采用三種歸一化改進(jìn),進(jìn)一步提高了識別性能。
【圖文】:

模型圖,模型圖,波爾茲曼機(jī),手寫字符


西安科技大學(xué)碩士學(xué)位論文構(gòu)得到輸出特征,在重構(gòu)過程中,通過編碼與解碼獲得輸入特征的本質(zhì)表示。在下節(jié)將具體解釋。波爾茲曼機(jī)是一種雙層的神經(jīng)網(wǎng)絡(luò),由 G.E.Hinton 等人提出,是通過學(xué)習(xí)數(shù)據(jù)固有內(nèi)在表示、解決復(fù)雜學(xué)習(xí)問題最早的人工神經(jīng)網(wǎng)絡(luò)之一,之后由 Hinton 擴(kuò)展去掉了玻爾茲曼機(jī)同層之間的連接,大大提高了學(xué)習(xí)效率,具體的模型結(jié)構(gòu)已在上節(jié)展示過。卷積神經(jīng)網(wǎng)絡(luò)(CNN)最早是由 IeCun 等人在 1998 年提出,用于手寫字符圖像的識別,其網(wǎng)絡(luò)結(jié)構(gòu)如圖 2.3 所示。

模型圖,循環(huán)神經(jīng)網(wǎng)絡(luò),模型圖


圖 2.3 卷積神經(jīng)網(wǎng)絡(luò)模型圖為高級的神經(jīng)網(wǎng)絡(luò),它與傳統(tǒng)的神經(jīng)網(wǎng)絡(luò)仿人腦對信號處理上的分級加入了特征學(xué)輸入的特征主要是二維數(shù)據(jù),主要優(yōu)點(diǎn)有,,使得在圖像識別中能夠更加準(zhǔn)確;②圖變換不會對圖像信息造成損失,而是非常網(wǎng)絡(luò)上的改進(jìn),它主要處理具有時間序列時間戳直接作用到自身,通常應(yīng)用于自然體的網(wǎng)絡(luò)結(jié)構(gòu)如圖 2.4 所示。
【學(xué)位授予單位】:西安科技大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2018
【分類號】:TP18;TP393.08

【參考文獻(xiàn)】

相關(guān)期刊論文 前10條

1 潘廣源;柴偉;喬俊飛;;DBN網(wǎng)絡(luò)的深度確定方法[J];控制與決策;2015年02期

2 王偉平;張兵;;支持頁面特征偽造識別的釣魚網(wǎng)頁檢測方法[J];山東大學(xué)學(xué)報(理學(xué)版);2014年09期

3 孫勁光;蔣金葉;孟祥福;李秀娟;;深度置信網(wǎng)絡(luò)在垃圾郵件過濾中的應(yīng)用[J];計(jì)算機(jī)應(yīng)用;2014年04期

4 宋明秋;曹曉蕓;;基于敏感特征的網(wǎng)絡(luò)釣魚網(wǎng)站檢測方法[J];大連理工大學(xué)學(xué)報;2013年06期

5 崔建明;劉建明;廖周宇;;基于SVM算法的文本分類技術(shù)研究[J];計(jì)算機(jī)仿真;2013年02期

6 孫志軍;薛磊;許陽明;王正;;深度學(xué)習(xí)研究綜述[J];計(jì)算機(jī)應(yīng)用研究;2012年08期

7 丁華福;柴琳;;基于Bagging算法和遺傳BP神經(jīng)網(wǎng)絡(luò)的負(fù)荷預(yù)測[J];計(jì)算機(jī)技術(shù)與發(fā)展;2011年05期

8 劉慶和;梁正友;;一種基于信息增益的特征優(yōu)化選擇方法[J];計(jì)算機(jī)工程與應(yīng)用;2011年12期

9 張衛(wèi)豐;周毓明;許蕾;徐寶文;;基于匈牙利匹配算法的釣魚網(wǎng)頁檢測方法[J];計(jì)算機(jī)學(xué)報;2010年10期

10 孫立偉;何國輝;吳禮發(fā);;網(wǎng)絡(luò)爬蟲技術(shù)的研究[J];電腦知識與技術(shù);2010年15期

相關(guān)博士學(xué)位論文 前3條

1 嚴(yán)遠(yuǎn)亭;不完整數(shù)據(jù)集的多視角集成分類研究[D];安徽大學(xué);2016年

2 沙泓州;面向大規(guī)模網(wǎng)絡(luò)流量的URL實(shí)時分類關(guān)鍵技術(shù)研究[D];北京郵電大學(xué);2015年

3 陳宇;基于深度置信網(wǎng)絡(luò)的中文信息抽取方法[D];哈爾濱工業(yè)大學(xué);2014年

相關(guān)碩士學(xué)位論文 前6條

1 邢盼盼;基于Bagging的兩階段特征選擇集成分類器研究[D];鄭州大學(xué);2017年

2 馬亨;基于相關(guān)性分析的自動編碼器結(jié)構(gòu)優(yōu)化研究[D];蘭州大學(xué);2017年

3 孟令恒;自動編碼器相關(guān)理論研究與應(yīng)用[D];中國礦業(yè)大學(xué);2017年

4 吳海燕;基于自動編碼器的半監(jiān)督表示學(xué)習(xí)與分類學(xué)習(xí)研究[D];重慶大學(xué);2015年

5 沈尚方;釣魚網(wǎng)頁的深度學(xué)習(xí)智能檢測方法研究[D];華北電力大學(xué);2012年

6 王國才;樸素貝葉斯分類器的研究與應(yīng)用[D];重慶交通大學(xué);2010年



本文編號:2620162

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/guanlilunwen/ydhl/2620162.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶b86cb***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com