基于圖像語義理解的惡意網(wǎng)頁識別方法研究
發(fā)布時間:2021-07-13 13:07
信息安全與用戶財產(chǎn)以及個人利益息息相關(guān),為防止用戶誤入惡意網(wǎng)頁蒙受財產(chǎn)的損失,如何高速有效的鑒別網(wǎng)頁的實際內(nèi)容,成為時下研究的熱點。然而隨著當(dāng)今信息產(chǎn)業(yè)的高速發(fā)展,信息傳輸速率得到了極大的提升,惡意網(wǎng)頁從過去以文字作為主要的信息載體,逐漸過渡到圖像與文字相結(jié)合的模式。特別在賭博、色情、詐騙等網(wǎng)頁中,充斥著大量有害的圖片信息。假使可以有效地提取這些圖像特征,將有助于提高惡意網(wǎng)頁的識別率。因此,本文通過提取網(wǎng)頁圖像的特征語義,結(jié)合網(wǎng)頁文本特征以改善惡意網(wǎng)頁的識別效果。論文開展的主要工作如下:(1)為有效的提取惡意網(wǎng)頁中的圖像信息,本文采用深度學(xué)習(xí)方法對圖像進(jìn)行識別,旨在提取圖像信息輔助惡意網(wǎng)頁檢測。通過總結(jié)常用深度學(xué)習(xí)算法的優(yōu)缺點設(shè)計對比實驗,結(jié)合惡意網(wǎng)頁的實際檢測環(huán)境進(jìn)行算法選型。同時針對MASK R-CNN中存在計算冗余現(xiàn)象,改善MASK R-CNN的網(wǎng)絡(luò)結(jié)構(gòu),提升檢測效率。(2)由于靜態(tài)圖像中可以表達(dá)的信息量較少,特別是姿態(tài)信息因表達(dá)不詳盡易產(chǎn)生歧義性,因此本文采用語義分割和Kinect模板匹配法相結(jié)合的方法對目標(biāo)姿態(tài)的語義進(jìn)行預(yù)測,通過識別人體的基本姿態(tài),再結(jié)合圖像中的物體上下文信...
【文章來源】:南昌航空大學(xué)江西省
【文章頁數(shù)】:62 頁
【學(xué)位級別】:碩士
【部分圖文】:
018年1至6月全球惡意網(wǎng)址地域分布
圖 1-2 2018 年 1 至 6 月詐騙網(wǎng)站類型比例出[2]:在現(xiàn)有的惡意網(wǎng)頁類型分布中,如圖 1-情網(wǎng)頁,占 30.37%;其次為賭博和釣魚欺詐類.78%。令人注意的是,相較于 2017 上半年,惡于 2018 年初虛擬貨幣的價格屢創(chuàng)新高,在暴利中注入惡意腳本,進(jìn)行“挖礦”操作非法獲利8 年新建立的惡意網(wǎng)站很少以單獨(dú)類型出現(xiàn),單、導(dǎo)航三合一的綜合內(nèi)容,危害更為嚴(yán)重。產(chǎn)業(yè)的發(fā)展,以及云計算安全系統(tǒng)性能的提升了改進(jìn)。例如部分惡意網(wǎng)頁可以檢測到網(wǎng)頁的定為普通用戶時,則會將用戶引導(dǎo)至惡意網(wǎng)頁的腳本爬蟲時,則會將腳本引入到正規(guī)網(wǎng)址,。此外還有部分惡意網(wǎng)頁利用多段設(shè)置的方法站,當(dāng)用戶在釣魚網(wǎng)站輸入自身的賬戶信息后
并取得顯著的成功。惡意網(wǎng)頁的主要防御手段有:基于網(wǎng)頁域名的網(wǎng)頁識別基于文字內(nèi)容的網(wǎng)頁識別、基于視覺相似性的網(wǎng)頁識別和基于機(jī)器學(xué)習(xí)的網(wǎng)識別四種。2.3.1 基于網(wǎng)頁域名的網(wǎng)頁識別由于網(wǎng)頁無論是正規(guī)網(wǎng)頁還是惡意網(wǎng)頁,都有其唯一的統(tǒng)一資源定位(URL),因此網(wǎng)頁的 URL 具有唯一性。且訪問網(wǎng)址的唯一方式就是通過網(wǎng)頁域名而不可被繞過,因此利用這一特征可以有效地記錄惡意網(wǎng)頁。通過對惡網(wǎng)頁和可信網(wǎng)頁的記錄并建立數(shù)據(jù)庫,只需調(diào)取待測網(wǎng)頁的 URL,即可快捷確地對網(wǎng)頁進(jìn)行網(wǎng)頁進(jìn)行判斷;诰W(wǎng)頁域名的網(wǎng)頁檢測方法簡單快速,且入成本低,同時因為記錄網(wǎng)頁為已知內(nèi)容,所以不會產(chǎn)生誤判。這些優(yōu)點使此類方法被廣泛應(yīng)用于殺毒軟件和瀏覽器插件(如圖 2-2)。例如 360、瑞星小紅傘的防火墻就增設(shè)了實時更新的云黑白名單庫,在獲得用戶的許可后,即將訪問的網(wǎng)頁進(jìn)行名單的對比,若待訪問網(wǎng)址出現(xiàn)在黑名單庫則向用戶發(fā)相應(yīng)的警告。
【參考文獻(xiàn)】:
期刊論文
[1]基于權(quán)限與敏感API的惡意程序檢測方法[J]. 盛超,魏盛娜. 電腦知識與技術(shù). 2017(33)
[2]基于決策樹的釣魚網(wǎng)頁的識別方法[J]. 魏盛娜,盛超. 電腦知識與技術(shù). 2017(33)
[3]基于隨機(jī)森林算法的用電負(fù)荷預(yù)測研究[J]. 李婉華,陳宏,郭昆,郭松榮,韓嘉民,陳羽中. 計算機(jī)工程與應(yīng)用. 2016(23)
[4]基于改進(jìn)編輯距離的字符串相似度求解算法[J]. 姜華,韓安琪,王美佳,王崢,吳雲(yún)玲. 計算機(jī)工程. 2014(01)
[5]基于SVM-RFE的釣魚網(wǎng)頁檢測方法研究[J]. 王婷,彭勇,戴忠華,伊勝偉,韓蘭勝. 華中科技大學(xué)學(xué)報(自然科學(xué)版). 2013(S2)
[6]基于視覺特征的網(wǎng)頁正文提取方法研究[J]. 安增文,徐杰鋒. 微型機(jī)與應(yīng)用. 2010(03)
[7]基于嵌套EMD的釣魚網(wǎng)頁檢測算法[J]. 曹玖新,毛波,羅軍舟,劉波. 計算機(jī)學(xué)報. 2009(05)
[8]基于視覺的Web頁面分塊算法的改進(jìn)與實現(xiàn)[J]. 高樂,張健,田賢忠. 計算機(jī)系統(tǒng)應(yīng)用. 2009(04)
[9]基于分塊的網(wǎng)頁信息解析器的研究與設(shè)計[J]. 于滿泉,陳鐵睿,許洪波. 計算機(jī)應(yīng)用. 2005(04)
[10]SVM-KNN分類器——一種提高SVM分類精度的新方法[J]. 李蓉,葉世偉,史忠植. 電子學(xué)報. 2002(05)
碩士論文
[1]釣魚網(wǎng)頁聯(lián)合特征與智能檢測算法研究與實現(xiàn)[D]. 賈雪鵬.西安工業(yè)大學(xué) 2018
[2]基于深度學(xué)習(xí)的垃圾網(wǎng)頁智能檢測方法研究[D]. 聶祥謙.華北電力大學(xué)(北京) 2018
[3]基于DBN的網(wǎng)絡(luò)流量分類的研究[D]. 白雪.內(nèi)蒙古大學(xué) 2015
[4]基于感知哈希算法的商標(biāo)圖像的檢索[D]. 安坤.浙江理工大學(xué) 2014
本文編號:3282119
【文章來源】:南昌航空大學(xué)江西省
【文章頁數(shù)】:62 頁
【學(xué)位級別】:碩士
【部分圖文】:
018年1至6月全球惡意網(wǎng)址地域分布
圖 1-2 2018 年 1 至 6 月詐騙網(wǎng)站類型比例出[2]:在現(xiàn)有的惡意網(wǎng)頁類型分布中,如圖 1-情網(wǎng)頁,占 30.37%;其次為賭博和釣魚欺詐類.78%。令人注意的是,相較于 2017 上半年,惡于 2018 年初虛擬貨幣的價格屢創(chuàng)新高,在暴利中注入惡意腳本,進(jìn)行“挖礦”操作非法獲利8 年新建立的惡意網(wǎng)站很少以單獨(dú)類型出現(xiàn),單、導(dǎo)航三合一的綜合內(nèi)容,危害更為嚴(yán)重。產(chǎn)業(yè)的發(fā)展,以及云計算安全系統(tǒng)性能的提升了改進(jìn)。例如部分惡意網(wǎng)頁可以檢測到網(wǎng)頁的定為普通用戶時,則會將用戶引導(dǎo)至惡意網(wǎng)頁的腳本爬蟲時,則會將腳本引入到正規(guī)網(wǎng)址,。此外還有部分惡意網(wǎng)頁利用多段設(shè)置的方法站,當(dāng)用戶在釣魚網(wǎng)站輸入自身的賬戶信息后
并取得顯著的成功。惡意網(wǎng)頁的主要防御手段有:基于網(wǎng)頁域名的網(wǎng)頁識別基于文字內(nèi)容的網(wǎng)頁識別、基于視覺相似性的網(wǎng)頁識別和基于機(jī)器學(xué)習(xí)的網(wǎng)識別四種。2.3.1 基于網(wǎng)頁域名的網(wǎng)頁識別由于網(wǎng)頁無論是正規(guī)網(wǎng)頁還是惡意網(wǎng)頁,都有其唯一的統(tǒng)一資源定位(URL),因此網(wǎng)頁的 URL 具有唯一性。且訪問網(wǎng)址的唯一方式就是通過網(wǎng)頁域名而不可被繞過,因此利用這一特征可以有效地記錄惡意網(wǎng)頁。通過對惡網(wǎng)頁和可信網(wǎng)頁的記錄并建立數(shù)據(jù)庫,只需調(diào)取待測網(wǎng)頁的 URL,即可快捷確地對網(wǎng)頁進(jìn)行網(wǎng)頁進(jìn)行判斷;诰W(wǎng)頁域名的網(wǎng)頁檢測方法簡單快速,且入成本低,同時因為記錄網(wǎng)頁為已知內(nèi)容,所以不會產(chǎn)生誤判。這些優(yōu)點使此類方法被廣泛應(yīng)用于殺毒軟件和瀏覽器插件(如圖 2-2)。例如 360、瑞星小紅傘的防火墻就增設(shè)了實時更新的云黑白名單庫,在獲得用戶的許可后,即將訪問的網(wǎng)頁進(jìn)行名單的對比,若待訪問網(wǎng)址出現(xiàn)在黑名單庫則向用戶發(fā)相應(yīng)的警告。
【參考文獻(xiàn)】:
期刊論文
[1]基于權(quán)限與敏感API的惡意程序檢測方法[J]. 盛超,魏盛娜. 電腦知識與技術(shù). 2017(33)
[2]基于決策樹的釣魚網(wǎng)頁的識別方法[J]. 魏盛娜,盛超. 電腦知識與技術(shù). 2017(33)
[3]基于隨機(jī)森林算法的用電負(fù)荷預(yù)測研究[J]. 李婉華,陳宏,郭昆,郭松榮,韓嘉民,陳羽中. 計算機(jī)工程與應(yīng)用. 2016(23)
[4]基于改進(jìn)編輯距離的字符串相似度求解算法[J]. 姜華,韓安琪,王美佳,王崢,吳雲(yún)玲. 計算機(jī)工程. 2014(01)
[5]基于SVM-RFE的釣魚網(wǎng)頁檢測方法研究[J]. 王婷,彭勇,戴忠華,伊勝偉,韓蘭勝. 華中科技大學(xué)學(xué)報(自然科學(xué)版). 2013(S2)
[6]基于視覺特征的網(wǎng)頁正文提取方法研究[J]. 安增文,徐杰鋒. 微型機(jī)與應(yīng)用. 2010(03)
[7]基于嵌套EMD的釣魚網(wǎng)頁檢測算法[J]. 曹玖新,毛波,羅軍舟,劉波. 計算機(jī)學(xué)報. 2009(05)
[8]基于視覺的Web頁面分塊算法的改進(jìn)與實現(xiàn)[J]. 高樂,張健,田賢忠. 計算機(jī)系統(tǒng)應(yīng)用. 2009(04)
[9]基于分塊的網(wǎng)頁信息解析器的研究與設(shè)計[J]. 于滿泉,陳鐵睿,許洪波. 計算機(jī)應(yīng)用. 2005(04)
[10]SVM-KNN分類器——一種提高SVM分類精度的新方法[J]. 李蓉,葉世偉,史忠植. 電子學(xué)報. 2002(05)
碩士論文
[1]釣魚網(wǎng)頁聯(lián)合特征與智能檢測算法研究與實現(xiàn)[D]. 賈雪鵬.西安工業(yè)大學(xué) 2018
[2]基于深度學(xué)習(xí)的垃圾網(wǎng)頁智能檢測方法研究[D]. 聶祥謙.華北電力大學(xué)(北京) 2018
[3]基于DBN的網(wǎng)絡(luò)流量分類的研究[D]. 白雪.內(nèi)蒙古大學(xué) 2015
[4]基于感知哈希算法的商標(biāo)圖像的檢索[D]. 安坤.浙江理工大學(xué) 2014
本文編號:3282119
本文鏈接:http://sikaile.net/kejilunwen/ruanjiangongchenglunwen/3282119.html
最近更新
教材專著