基于圖像語(yǔ)義理解的惡意網(wǎng)頁(yè)識(shí)別方法研究
發(fā)布時(shí)間:2021-07-13 13:07
信息安全與用戶財(cái)產(chǎn)以及個(gè)人利益息息相關(guān),為防止用戶誤入惡意網(wǎng)頁(yè)蒙受財(cái)產(chǎn)的損失,如何高速有效的鑒別網(wǎng)頁(yè)的實(shí)際內(nèi)容,成為時(shí)下研究的熱點(diǎn)。然而隨著當(dāng)今信息產(chǎn)業(yè)的高速發(fā)展,信息傳輸速率得到了極大的提升,惡意網(wǎng)頁(yè)從過(guò)去以文字作為主要的信息載體,逐漸過(guò)渡到圖像與文字相結(jié)合的模式。特別在賭博、色情、詐騙等網(wǎng)頁(yè)中,充斥著大量有害的圖片信息。假使可以有效地提取這些圖像特征,將有助于提高惡意網(wǎng)頁(yè)的識(shí)別率。因此,本文通過(guò)提取網(wǎng)頁(yè)圖像的特征語(yǔ)義,結(jié)合網(wǎng)頁(yè)文本特征以改善惡意網(wǎng)頁(yè)的識(shí)別效果。論文開(kāi)展的主要工作如下:(1)為有效的提取惡意網(wǎng)頁(yè)中的圖像信息,本文采用深度學(xué)習(xí)方法對(duì)圖像進(jìn)行識(shí)別,旨在提取圖像信息輔助惡意網(wǎng)頁(yè)檢測(cè)。通過(guò)總結(jié)常用深度學(xué)習(xí)算法的優(yōu)缺點(diǎn)設(shè)計(jì)對(duì)比實(shí)驗(yàn),結(jié)合惡意網(wǎng)頁(yè)的實(shí)際檢測(cè)環(huán)境進(jìn)行算法選型。同時(shí)針對(duì)MASK R-CNN中存在計(jì)算冗余現(xiàn)象,改善MASK R-CNN的網(wǎng)絡(luò)結(jié)構(gòu),提升檢測(cè)效率。(2)由于靜態(tài)圖像中可以表達(dá)的信息量較少,特別是姿態(tài)信息因表達(dá)不詳盡易產(chǎn)生歧義性,因此本文采用語(yǔ)義分割和Kinect模板匹配法相結(jié)合的方法對(duì)目標(biāo)姿態(tài)的語(yǔ)義進(jìn)行預(yù)測(cè),通過(guò)識(shí)別人體的基本姿態(tài),再結(jié)合圖像中的物體上下文信...
【文章來(lái)源】:南昌航空大學(xué)江西省
【文章頁(yè)數(shù)】:62 頁(yè)
【學(xué)位級(jí)別】:碩士
【部分圖文】:
018年1至6月全球惡意網(wǎng)址地域分布
圖 1-2 2018 年 1 至 6 月詐騙網(wǎng)站類(lèi)型比例出[2]:在現(xiàn)有的惡意網(wǎng)頁(yè)類(lèi)型分布中,如圖 1-情網(wǎng)頁(yè),占 30.37%;其次為賭博和釣魚(yú)欺詐類(lèi).78%。令人注意的是,相較于 2017 上半年,惡于 2018 年初虛擬貨幣的價(jià)格屢創(chuàng)新高,在暴利中注入惡意腳本,進(jìn)行“挖礦”操作非法獲利8 年新建立的惡意網(wǎng)站很少以單獨(dú)類(lèi)型出現(xiàn),單、導(dǎo)航三合一的綜合內(nèi)容,危害更為嚴(yán)重。產(chǎn)業(yè)的發(fā)展,以及云計(jì)算安全系統(tǒng)性能的提升了改進(jìn)。例如部分惡意網(wǎng)頁(yè)可以檢測(cè)到網(wǎng)頁(yè)的定為普通用戶時(shí),則會(huì)將用戶引導(dǎo)至惡意網(wǎng)頁(yè)的腳本爬蟲(chóng)時(shí),則會(huì)將腳本引入到正規(guī)網(wǎng)址,。此外還有部分惡意網(wǎng)頁(yè)利用多段設(shè)置的方法站,當(dāng)用戶在釣魚(yú)網(wǎng)站輸入自身的賬戶信息后
并取得顯著的成功。惡意網(wǎng)頁(yè)的主要防御手段有:基于網(wǎng)頁(yè)域名的網(wǎng)頁(yè)識(shí)別基于文字內(nèi)容的網(wǎng)頁(yè)識(shí)別、基于視覺(jué)相似性的網(wǎng)頁(yè)識(shí)別和基于機(jī)器學(xué)習(xí)的網(wǎng)識(shí)別四種。2.3.1 基于網(wǎng)頁(yè)域名的網(wǎng)頁(yè)識(shí)別由于網(wǎng)頁(yè)無(wú)論是正規(guī)網(wǎng)頁(yè)還是惡意網(wǎng)頁(yè),都有其唯一的統(tǒng)一資源定位(URL),因此網(wǎng)頁(yè)的 URL 具有唯一性。且訪問(wèn)網(wǎng)址的唯一方式就是通過(guò)網(wǎng)頁(yè)域名而不可被繞過(guò),因此利用這一特征可以有效地記錄惡意網(wǎng)頁(yè)。通過(guò)對(duì)惡網(wǎng)頁(yè)和可信網(wǎng)頁(yè)的記錄并建立數(shù)據(jù)庫(kù),只需調(diào)取待測(cè)網(wǎng)頁(yè)的 URL,即可快捷確地對(duì)網(wǎng)頁(yè)進(jìn)行網(wǎng)頁(yè)進(jìn)行判斷;诰W(wǎng)頁(yè)域名的網(wǎng)頁(yè)檢測(cè)方法簡(jiǎn)單快速,且入成本低,同時(shí)因?yàn)橛涗浘W(wǎng)頁(yè)為已知內(nèi)容,所以不會(huì)產(chǎn)生誤判。這些優(yōu)點(diǎn)使此類(lèi)方法被廣泛應(yīng)用于殺毒軟件和瀏覽器插件(如圖 2-2)。例如 360、瑞星小紅傘的防火墻就增設(shè)了實(shí)時(shí)更新的云黑白名單庫(kù),在獲得用戶的許可后,即將訪問(wèn)的網(wǎng)頁(yè)進(jìn)行名單的對(duì)比,若待訪問(wèn)網(wǎng)址出現(xiàn)在黑名單庫(kù)則向用戶發(fā)相應(yīng)的警告。
【參考文獻(xiàn)】:
期刊論文
[1]基于權(quán)限與敏感API的惡意程序檢測(cè)方法[J]. 盛超,魏盛娜. 電腦知識(shí)與技術(shù). 2017(33)
[2]基于決策樹(shù)的釣魚(yú)網(wǎng)頁(yè)的識(shí)別方法[J]. 魏盛娜,盛超. 電腦知識(shí)與技術(shù). 2017(33)
[3]基于隨機(jī)森林算法的用電負(fù)荷預(yù)測(cè)研究[J]. 李婉華,陳宏,郭昆,郭松榮,韓嘉民,陳羽中. 計(jì)算機(jī)工程與應(yīng)用. 2016(23)
[4]基于改進(jìn)編輯距離的字符串相似度求解算法[J]. 姜華,韓安琪,王美佳,王崢,吳雲(yún)玲. 計(jì)算機(jī)工程. 2014(01)
[5]基于SVM-RFE的釣魚(yú)網(wǎng)頁(yè)檢測(cè)方法研究[J]. 王婷,彭勇,戴忠華,伊勝偉,韓蘭勝. 華中科技大學(xué)學(xué)報(bào)(自然科學(xué)版). 2013(S2)
[6]基于視覺(jué)特征的網(wǎng)頁(yè)正文提取方法研究[J]. 安增文,徐杰鋒. 微型機(jī)與應(yīng)用. 2010(03)
[7]基于嵌套EMD的釣魚(yú)網(wǎng)頁(yè)檢測(cè)算法[J]. 曹玖新,毛波,羅軍舟,劉波. 計(jì)算機(jī)學(xué)報(bào). 2009(05)
[8]基于視覺(jué)的Web頁(yè)面分塊算法的改進(jìn)與實(shí)現(xiàn)[J]. 高樂(lè),張健,田賢忠. 計(jì)算機(jī)系統(tǒng)應(yīng)用. 2009(04)
[9]基于分塊的網(wǎng)頁(yè)信息解析器的研究與設(shè)計(jì)[J]. 于滿泉,陳鐵睿,許洪波. 計(jì)算機(jī)應(yīng)用. 2005(04)
[10]SVM-KNN分類(lèi)器——一種提高SVM分類(lèi)精度的新方法[J]. 李蓉,葉世偉,史忠植. 電子學(xué)報(bào). 2002(05)
碩士論文
[1]釣魚(yú)網(wǎng)頁(yè)聯(lián)合特征與智能檢測(cè)算法研究與實(shí)現(xiàn)[D]. 賈雪鵬.西安工業(yè)大學(xué) 2018
[2]基于深度學(xué)習(xí)的垃圾網(wǎng)頁(yè)智能檢測(cè)方法研究[D]. 聶祥謙.華北電力大學(xué)(北京) 2018
[3]基于DBN的網(wǎng)絡(luò)流量分類(lèi)的研究[D]. 白雪.內(nèi)蒙古大學(xué) 2015
[4]基于感知哈希算法的商標(biāo)圖像的檢索[D]. 安坤.浙江理工大學(xué) 2014
本文編號(hào):3282119
【文章來(lái)源】:南昌航空大學(xué)江西省
【文章頁(yè)數(shù)】:62 頁(yè)
【學(xué)位級(jí)別】:碩士
【部分圖文】:
018年1至6月全球惡意網(wǎng)址地域分布
圖 1-2 2018 年 1 至 6 月詐騙網(wǎng)站類(lèi)型比例出[2]:在現(xiàn)有的惡意網(wǎng)頁(yè)類(lèi)型分布中,如圖 1-情網(wǎng)頁(yè),占 30.37%;其次為賭博和釣魚(yú)欺詐類(lèi).78%。令人注意的是,相較于 2017 上半年,惡于 2018 年初虛擬貨幣的價(jià)格屢創(chuàng)新高,在暴利中注入惡意腳本,進(jìn)行“挖礦”操作非法獲利8 年新建立的惡意網(wǎng)站很少以單獨(dú)類(lèi)型出現(xiàn),單、導(dǎo)航三合一的綜合內(nèi)容,危害更為嚴(yán)重。產(chǎn)業(yè)的發(fā)展,以及云計(jì)算安全系統(tǒng)性能的提升了改進(jìn)。例如部分惡意網(wǎng)頁(yè)可以檢測(cè)到網(wǎng)頁(yè)的定為普通用戶時(shí),則會(huì)將用戶引導(dǎo)至惡意網(wǎng)頁(yè)的腳本爬蟲(chóng)時(shí),則會(huì)將腳本引入到正規(guī)網(wǎng)址,。此外還有部分惡意網(wǎng)頁(yè)利用多段設(shè)置的方法站,當(dāng)用戶在釣魚(yú)網(wǎng)站輸入自身的賬戶信息后
并取得顯著的成功。惡意網(wǎng)頁(yè)的主要防御手段有:基于網(wǎng)頁(yè)域名的網(wǎng)頁(yè)識(shí)別基于文字內(nèi)容的網(wǎng)頁(yè)識(shí)別、基于視覺(jué)相似性的網(wǎng)頁(yè)識(shí)別和基于機(jī)器學(xué)習(xí)的網(wǎng)識(shí)別四種。2.3.1 基于網(wǎng)頁(yè)域名的網(wǎng)頁(yè)識(shí)別由于網(wǎng)頁(yè)無(wú)論是正規(guī)網(wǎng)頁(yè)還是惡意網(wǎng)頁(yè),都有其唯一的統(tǒng)一資源定位(URL),因此網(wǎng)頁(yè)的 URL 具有唯一性。且訪問(wèn)網(wǎng)址的唯一方式就是通過(guò)網(wǎng)頁(yè)域名而不可被繞過(guò),因此利用這一特征可以有效地記錄惡意網(wǎng)頁(yè)。通過(guò)對(duì)惡網(wǎng)頁(yè)和可信網(wǎng)頁(yè)的記錄并建立數(shù)據(jù)庫(kù),只需調(diào)取待測(cè)網(wǎng)頁(yè)的 URL,即可快捷確地對(duì)網(wǎng)頁(yè)進(jìn)行網(wǎng)頁(yè)進(jìn)行判斷;诰W(wǎng)頁(yè)域名的網(wǎng)頁(yè)檢測(cè)方法簡(jiǎn)單快速,且入成本低,同時(shí)因?yàn)橛涗浘W(wǎng)頁(yè)為已知內(nèi)容,所以不會(huì)產(chǎn)生誤判。這些優(yōu)點(diǎn)使此類(lèi)方法被廣泛應(yīng)用于殺毒軟件和瀏覽器插件(如圖 2-2)。例如 360、瑞星小紅傘的防火墻就增設(shè)了實(shí)時(shí)更新的云黑白名單庫(kù),在獲得用戶的許可后,即將訪問(wèn)的網(wǎng)頁(yè)進(jìn)行名單的對(duì)比,若待訪問(wèn)網(wǎng)址出現(xiàn)在黑名單庫(kù)則向用戶發(fā)相應(yīng)的警告。
【參考文獻(xiàn)】:
期刊論文
[1]基于權(quán)限與敏感API的惡意程序檢測(cè)方法[J]. 盛超,魏盛娜. 電腦知識(shí)與技術(shù). 2017(33)
[2]基于決策樹(shù)的釣魚(yú)網(wǎng)頁(yè)的識(shí)別方法[J]. 魏盛娜,盛超. 電腦知識(shí)與技術(shù). 2017(33)
[3]基于隨機(jī)森林算法的用電負(fù)荷預(yù)測(cè)研究[J]. 李婉華,陳宏,郭昆,郭松榮,韓嘉民,陳羽中. 計(jì)算機(jī)工程與應(yīng)用. 2016(23)
[4]基于改進(jìn)編輯距離的字符串相似度求解算法[J]. 姜華,韓安琪,王美佳,王崢,吳雲(yún)玲. 計(jì)算機(jī)工程. 2014(01)
[5]基于SVM-RFE的釣魚(yú)網(wǎng)頁(yè)檢測(cè)方法研究[J]. 王婷,彭勇,戴忠華,伊勝偉,韓蘭勝. 華中科技大學(xué)學(xué)報(bào)(自然科學(xué)版). 2013(S2)
[6]基于視覺(jué)特征的網(wǎng)頁(yè)正文提取方法研究[J]. 安增文,徐杰鋒. 微型機(jī)與應(yīng)用. 2010(03)
[7]基于嵌套EMD的釣魚(yú)網(wǎng)頁(yè)檢測(cè)算法[J]. 曹玖新,毛波,羅軍舟,劉波. 計(jì)算機(jī)學(xué)報(bào). 2009(05)
[8]基于視覺(jué)的Web頁(yè)面分塊算法的改進(jìn)與實(shí)現(xiàn)[J]. 高樂(lè),張健,田賢忠. 計(jì)算機(jī)系統(tǒng)應(yīng)用. 2009(04)
[9]基于分塊的網(wǎng)頁(yè)信息解析器的研究與設(shè)計(jì)[J]. 于滿泉,陳鐵睿,許洪波. 計(jì)算機(jī)應(yīng)用. 2005(04)
[10]SVM-KNN分類(lèi)器——一種提高SVM分類(lèi)精度的新方法[J]. 李蓉,葉世偉,史忠植. 電子學(xué)報(bào). 2002(05)
碩士論文
[1]釣魚(yú)網(wǎng)頁(yè)聯(lián)合特征與智能檢測(cè)算法研究與實(shí)現(xiàn)[D]. 賈雪鵬.西安工業(yè)大學(xué) 2018
[2]基于深度學(xué)習(xí)的垃圾網(wǎng)頁(yè)智能檢測(cè)方法研究[D]. 聶祥謙.華北電力大學(xué)(北京) 2018
[3]基于DBN的網(wǎng)絡(luò)流量分類(lèi)的研究[D]. 白雪.內(nèi)蒙古大學(xué) 2015
[4]基于感知哈希算法的商標(biāo)圖像的檢索[D]. 安坤.浙江理工大學(xué) 2014
本文編號(hào):3282119
本文鏈接:http://sikaile.net/kejilunwen/ruanjiangongchenglunwen/3282119.html
最近更新
教材專(zhuān)著