基于發(fā)件人身份驗(yàn)證和分類(lèi)集成的釣魚(yú)郵件檢測(cè)方法
發(fā)布時(shí)間:2020-07-04 12:35
【摘要】:近年來(lái)網(wǎng)絡(luò)發(fā)展迅猛,已成為人們?nèi)粘I钪胁豢苫蛉钡拇嬖。各種網(wǎng)絡(luò)安全隱患隨之而來(lái),出現(xiàn)了一種以商業(yè)和政治為目的的網(wǎng)絡(luò)犯罪類(lèi)型高級(jí)持續(xù)性滲透攻擊(APT),其常見(jiàn)的滲透突破方法包括網(wǎng)站掛馬、電子郵件和即時(shí)消息。釣魚(yú)郵件就是通過(guò)電子郵件進(jìn)行滲透攻擊,是非常常見(jiàn)的攻擊手段。如今又出現(xiàn)了一種新形式的釣魚(yú)郵件,即魚(yú)叉式釣魚(yú)郵件,通過(guò)偽裝成目標(biāo)的熟人進(jìn)行有針對(duì)性的釣魚(yú)。但是每個(gè)個(gè)體的性格、性別、寫(xiě)作習(xí)慣都不一樣,即使是有意的模仿,也不能做到完全相似。因此本研究使用基于發(fā)件人身份驗(yàn)證的方法實(shí)現(xiàn)對(duì)魚(yú)叉式釣魚(yú)郵件的檢測(cè)。在驗(yàn)證發(fā)件人身份過(guò)程中,需要從郵件中提取風(fēng)格特征、性別特征和性格特征,然后使用分類(lèi)器對(duì)郵件進(jìn)行分類(lèi)。但是普通釣魚(yú)郵件不具備偽裝發(fā)件人為目標(biāo)熟悉的人這一特點(diǎn),因此驗(yàn)證發(fā)件人身份并不適用于全部釣魚(yú)郵件,對(duì)于其他情況的釣魚(yú)郵件只能使用普通的檢測(cè)方法進(jìn)行檢測(cè)。本文分別單獨(dú)使用URL特征、關(guān)鍵詞特征和郵件正文特征進(jìn)行分類(lèi)構(gòu)造基分類(lèi)器,然后將結(jié)果通過(guò)投票的方式進(jìn)行集成,得到最終的檢測(cè)結(jié)果。最后,在檢測(cè)過(guò)程中提取的特征比較多,會(huì)造成過(guò)擬合現(xiàn)象的產(chǎn)生。因此在本文中,提出了一種基于密度和距離的降維方法。該方法通過(guò)計(jì)算特征之間的距離和局部密度,有效的將原始特征的維度降為簡(jiǎn)單而具有代表性的二維向量。以達(dá)到節(jié)省時(shí)間和提高準(zhǔn)確率等性能的效果。最后實(shí)驗(yàn)結(jié)果表明本文研究的基于發(fā)件人身份驗(yàn)證和分類(lèi)集成的釣魚(yú)郵件檢測(cè)方法是有效的。
【學(xué)位授予單位】:北京工業(yè)大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2018
【分類(lèi)號(hào)】:TP393.08;TP393.098
【圖文】:
通過(guò)互聯(lián)網(wǎng)應(yīng)運(yùn)而生的一系列事物,如電子商務(wù)、網(wǎng)絡(luò)銀行、在線(xiàn)教育、網(wǎng)絡(luò)社交平臺(tái)、手機(jī)支付等等已經(jīng)深入到了生活中的各個(gè)方面。人們的日常聯(lián)系不再局限于面對(duì)面交流,通過(guò)互聯(lián)網(wǎng)更容易進(jìn)行方便有效的溝通。電子郵件已經(jīng)成為人們?nèi)粘贤ㄖ胁豢扇鄙俚囊环N交流方式。在互聯(lián)網(wǎng)時(shí)代的商業(yè)領(lǐng)域,電子郵件已經(jīng)成為經(jīng)常被提及的工具。根據(jù) Radicati 最新的年度報(bào)告,電子郵件可能不會(huì)像即時(shí)消息應(yīng)用程序或社交媒體那樣快速增長(zhǎng),但電子郵件將繼續(xù)存在[1]。圖1-1 為 Radicati 年度報(bào)告 2017 年-2021 年全球郵件市場(chǎng)預(yù)測(cè)表格。從全球范圍來(lái)看,到 2017 年為止,電子郵件用戶(hù)預(yù)計(jì)達(dá)到 37 億人,到 2021 年預(yù)計(jì)增長(zhǎng) 3%,屆時(shí)電子郵件用戶(hù)將超過(guò) 41 億。預(yù)計(jì)每日平均電子郵件流量將以更快的增長(zhǎng)速度成倍增加。因?yàn)樵诖祟A(yù)測(cè)期間,企業(yè)和消費(fèi)者模式的電子郵件每年都會(huì)增長(zhǎng)4%,數(shù)量將從今年的每日平均 2690 億增長(zhǎng)到 2021 年的 3200 億,電子郵件市場(chǎng)的收入也將呈現(xiàn)強(qiáng)勢(shì)增長(zhǎng)趨勢(shì),明年預(yù)計(jì)增長(zhǎng) 22%,能夠達(dá)到近 300 億美元,并且一直持續(xù)到 2021 年都會(huì)保持兩位數(shù)的增長(zhǎng)幅度。屆時(shí),電子郵件的市場(chǎng)收入將達(dá)到近 470 億美元。
圖 1-2 釣魚(yú)郵件檢測(cè)總體模塊圖Figure1-2 Overall module map of phishing mail detection主要研究?jī)?nèi)容可以分為以下幾方面內(nèi)容:第一,通過(guò)基于寫(xiě)作風(fēng)格、性別和性格的發(fā)件人身份驗(yàn)證方法檢測(cè)魚(yú)叉件。在這個(gè)過(guò)程中,對(duì)于目前使用的發(fā)件人身份驗(yàn)證的方法進(jìn)行了深入研模塊中,根據(jù)魚(yú)叉式釣魚(yú)郵件檢測(cè)的相關(guān)文獻(xiàn),提出了能夠獲得較大檢郵件特征。將發(fā)件人身份驗(yàn)證與魚(yú)叉式釣魚(yú)郵件的檢測(cè)方式相結(jié)合,從種新的魚(yú)叉式釣魚(yú)郵件檢測(cè)方法,提高檢測(cè)效率。第二,基于分類(lèi)集成的釣魚(yú)郵件檢測(cè)方法。通過(guò)研究,找出幾種可以單郵件特征,然后利用集成學(xué)習(xí)的方法將幾種郵件特征形成的基分類(lèi)器通方式結(jié)合成為一個(gè)最終的分類(lèi)器。利用上述兩種方法的結(jié)合,可以將各件全面的檢測(cè)出來(lái)。第三,基于密度和距離的降維處理方法。通過(guò)研究目前存在的降維方法此基礎(chǔ)上提出一種基于新特征的特征提取方法的降維處理算法。以達(dá)到效率的目的。
本文編號(hào):2741135
【學(xué)位授予單位】:北京工業(yè)大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2018
【分類(lèi)號(hào)】:TP393.08;TP393.098
【圖文】:
通過(guò)互聯(lián)網(wǎng)應(yīng)運(yùn)而生的一系列事物,如電子商務(wù)、網(wǎng)絡(luò)銀行、在線(xiàn)教育、網(wǎng)絡(luò)社交平臺(tái)、手機(jī)支付等等已經(jīng)深入到了生活中的各個(gè)方面。人們的日常聯(lián)系不再局限于面對(duì)面交流,通過(guò)互聯(lián)網(wǎng)更容易進(jìn)行方便有效的溝通。電子郵件已經(jīng)成為人們?nèi)粘贤ㄖ胁豢扇鄙俚囊环N交流方式。在互聯(lián)網(wǎng)時(shí)代的商業(yè)領(lǐng)域,電子郵件已經(jīng)成為經(jīng)常被提及的工具。根據(jù) Radicati 最新的年度報(bào)告,電子郵件可能不會(huì)像即時(shí)消息應(yīng)用程序或社交媒體那樣快速增長(zhǎng),但電子郵件將繼續(xù)存在[1]。圖1-1 為 Radicati 年度報(bào)告 2017 年-2021 年全球郵件市場(chǎng)預(yù)測(cè)表格。從全球范圍來(lái)看,到 2017 年為止,電子郵件用戶(hù)預(yù)計(jì)達(dá)到 37 億人,到 2021 年預(yù)計(jì)增長(zhǎng) 3%,屆時(shí)電子郵件用戶(hù)將超過(guò) 41 億。預(yù)計(jì)每日平均電子郵件流量將以更快的增長(zhǎng)速度成倍增加。因?yàn)樵诖祟A(yù)測(cè)期間,企業(yè)和消費(fèi)者模式的電子郵件每年都會(huì)增長(zhǎng)4%,數(shù)量將從今年的每日平均 2690 億增長(zhǎng)到 2021 年的 3200 億,電子郵件市場(chǎng)的收入也將呈現(xiàn)強(qiáng)勢(shì)增長(zhǎng)趨勢(shì),明年預(yù)計(jì)增長(zhǎng) 22%,能夠達(dá)到近 300 億美元,并且一直持續(xù)到 2021 年都會(huì)保持兩位數(shù)的增長(zhǎng)幅度。屆時(shí),電子郵件的市場(chǎng)收入將達(dá)到近 470 億美元。
圖 1-2 釣魚(yú)郵件檢測(cè)總體模塊圖Figure1-2 Overall module map of phishing mail detection主要研究?jī)?nèi)容可以分為以下幾方面內(nèi)容:第一,通過(guò)基于寫(xiě)作風(fēng)格、性別和性格的發(fā)件人身份驗(yàn)證方法檢測(cè)魚(yú)叉件。在這個(gè)過(guò)程中,對(duì)于目前使用的發(fā)件人身份驗(yàn)證的方法進(jìn)行了深入研模塊中,根據(jù)魚(yú)叉式釣魚(yú)郵件檢測(cè)的相關(guān)文獻(xiàn),提出了能夠獲得較大檢郵件特征。將發(fā)件人身份驗(yàn)證與魚(yú)叉式釣魚(yú)郵件的檢測(cè)方式相結(jié)合,從種新的魚(yú)叉式釣魚(yú)郵件檢測(cè)方法,提高檢測(cè)效率。第二,基于分類(lèi)集成的釣魚(yú)郵件檢測(cè)方法。通過(guò)研究,找出幾種可以單郵件特征,然后利用集成學(xué)習(xí)的方法將幾種郵件特征形成的基分類(lèi)器通方式結(jié)合成為一個(gè)最終的分類(lèi)器。利用上述兩種方法的結(jié)合,可以將各件全面的檢測(cè)出來(lái)。第三,基于密度和距離的降維處理方法。通過(guò)研究目前存在的降維方法此基礎(chǔ)上提出一種基于新特征的特征提取方法的降維處理算法。以達(dá)到效率的目的。
【參考文獻(xiàn)】
相關(guān)期刊論文 前4條
1 唐成華;劉鵬程;湯申生;謝逸;;基于特征選擇的模糊聚類(lèi)異常入侵行為檢測(cè)[J];計(jì)算機(jī)研究與發(fā)展;2015年03期
2 藺亞?wèn)|;;基于URL特征的釣魚(yú)網(wǎng)站檢測(cè)方式[J];電子測(cè)試;2014年03期
3 彭富明;張衛(wèi)豐;彭寅;;基于文本特征分析的釣魚(yú)郵件檢測(cè)[J];南京郵電大學(xué)學(xué)報(bào)(自然科學(xué)版);2012年05期
4 鄭金彬;卓義寶;;基于密度的分布式聚類(lèi)算法研究[J];計(jì)算機(jī)工程;2008年17期
本文編號(hào):2741135
本文鏈接:http://sikaile.net/guanlilunwen/ydhl/2741135.html
最近更新
教材專(zhuān)著