基于發(fā)件人身份驗證和分類集成的釣魚郵件檢測方法
發(fā)布時間:2020-07-04 12:35
【摘要】:近年來網(wǎng)絡(luò)發(fā)展迅猛,已成為人們?nèi)粘I钪胁豢苫蛉钡拇嬖凇8鞣N網(wǎng)絡(luò)安全隱患隨之而來,出現(xiàn)了一種以商業(yè)和政治為目的的網(wǎng)絡(luò)犯罪類型高級持續(xù)性滲透攻擊(APT),其常見的滲透突破方法包括網(wǎng)站掛馬、電子郵件和即時消息。釣魚郵件就是通過電子郵件進(jìn)行滲透攻擊,是非常常見的攻擊手段。如今又出現(xiàn)了一種新形式的釣魚郵件,即魚叉式釣魚郵件,通過偽裝成目標(biāo)的熟人進(jìn)行有針對性的釣魚。但是每個個體的性格、性別、寫作習(xí)慣都不一樣,即使是有意的模仿,也不能做到完全相似。因此本研究使用基于發(fā)件人身份驗證的方法實現(xiàn)對魚叉式釣魚郵件的檢測。在驗證發(fā)件人身份過程中,需要從郵件中提取風(fēng)格特征、性別特征和性格特征,然后使用分類器對郵件進(jìn)行分類。但是普通釣魚郵件不具備偽裝發(fā)件人為目標(biāo)熟悉的人這一特點,因此驗證發(fā)件人身份并不適用于全部釣魚郵件,對于其他情況的釣魚郵件只能使用普通的檢測方法進(jìn)行檢測。本文分別單獨使用URL特征、關(guān)鍵詞特征和郵件正文特征進(jìn)行分類構(gòu)造基分類器,然后將結(jié)果通過投票的方式進(jìn)行集成,得到最終的檢測結(jié)果。最后,在檢測過程中提取的特征比較多,會造成過擬合現(xiàn)象的產(chǎn)生。因此在本文中,提出了一種基于密度和距離的降維方法。該方法通過計算特征之間的距離和局部密度,有效的將原始特征的維度降為簡單而具有代表性的二維向量。以達(dá)到節(jié)省時間和提高準(zhǔn)確率等性能的效果。最后實驗結(jié)果表明本文研究的基于發(fā)件人身份驗證和分類集成的釣魚郵件檢測方法是有效的。
【學(xué)位授予單位】:北京工業(yè)大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2018
【分類號】:TP393.08;TP393.098
【圖文】:
通過互聯(lián)網(wǎng)應(yīng)運而生的一系列事物,如電子商務(wù)、網(wǎng)絡(luò)銀行、在線教育、網(wǎng)絡(luò)社交平臺、手機(jī)支付等等已經(jīng)深入到了生活中的各個方面。人們的日常聯(lián)系不再局限于面對面交流,通過互聯(lián)網(wǎng)更容易進(jìn)行方便有效的溝通。電子郵件已經(jīng)成為人們?nèi)粘贤ㄖ胁豢扇鄙俚囊环N交流方式。在互聯(lián)網(wǎng)時代的商業(yè)領(lǐng)域,電子郵件已經(jīng)成為經(jīng)常被提及的工具。根據(jù) Radicati 最新的年度報告,電子郵件可能不會像即時消息應(yīng)用程序或社交媒體那樣快速增長,但電子郵件將繼續(xù)存在[1]。圖1-1 為 Radicati 年度報告 2017 年-2021 年全球郵件市場預(yù)測表格。從全球范圍來看,到 2017 年為止,電子郵件用戶預(yù)計達(dá)到 37 億人,到 2021 年預(yù)計增長 3%,屆時電子郵件用戶將超過 41 億。預(yù)計每日平均電子郵件流量將以更快的增長速度成倍增加。因為在此預(yù)測期間,企業(yè)和消費者模式的電子郵件每年都會增長4%,數(shù)量將從今年的每日平均 2690 億增長到 2021 年的 3200 億,電子郵件市場的收入也將呈現(xiàn)強勢增長趨勢,明年預(yù)計增長 22%,能夠達(dá)到近 300 億美元,并且一直持續(xù)到 2021 年都會保持兩位數(shù)的增長幅度。屆時,電子郵件的市場收入將達(dá)到近 470 億美元。
圖 1-2 釣魚郵件檢測總體模塊圖Figure1-2 Overall module map of phishing mail detection主要研究內(nèi)容可以分為以下幾方面內(nèi)容:第一,通過基于寫作風(fēng)格、性別和性格的發(fā)件人身份驗證方法檢測魚叉件。在這個過程中,對于目前使用的發(fā)件人身份驗證的方法進(jìn)行了深入研模塊中,根據(jù)魚叉式釣魚郵件檢測的相關(guān)文獻(xiàn),提出了能夠獲得較大檢郵件特征。將發(fā)件人身份驗證與魚叉式釣魚郵件的檢測方式相結(jié)合,從種新的魚叉式釣魚郵件檢測方法,提高檢測效率。第二,基于分類集成的釣魚郵件檢測方法。通過研究,找出幾種可以單郵件特征,然后利用集成學(xué)習(xí)的方法將幾種郵件特征形成的基分類器通方式結(jié)合成為一個最終的分類器。利用上述兩種方法的結(jié)合,可以將各件全面的檢測出來。第三,基于密度和距離的降維處理方法。通過研究目前存在的降維方法此基礎(chǔ)上提出一種基于新特征的特征提取方法的降維處理算法。以達(dá)到效率的目的。
本文編號:2741135
【學(xué)位授予單位】:北京工業(yè)大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2018
【分類號】:TP393.08;TP393.098
【圖文】:
通過互聯(lián)網(wǎng)應(yīng)運而生的一系列事物,如電子商務(wù)、網(wǎng)絡(luò)銀行、在線教育、網(wǎng)絡(luò)社交平臺、手機(jī)支付等等已經(jīng)深入到了生活中的各個方面。人們的日常聯(lián)系不再局限于面對面交流,通過互聯(lián)網(wǎng)更容易進(jìn)行方便有效的溝通。電子郵件已經(jīng)成為人們?nèi)粘贤ㄖ胁豢扇鄙俚囊环N交流方式。在互聯(lián)網(wǎng)時代的商業(yè)領(lǐng)域,電子郵件已經(jīng)成為經(jīng)常被提及的工具。根據(jù) Radicati 最新的年度報告,電子郵件可能不會像即時消息應(yīng)用程序或社交媒體那樣快速增長,但電子郵件將繼續(xù)存在[1]。圖1-1 為 Radicati 年度報告 2017 年-2021 年全球郵件市場預(yù)測表格。從全球范圍來看,到 2017 年為止,電子郵件用戶預(yù)計達(dá)到 37 億人,到 2021 年預(yù)計增長 3%,屆時電子郵件用戶將超過 41 億。預(yù)計每日平均電子郵件流量將以更快的增長速度成倍增加。因為在此預(yù)測期間,企業(yè)和消費者模式的電子郵件每年都會增長4%,數(shù)量將從今年的每日平均 2690 億增長到 2021 年的 3200 億,電子郵件市場的收入也將呈現(xiàn)強勢增長趨勢,明年預(yù)計增長 22%,能夠達(dá)到近 300 億美元,并且一直持續(xù)到 2021 年都會保持兩位數(shù)的增長幅度。屆時,電子郵件的市場收入將達(dá)到近 470 億美元。
圖 1-2 釣魚郵件檢測總體模塊圖Figure1-2 Overall module map of phishing mail detection主要研究內(nèi)容可以分為以下幾方面內(nèi)容:第一,通過基于寫作風(fēng)格、性別和性格的發(fā)件人身份驗證方法檢測魚叉件。在這個過程中,對于目前使用的發(fā)件人身份驗證的方法進(jìn)行了深入研模塊中,根據(jù)魚叉式釣魚郵件檢測的相關(guān)文獻(xiàn),提出了能夠獲得較大檢郵件特征。將發(fā)件人身份驗證與魚叉式釣魚郵件的檢測方式相結(jié)合,從種新的魚叉式釣魚郵件檢測方法,提高檢測效率。第二,基于分類集成的釣魚郵件檢測方法。通過研究,找出幾種可以單郵件特征,然后利用集成學(xué)習(xí)的方法將幾種郵件特征形成的基分類器通方式結(jié)合成為一個最終的分類器。利用上述兩種方法的結(jié)合,可以將各件全面的檢測出來。第三,基于密度和距離的降維處理方法。通過研究目前存在的降維方法此基礎(chǔ)上提出一種基于新特征的特征提取方法的降維處理算法。以達(dá)到效率的目的。
【參考文獻(xiàn)】
相關(guān)期刊論文 前4條
1 唐成華;劉鵬程;湯申生;謝逸;;基于特征選擇的模糊聚類異常入侵行為檢測[J];計算機(jī)研究與發(fā)展;2015年03期
2 藺亞東;;基于URL特征的釣魚網(wǎng)站檢測方式[J];電子測試;2014年03期
3 彭富明;張衛(wèi)豐;彭寅;;基于文本特征分析的釣魚郵件檢測[J];南京郵電大學(xué)學(xué)報(自然科學(xué)版);2012年05期
4 鄭金彬;卓義寶;;基于密度的分布式聚類算法研究[J];計算機(jī)工程;2008年17期
本文編號:2741135
本文鏈接:http://sikaile.net/guanlilunwen/ydhl/2741135.html
最近更新
教材專著