基于行為識別的垃圾郵件過濾技術(shù)的研究與應(yīng)用
發(fā)布時(shí)間:2021-08-20 03:36
垃圾郵件泛濫問題日益嚴(yán)重,垃圾郵件過濾技術(shù)日益成為當(dāng)今的研究熱點(diǎn)。目前垃圾郵件過濾技術(shù)主要包括第一代基于規(guī)則的過濾技術(shù)、第二代基于內(nèi)容的過濾技術(shù)和第三代基于行為的過濾技術(shù)。傳統(tǒng)的第一代和第二代垃圾郵件過濾技術(shù)在處理效率,規(guī)則的持久性等方面存在一些不足;谛袨樽R別的垃圾郵件過濾技術(shù)在節(jié)省網(wǎng)絡(luò)資源,處理效率上具有明顯的優(yōu)勢。本文在現(xiàn)有的行為識別過濾技術(shù)研究基礎(chǔ)之上,提出了一種基于行為特征加權(quán)的決策樹過濾算法;谛袨樘卣骷訖(quán)的決策樹過濾算法的思想為:針對大量的垃圾郵件所表現(xiàn)出來的行為特征,選取出一系列的行為特征,采用主成分分析法選取其中具有代表性的特征,然后選取等量的正常郵件和垃圾郵件,根據(jù)統(tǒng)計(jì)的方法分別計(jì)算某一特征對正常郵件和垃圾郵件的貢獻(xiàn)率,作為其權(quán)值,采用決策樹算法生成判別決策樹,使用大量的已知屬性的郵件樣例測試決策樹,分別得到正常郵件和垃圾郵件的加權(quán)平均權(quán)值,作為垃圾郵件和正常郵件的判斷閾值。如果郵件的路徑權(quán)值小于垃圾郵件閾值,則判定為垃圾郵件;如果大于正常郵件閾值,則該郵件被判斷為正常郵件;介于二者之間則使用決策樹算法判斷。通過大量待測實(shí)例的仿真實(shí)驗(yàn)得到統(tǒng)計(jì)結(jié)果,實(shí)驗(yàn)結(jié)果表明基...
【文章來源】:武漢理工大學(xué)湖北省 211工程院校 教育部直屬院校
【文章頁數(shù)】:64 頁
【學(xué)位級別】:碩士
【文章目錄】:
摘要
Abstract
第1章 緒論
1.1 課題的研究背景和意義
1.1.1 課題背景
1.1.2 電子郵件的安全缺陷
1.1.3 課題目的與意義
1.2 反垃圾郵件的研究歷史及現(xiàn)狀
1.2.1 垃圾郵件過濾技術(shù)的歷史
1.2.2 行為識別技術(shù)的研究現(xiàn)狀
1.3 本文的研究內(nèi)容與組織結(jié)構(gòu)
第2章 電子郵件過濾技術(shù)的研究
2.1 電子郵件頭信息的分析
2.2 郵件頭信息提取
2.3 垃圾郵件行為特征的分析
2.4 電子郵件特征的表示
2.5 本章小結(jié)
第3章 基于行為特征加權(quán)的決策樹模型
3.1 主成分分析法
3.1.1 PCA計(jì)算方法
3.1.2 行為屬性的選擇
3.2 郵件行為特征權(quán)重計(jì)算
3.3 數(shù)據(jù)挖掘技術(shù)
3.3.1 決策樹算法的選擇
3.3.2 ID3和C4.5的比較
3.4 行為加權(quán)決策樹模型
3.4.1 決策樹的生成
3.4.2 節(jié)點(diǎn)路徑權(quán)重
3.5 本章小結(jié)
第4章 實(shí)驗(yàn)過程與結(jié)果分析
4.1 實(shí)驗(yàn)環(huán)境
4.2 NPW閾值的確定
4.2.1 計(jì)算方法
4.2.2 計(jì)算過程
4.2.3 郵件的NPW
4.3 算法性能與分析
4.3.1 無權(quán)重決策樹算法
4.3.2 特征加權(quán)的決策樹算法
4.4 本章小結(jié)
第5章 總結(jié)與展望
5.1 研究工作總結(jié)
5.2 展望
致謝
參考文獻(xiàn)
【參考文獻(xiàn)】:
期刊論文
[1]ID3算法及其改進(jìn)[J]. 徐雯,張揚(yáng). 計(jì)算機(jī)與數(shù)字工程. 2009(10)
[2]垃圾郵件過濾技術(shù)研究綜述[J]. 陳志賢. 計(jì)算機(jī)應(yīng)用研究. 2009(05)
[3]ID3算法的理論基礎(chǔ)[J]. 翟俊海,張素芳,王熙照. 蘭州大學(xué)學(xué)報(bào)(自然科學(xué)版). 2007(06)
[4]一種有效的C4.5改進(jìn)模型[J]. 劉鵬,姚正,尹俊杰. 清華大學(xué)學(xué)報(bào)(自然科學(xué)版). 2006(S1)
[5]分布式垃圾郵件檢測系統(tǒng)的研究與實(shí)現(xiàn)[J]. 呂新杰,柴喬林,馬莉. 計(jì)算機(jī)工程. 2005(18)
博士論文
[1]基于內(nèi)容的垃圾郵件過濾技術(shù)研究[D]. 孫晶濤.蘭州理工大學(xué) 2010
碩士論文
[1]基于內(nèi)容的垃圾郵件過濾系統(tǒng)的研究[D]. 周璐.吉林大學(xué) 2011
[2]基于行為識別的垃圾郵件過濾技術(shù)的研究[D]. 毛巖.大慶石油學(xué)院 2010
[3]基于行為分析的垃圾郵件過濾技術(shù)研究[D]. 朱文龍.哈爾濱工程大學(xué) 2010
[4]基于決策樹算法的垃圾郵件通信行為檢測過濾技術(shù)研究[D]. 王洪斌.哈爾濱理工大學(xué) 2008
[5]基于行為模式分類的反垃圾郵件技術(shù)研究[D]. 高巖.哈爾濱理工大學(xué) 2008
[6]行為識別技術(shù)在反垃圾郵件系統(tǒng)中的研究與應(yīng)用[D]. 張耀龍.北京郵電大學(xué) 2006
[7]基于數(shù)據(jù)挖掘的中文垃圾郵件過濾技術(shù)研究[D]. 寧靜.西南交通大學(xué) 2006
[8]基于Web服務(wù)的安全電子郵件用戶代理[D]. 曾慧鵬.西南交通大學(xué) 2005
本文編號:3352730
【文章來源】:武漢理工大學(xué)湖北省 211工程院校 教育部直屬院校
【文章頁數(shù)】:64 頁
【學(xué)位級別】:碩士
【文章目錄】:
摘要
Abstract
第1章 緒論
1.1 課題的研究背景和意義
1.1.1 課題背景
1.1.2 電子郵件的安全缺陷
1.1.3 課題目的與意義
1.2 反垃圾郵件的研究歷史及現(xiàn)狀
1.2.1 垃圾郵件過濾技術(shù)的歷史
1.2.2 行為識別技術(shù)的研究現(xiàn)狀
1.3 本文的研究內(nèi)容與組織結(jié)構(gòu)
第2章 電子郵件過濾技術(shù)的研究
2.1 電子郵件頭信息的分析
2.2 郵件頭信息提取
2.3 垃圾郵件行為特征的分析
2.4 電子郵件特征的表示
2.5 本章小結(jié)
第3章 基于行為特征加權(quán)的決策樹模型
3.1 主成分分析法
3.1.1 PCA計(jì)算方法
3.1.2 行為屬性的選擇
3.2 郵件行為特征權(quán)重計(jì)算
3.3 數(shù)據(jù)挖掘技術(shù)
3.3.1 決策樹算法的選擇
3.3.2 ID3和C4.5的比較
3.4 行為加權(quán)決策樹模型
3.4.1 決策樹的生成
3.4.2 節(jié)點(diǎn)路徑權(quán)重
3.5 本章小結(jié)
第4章 實(shí)驗(yàn)過程與結(jié)果分析
4.1 實(shí)驗(yàn)環(huán)境
4.2 NPW閾值的確定
4.2.1 計(jì)算方法
4.2.2 計(jì)算過程
4.2.3 郵件的NPW
4.3 算法性能與分析
4.3.1 無權(quán)重決策樹算法
4.3.2 特征加權(quán)的決策樹算法
4.4 本章小結(jié)
第5章 總結(jié)與展望
5.1 研究工作總結(jié)
5.2 展望
致謝
參考文獻(xiàn)
【參考文獻(xiàn)】:
期刊論文
[1]ID3算法及其改進(jìn)[J]. 徐雯,張揚(yáng). 計(jì)算機(jī)與數(shù)字工程. 2009(10)
[2]垃圾郵件過濾技術(shù)研究綜述[J]. 陳志賢. 計(jì)算機(jī)應(yīng)用研究. 2009(05)
[3]ID3算法的理論基礎(chǔ)[J]. 翟俊海,張素芳,王熙照. 蘭州大學(xué)學(xué)報(bào)(自然科學(xué)版). 2007(06)
[4]一種有效的C4.5改進(jìn)模型[J]. 劉鵬,姚正,尹俊杰. 清華大學(xué)學(xué)報(bào)(自然科學(xué)版). 2006(S1)
[5]分布式垃圾郵件檢測系統(tǒng)的研究與實(shí)現(xiàn)[J]. 呂新杰,柴喬林,馬莉. 計(jì)算機(jī)工程. 2005(18)
博士論文
[1]基于內(nèi)容的垃圾郵件過濾技術(shù)研究[D]. 孫晶濤.蘭州理工大學(xué) 2010
碩士論文
[1]基于內(nèi)容的垃圾郵件過濾系統(tǒng)的研究[D]. 周璐.吉林大學(xué) 2011
[2]基于行為識別的垃圾郵件過濾技術(shù)的研究[D]. 毛巖.大慶石油學(xué)院 2010
[3]基于行為分析的垃圾郵件過濾技術(shù)研究[D]. 朱文龍.哈爾濱工程大學(xué) 2010
[4]基于決策樹算法的垃圾郵件通信行為檢測過濾技術(shù)研究[D]. 王洪斌.哈爾濱理工大學(xué) 2008
[5]基于行為模式分類的反垃圾郵件技術(shù)研究[D]. 高巖.哈爾濱理工大學(xué) 2008
[6]行為識別技術(shù)在反垃圾郵件系統(tǒng)中的研究與應(yīng)用[D]. 張耀龍.北京郵電大學(xué) 2006
[7]基于數(shù)據(jù)挖掘的中文垃圾郵件過濾技術(shù)研究[D]. 寧靜.西南交通大學(xué) 2006
[8]基于Web服務(wù)的安全電子郵件用戶代理[D]. 曾慧鵬.西南交通大學(xué) 2005
本文編號:3352730
本文鏈接:http://sikaile.net/guanlilunwen/ydhl/3352730.html
最近更新
教材專著