天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

基于改進的Porter Stemmer詞干提取與核方法的垃圾郵件過濾算法

發(fā)布時間:2019-03-09 10:06
【摘要】:統(tǒng)計學習方法現(xiàn)已大量應用于垃圾郵件識別,其中表現(xiàn)突出的包括貝葉斯過濾器、支持向量機等。近年來,為應對日益嚴重的垃圾郵件問題,提出諸多改進算法或創(chuàng)新思路。通過改進Porter Stemmer并使之適用于垃圾郵件過濾,從而充分提取文本的有效特征,摒棄冗余信息,加強了過濾效果;將改進方法的Porter Stemmer與原方法分別應用于線性核、高斯核、多項式核支持向量機以及貝葉斯過濾器,對比實驗結(jié)果可知,錯誤率分別下降了63.7%,63.1%,61.3%和11.4%,證明了改進方法的顯著效果;另外,實驗結(jié)果證明SVM過濾器顯著優(yōu)于貝葉斯過濾器,且能更大程度體現(xiàn)改進方法的優(yōu)勢;最后,給出多種定量評價和語義角度的分析,啟發(fā)采用用戶個性化定制的過濾器。
[Abstract]:Statistical learning method has been widely used in spam recognition, including Bayesian filter, support vector machine and so on. In recent years, in order to deal with the increasingly serious problem of spam, many improved algorithms or innovative ideas have been put forward. By improving Porter Stemmer and making it suitable for spam filtering, the effective features of text are fully extracted, redundant information is discarded, and the filtering effect is strengthened. The improved Porter Stemmer and the original method are applied to linear kernel, Gaussian kernel, polynomial kernel support vector machine and Bayesian filter, respectively. Compared with the experimental results, the error rate decreases by 63.7% and 63.1%, respectively. 61.3% and 11.4% respectively, which proved the remarkable effect of the improved method. In addition, the experimental results show that the SVM filter is significantly superior to the Bayesian filter and can reflect the advantages of the improved method to a greater extent. Finally, a variety of quantitative evaluation and semantic analysis are given to inspire the adoption of customized filters.
【作者單位】: 中山大學數(shù)學學院;
【基金】:國家自然科學基金(61272338)部分資助
【分類號】:TP393.098

【相似文獻】

相關(guān)期刊論文 前10條

1 張羿;周建國;晏蒲柳;;垃圾郵件過濾系統(tǒng)的研究與實現(xiàn)[J];計算機工程;2006年18期

2 徐衛(wèi);;一種垃圾郵件過濾網(wǎng)關(guān)的設計[J];電腦知識與技術(shù);2006年35期

3 項濤;龔儉;丁偉;;垃圾郵件過濾系統(tǒng)的評估模型研究[J];計算機工程與設計;2007年18期

4 歐德寧;馬軍;;基于內(nèi)含鏈接特征分析的垃圾郵件過濾技術(shù)[J];鄭州大學學報(理學版);2009年02期

5 金彩琴;裘國永;;對垃圾郵件過濾技術(shù)的問題研究[J];計算機技術(shù)與發(fā)展;2011年09期

6 丁上凌;呂后坤;;垃圾郵件過濾技術(shù)研究[J];漯河職業(yè)技術(shù)學院學報;2012年02期

7 趙文清;一種混合型垃圾郵件過濾系統(tǒng)的研究與設計[J];山西電子技術(shù);2004年06期

8 陳長偉;劉罡;洪躍楓;;電子垃圾郵件過濾技術(shù)的應用[J];辦公自動化;2004年06期

9 劉震,佘X,周明天;基于多級屬性集的垃圾郵件過濾技術(shù)[J];計算機應用研究;2005年07期

10 陳治平;王雷;;基于自學習K近鄰的垃圾郵件過濾算法[J];計算機應用;2005年S1期

相關(guān)會議論文 前10條

1 李軍;何曉寧;黃成哲;齊浩亮;雷國華;;基于特征貢獻度的垃圾郵件過濾方法[A];第六屆全國信息檢索學術(shù)會議論文集[C];2010年

2 潘文鋒;王斌;譚松波;;貝葉斯垃圾郵件過濾研究[A];全國網(wǎng)絡與信息安全技術(shù)研討會’2004論文集[C];2004年

3 劉紅翼;;一種垃圾郵件過濾器的設計與實現(xiàn)[A];廣西計算機學會2005年學術(shù)年會論文集[C];2005年

4 張尼;方濱興;;垃圾郵件過濾技術(shù)綜述[A];全國網(wǎng)絡與信息安全技術(shù)研討會'2005論文集(下冊)[C];2005年

5 張志斌;施水才;呂學強;;基于貝葉斯方法的中文垃圾郵件過濾技術(shù)綜述[A];中文信息處理前沿進展——中國中文信息學會二十五周年學術(shù)會議論文集[C];2006年

6 周立兵;柳景超;;貝葉斯理論在垃圾郵件過濾中的應用分析[A];中國造船工程學會電子技術(shù)學術(shù)委員會2006學術(shù)年會論文集(上冊)[C];2006年

7 張海雷;王會珍;王安慧;朱靖波;;基于樸素貝葉斯模型的垃圾郵件過濾技術(shù)比較分析[A];全國網(wǎng)絡與信息安全技術(shù)研討會論文集(下冊)[C];2007年

8 米淑云;辛陽;羅群;;一種新型垃圾郵件過濾系統(tǒng)的設計和研究[A];2008通信理論與技術(shù)新進展——第十三屆全國青年通信學術(shù)會議論文集(上)[C];2008年

9 岑芳明;王明文;王鵬鳴;戴玉娟;;基于核偏最小二乘分類的垃圾郵件過濾[A];第四屆全國信息檢索與內(nèi)容安全學術(shù)會議論文集(上)[C];2008年

10 牛明珠;;病毒和垃圾郵件過濾技術(shù)淺析[A];二○○九年全國電力企業(yè)信息化大會論文集[C];2009年

相關(guān)重要報紙文章 前10條

1 ;測試垃圾郵件過濾系統(tǒng)[N];網(wǎng)絡世界;2003年

2 ;如何選擇和使用UTM設備[N];網(wǎng)絡世界;2009年

3 本報記者 朱杰;中小企業(yè)網(wǎng)絡也能云安全[N];中國計算機報;2009年

4 宋偉;終結(jié)混合威脅攻擊[N];中國計算機報;2004年

5 本報記者 宋麗娜;整合安全平臺的魅力[N];網(wǎng)絡世界;2004年

6 湖北 張湘凱;慎用Web郵箱過濾功能[N];電腦報;2002年

7 張振;CA eTrust Secure Content Manager提升運營效率[N];電腦商報;2003年

8 雷雷;如虎添翼加入UTM的3D-SMP[N];科技日報;2006年

9 記者 馬霞;下一代防火墻整體性能達320G[N];科技日報;2012年

10 ;FCI過濾惡意流量[N];中國計算機報;2004年

相關(guān)博士學位論文 前4條

1 董建設;協(xié)作式垃圾郵件過濾關(guān)鍵技術(shù)研究[D];蘭州理工大學;2009年

2 惠孛;基于即時分類的垃圾郵件過濾關(guān)鍵技術(shù)的研究[D];電子科技大學;2009年

3 鄧蔚;垃圾郵件過濾中的敵手分類問題研究[D];電子科技大學;2011年

4 孫晶濤;基于內(nèi)容的垃圾郵件過濾技術(shù)研究[D];蘭州理工大學;2010年

相關(guān)碩士學位論文 前10條

1 甘棠儀;基于屬性論方法的垃圾郵件過濾系統(tǒng)設計與研究[D];上海海事大學;2005年

2 王申;基于內(nèi)容的垃圾郵件過濾技術(shù)的若干研究[D];中國科學院研究生院(計算技術(shù)研究所);2005年

3 田月霞;基于疫苗機制的垃圾郵件過濾模型的研究[D];鄭州輕工業(yè)學院;2015年

4 鄧曾;遺傳算法和貝葉斯模型在垃圾郵件過濾中的應用[D];電子科技大學;2015年

5 徐兆志;基于AAPE分類模型的垃圾郵件過濾技術(shù)的研究與實現(xiàn)[D];電子科技大學;2014年

6 次曲(Tse Qu);基于樸素貝葉斯算法的藏文垃圾郵件過濾關(guān)鍵技術(shù)研究[D];電子科技大學;2013年

7 王浩;基于發(fā)送方異常行為檢測的垃圾郵件過濾系統(tǒng)的研究與實現(xiàn)[D];東北大學;2013年

8 魏如玉;中文垃圾郵件過濾方法的研究[D];遼寧大學;2016年

9 胡瑋;基于語義的垃圾郵件過濾技術(shù)的研究[D];重慶大學;2016年

10 于洋;高校辦公系統(tǒng)垃圾郵件過濾DTFS算法的設計與實現(xiàn)[D];東北大學;2015年

,

本文編號:2437351

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/guanlilunwen/ydhl/2437351.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶074c5***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com