基于多層grams的在線支持向量機的中文垃圾郵件過濾
本文關(guān)鍵詞:基于多層grams的在線支持向量機的中文垃圾郵件過濾
更多相關(guān)文章: 特征抽取 支持向量機 垃圾郵件過濾。
【摘要】:該文提出一種多層grams特征抽取方法來提升基于在線支持向量模型的垃圾郵件過濾器;谠诰支持向量機模型的垃圾郵件過濾器在大規(guī)模垃圾郵件數(shù)據(jù)集已取得了很好的過濾效果,但與邏輯回歸模型相比,計算性能的耗時是巨大的,很難被工業(yè)界所運用。該文提出的多層grams特征抽取方法能夠有效減少特征數(shù),抽取更精準有效的特征,大幅降低模型的運行時間,同時提升過濾器的過濾效果。實驗表明,該方法使得在線支持向量機模型的運行時間從10337s減少到3784s,同時模型(1-ROCA)%降低了一半。
【作者單位】: 哈爾濱理工大學圖書館;哈爾濱理工大學計算機科學與技術(shù)學院;
【關(guān)鍵詞】: 特征抽取 支持向量機 垃圾郵件過濾。
【分類號】:TP393.098;TP181
【正文快照】: 1引言近年來,垃圾郵件給電子郵件行業(yè)帶來了很多問題,給人們生活造成了影響,個人和公司由于接收垃圾郵件和區(qū)分垃圾郵件而占用大量網(wǎng)絡(luò)資源和時間。同時垃圾郵件也是一個有利可圖的商業(yè)模式,因為垃圾郵件發(fā)送者只需要付出很小的代價就能得到豐厚的回報。由于垃圾郵件導致了經(jīng)
【相似文獻】
中國期刊全文數(shù)據(jù)庫 前10條
1 陳長偉;劉罡;洪躍楓;;電子垃圾郵件過濾技術(shù)的應用[J];辦公自動化;2004年06期
2 劉震,佘X,周明天;基于多級屬性集的垃圾郵件過濾技術(shù)[J];計算機應用研究;2005年07期
3 陳治平;王雷;;基于自學習K近鄰的垃圾郵件過濾算法[J];計算機應用;2005年S1期
4 李星;田瑩;段海新;;中文垃圾郵件過濾系統(tǒng)的實現(xiàn)和評估[J];大連理工大學學報;2005年S1期
5 劉紅翼;;一種垃圾郵件過濾器的設(shè)計與實現(xiàn)[J];廣西科學院學報;2005年04期
6 詹川;盧顯良;周旭;侯孟書;袁連海;;基于貝葉斯公式的垃圾郵件過濾方法[J];計算機科學;2005年02期
7 張強;;基于阻斷發(fā)送源的垃圾郵件過濾技術(shù)[J];網(wǎng)絡(luò)安全技術(shù)與應用;2006年02期
8 胡永杰;卜紅霞;;垃圾郵件過濾技術(shù)研究[J];河北師范大學學報;2006年02期
9 王倩倩;段震;;基于神經(jīng)網(wǎng)絡(luò)的垃圾郵件過濾[J];合肥學院學報(自然科學版);2006年01期
10 袁耀文;盛勵;;基于信息免疫技術(shù)的垃圾郵件過濾技術(shù)[J];計算機應用研究;2006年05期
中國重要會議論文全文數(shù)據(jù)庫 前10條
1 李軍;何曉寧;黃成哲;齊浩亮;雷國華;;基于特征貢獻度的垃圾郵件過濾方法[A];第六屆全國信息檢索學術(shù)會議論文集[C];2010年
2 潘文鋒;王斌;譚松波;;貝葉斯垃圾郵件過濾研究[A];全國網(wǎng)絡(luò)與信息安全技術(shù)研討會’2004論文集[C];2004年
3 劉紅翼;;一種垃圾郵件過濾器的設(shè)計與實現(xiàn)[A];廣西計算機學會2005年學術(shù)年會論文集[C];2005年
4 張尼;方濱興;;垃圾郵件過濾技術(shù)綜述[A];全國網(wǎng)絡(luò)與信息安全技術(shù)研討會'2005論文集(下冊)[C];2005年
5 張志斌;施水才;呂學強;;基于貝葉斯方法的中文垃圾郵件過濾技術(shù)綜述[A];中文信息處理前沿進展——中國中文信息學會二十五周年學術(shù)會議論文集[C];2006年
6 周立兵;柳景超;;貝葉斯理論在垃圾郵件過濾中的應用分析[A];中國造船工程學會電子技術(shù)學術(shù)委員會2006學術(shù)年會論文集(上冊)[C];2006年
7 張海雷;王會珍;王安慧;朱靖波;;基于樸素貝葉斯模型的垃圾郵件過濾技術(shù)比較分析[A];全國網(wǎng)絡(luò)與信息安全技術(shù)研討會論文集(下冊)[C];2007年
8 米淑云;辛陽;羅群;;一種新型垃圾郵件過濾系統(tǒng)的設(shè)計和研究[A];2008通信理論與技術(shù)新進展——第十三屆全國青年通信學術(shù)會議論文集(上)[C];2008年
9 岑芳明;王明文;王鵬鳴;戴玉娟;;基于核偏最小二乘分類的垃圾郵件過濾[A];第四屆全國信息檢索與內(nèi)容安全學術(shù)會議論文集(上)[C];2008年
10 牛明珠;;病毒和垃圾郵件過濾技術(shù)淺析[A];二○○九年全國電力企業(yè)信息化大會論文集[C];2009年
中國重要報紙全文數(shù)據(jù)庫 前10條
1 ;“垃圾郵件過濾系統(tǒng)”幾乎沒有一個完善的[N];新華每日電訊;2003年
2 ;測試垃圾郵件過濾系統(tǒng)[N];網(wǎng)絡(luò)世界;2003年
3 本報記者 高穎;清除網(wǎng)絡(luò)“牛皮癬”勝算幾何?[N];計算機世界;2003年
4 John D. Halamka;IT手段的兩面性[N];計算機世界;2007年
5 ;不止是垃圾郵件過濾[N];網(wǎng)絡(luò)世界;2005年
6 ;2003十大網(wǎng)絡(luò)應用電子郵箱[N];中國電腦教育報;2003年
7 本報記者 李建平;Comdex走向?qū)WN];計算機世界;2003年
8 張穎;東西方交流不會被“垃圾”阻斷[N];中國經(jīng)營報;2002年
9 ;如何選擇和使用UTM設(shè)備[N];網(wǎng)絡(luò)世界;2009年
10 ;用戶關(guān)心的問題:MSN 8值嗎?[N];計算機世界;2002年
中國博士學位論文全文數(shù)據(jù)庫 前5條
1 董建設(shè);協(xié)作式垃圾郵件過濾關(guān)鍵技術(shù)研究[D];蘭州理工大學;2009年
2 惠孛;基于即時分類的垃圾郵件過濾關(guān)鍵技術(shù)的研究[D];電子科技大學;2009年
3 鄧蔚;垃圾郵件過濾中的敵手分類問題研究[D];電子科技大學;2011年
4 孫晶濤;基于內(nèi)容的垃圾郵件過濾技術(shù)研究[D];蘭州理工大學;2010年
5 張澤明;人工免疫算法及其應用研究[D];中國科學技術(shù)大學;2007年
中國碩士學位論文全文數(shù)據(jù)庫 前10條
1 陳俊偉;圖片垃圾郵件過濾系統(tǒng)[D];華東師范大學;2009年
2 徐雋;基于流數(shù)據(jù)特性的垃圾郵件過濾技術(shù)研究[D];復旦大學;2009年
3 林偉;基于貝葉斯分類的垃圾郵件過濾系統(tǒng)研究與實現(xiàn)[D];西華大學;2009年
4 徐熙;基于內(nèi)容的多級垃圾郵件過濾系統(tǒng)研究[D];西華大學;2009年
5 盧揚竹;基于內(nèi)容的垃圾郵件過濾技術(shù)研究[D];西南交通大學;2009年
6 鄭春光;基于免疫的垃圾郵件過濾技術(shù)研究[D];哈爾濱理工大學;2009年
7 歐德寧;垃圾郵件過濾技術(shù)研究[D];山東大學;2009年
8 王志波;基于數(shù)據(jù)挖掘的垃圾郵件過濾技術(shù)研究[D];陜西師范大學;2009年
9 王劍;惰性學習分類法在垃圾郵件過濾中的應用研究[D];上海師范大學;2009年
10 孫雪;基于內(nèi)容的垃圾郵件過濾系統(tǒng)研究[D];河北大學;2010年
,本文編號:1113006
本文鏈接:http://sikaile.net/guanlilunwen/ydhl/1113006.html