垃圾郵件過濾中信息增益的改進研究
本文關(guān)鍵詞:垃圾郵件過濾中信息增益的改進研究
更多相關(guān)文章: 信息增益 特征選擇 垃圾郵件 樸素貝葉斯
【摘要】:針對垃圾郵件過濾中的特征項選擇問題,提出了一種改進的信息增益方法。首先利用特征詞的先驗概率定義增益比,然后利用增益比對特征詞為整個分類所提供的信息量進行放大或弱化,從而對特征詞的類別條件熵計算作了改進,采用極大后驗假設(shè)樸素貝葉斯決策方法在英文語料庫上進行實驗,通過召回率、正確率、精確率和錯誤率對算法進行評價分析。實驗結(jié)果表明,改進后的算法提高了過濾器的分類精度,降低了過濾器對合法郵件的誤判給用戶帶來的損失。
【作者單位】: 渤海大學(xué);沈陽大學(xué);
【基金】:國家自然科學(xué)基金(61104106)資助
【分類號】:TP393.098;TP393.08
【正文快照】: 1引言電子郵件(E-mail)在人們?nèi)粘9ぷ骱蜕钪邪l(fā)揮著越來越重要的作用。與此同時,大量包含欺詐、營銷、暴力、色情和病毒等信息的垃圾郵件也隨之產(chǎn)生。垃圾郵件日益泛濫,不僅占據(jù)了大量的網(wǎng)絡(luò)帶寬資源,而且產(chǎn)生一系列嚴(yán)重的網(wǎng)絡(luò)安全問題。針對垃圾郵件問題的處理,目前主要以
【參考文獻(xiàn)】
中國期刊全文數(shù)據(jù)庫 前3條
1 鄧維斌;王國胤;洪智勇;;基于粗糙集的加權(quán)樸素貝葉斯郵件過濾方法[J];計算機科學(xué);2011年02期
2 陳孝禮;劉培玉;;應(yīng)用于垃圾郵件過濾的詞序列核[J];計算機應(yīng)用;2011年03期
3 黃國偉;許昱瑋;;基于用戶反饋的混合型垃圾郵件過濾方法[J];計算機應(yīng)用;2013年07期
【共引文獻(xiàn)】
中國期刊全文數(shù)據(jù)庫 前10條
1 翟軍昌;車偉偉;劉艷麗;康建軍;;基于改進信息增益的垃圾郵件過濾研究[J];電子設(shè)計工程;2012年13期
2 趙春生;馮林;蔣勱;李聰;;一種基于DTRS模型與α-正域的郵件過濾方法[J];重慶郵電大學(xué)學(xué)報(自然科學(xué)版);2013年01期
3 王麗娟;楊習(xí)貝;楊靜宇;吳陳;;基于覆蓋的粗糙集模型比較[J];計算機科學(xué);2012年07期
4 翟軍昌;秦玉平;車偉偉;;應(yīng)用特征詞分類貢獻(xiàn)的垃圾郵件過濾研究[J];計算機工程與應(yīng)用;2012年34期
5 曾青華;袁家斌;張云洲;;基于Hadoop的貝葉斯過濾MapReduce模型[J];計算機工程;2013年11期
6 翟軍昌;車偉偉;;一種基于條件熵的垃圾郵件過濾算法[J];計算機與現(xiàn)代化;2014年02期
7 陳宇;;基于用戶行為的個性化郵件分類算法[J];福建工程學(xué)院學(xué)報;2014年01期
8 王超;;基于Parzen窗概率密度估計的小樣本選煤數(shù)據(jù)分類算法研究[J];煤炭技術(shù);2014年01期
9 王輝;陳泓予;劉淑芬;;基于改進樸素貝葉斯算法的入侵檢測系統(tǒng)[J];計算機科學(xué);2014年04期
10 陳治平;譚義紅;趙碧海;;基于用戶行為的郵件分類算法[J];計算機應(yīng)用;2014年05期
中國碩士學(xué)位論文全文數(shù)據(jù)庫 前4條
1 韓燁;基于粗糙集理論的垃圾郵件識別方法[D];吉林大學(xué);2012年
2 薛正元;基于云計算技術(shù)的郵件過濾機制研究與實現(xiàn)[D];鄭州大學(xué);2012年
3 項光亮;公安局域網(wǎng)郵件過濾網(wǎng)關(guān)的研究與應(yīng)用[D];電子科技大學(xué);2013年
4 陸春芽;基于決策粗糙集的個性化郵件過濾方法[D];廣西大學(xué);2013年
【二級參考文獻(xiàn)】
中國期刊全文數(shù)據(jù)庫 前9條
1 鄧蔚;秦志光;劉嶠;程紅蓉;;抗好詞攻擊的中文垃圾郵件過濾模型[J];電子測量與儀器學(xué)報;2010年12期
2 李志君;王國胤;吳渝;;基于Rough Set的電子郵件分類系統(tǒng)[J];計算機科學(xué);2004年03期
3 鄧維斌;王國胤;王燕;;基于Rough Set的加權(quán)樸素貝葉斯分類算法[J];計算機科學(xué);2007年02期
4 熊忠陽;杜圣東;張玉芳;;一種改進的支持向量機郵件分類器[J];計算機科學(xué);2007年09期
5 王祖輝;姜維;;基于支持向量機的垃圾郵件過濾方法[J];計算機工程;2009年13期
6 王國胤,于洪,楊大春;基于條件信息熵的決策表約簡[J];計算機學(xué)報;2002年07期
7 惠孛;吳躍;;基于不完全樸素貝葉斯分類模型的垃圾郵件分類模型[J];計算機應(yīng)用;2009年03期
8 陶永才;薛正元;石磊;;基于MapReduce的貝葉斯垃圾郵件過濾機制[J];計算機應(yīng)用;2011年09期
9 唐晉韜;王挺;王戟;;適合復(fù)雜網(wǎng)絡(luò)分析的最短路徑近似算法[J];軟件學(xué)報;2011年10期
【相似文獻(xiàn)】
中國期刊全文數(shù)據(jù)庫 前10條
1 張義;孔穎;朱翔;;基于神經(jīng)網(wǎng)絡(luò)模型的垃圾郵件過濾器的設(shè)計與實現(xiàn)[J];電腦知識與技術(shù);2010年12期
2 周威成,馬素霞,齊林海;一種基于機器學(xué)習(xí)的垃圾郵件智能過濾方法[J];現(xiàn)代電力;2003年01期
3 周瀟;帥建梅;;基于感知學(xué)習(xí)的垃圾郵件過濾算法[J];計算機工程與應(yīng)用;2007年28期
4 陳柄汗;垃圾郵件過濾專家——MailMate[J];電腦技術(shù)-HELLO-IT;2003年09期
5 盛亮;李弼程;林琛;;基于信息粒度原理的垃圾郵件過濾方法[J];信息工程大學(xué)學(xué)報;2007年01期
6 張學(xué)農(nóng);張立成;;基于簡單貝葉斯的中英文垃圾郵件過濾的比較分析[J];計算機應(yīng)用與軟件;2008年08期
7 張學(xué)農(nóng);張立成;;累積反饋學(xué)習(xí)的簡單貝葉斯垃圾郵件過濾[J];計算機應(yīng)用與軟件;2008年10期
8 歐德寧;馬軍;;基于內(nèi)含鏈接特征分析的垃圾郵件過濾技術(shù)[J];鄭州大學(xué)學(xué)報(理學(xué)版);2009年02期
9 余承依;;基于貝葉斯增量分類的郵件過濾研究[J];科學(xué)技術(shù)與工程;2009年09期
10 趙晶瑩;郭海;王玲芬;;基于事例推理的中文垃圾郵件過濾[J];微電子學(xué)與計算機;2009年12期
中國重要會議論文全文數(shù)據(jù)庫 前4條
1 潘文鋒;王斌;于滿泉;譚松波;;Winnow算法在垃圾郵件過濾中的應(yīng)用[A];NCIRCS2004第一屆全國信息檢索與內(nèi)容安全學(xué)術(shù)會議論文集[C];2004年
2 張海雷;王會珍;王安慧;朱靖波;;基于樸素貝葉斯模型的垃圾郵件過濾技術(shù)比較分析[A];全國網(wǎng)絡(luò)與信息安全技術(shù)研討會論文集(下冊)[C];2007年
3 鄧蔚;秦志光;;基于Kolmogorov復(fù)雜性的垃圾信息過濾研究綜述[A];中國電子學(xué)會第十七屆信息論學(xué)術(shù)年會論文集[C];2010年
4 岑芳明;王明文;王鵬鳴;戴玉娟;;基于核偏最小二乘分類的垃圾郵件過濾[A];第四屆全國信息檢索與內(nèi)容安全學(xué)術(shù)會議論文集(上)[C];2008年
中國重要報紙全文數(shù)據(jù)庫 前10條
1 華子;圖解垃圾郵件過濾方法[N];計算機世界;2004年
2 ;測試?yán)]件過濾系統(tǒng)[N];網(wǎng)絡(luò)世界;2003年
3 陳柄汗;垃圾郵件過濾專家-MailMate[N];中國計算機報;2003年
4 湖北 張湘凱;慎用Web郵箱過濾功能[N];電腦報;2002年
5 本報記者 宋麗娜;整體大于部分之和[N];網(wǎng)絡(luò)世界;2004年
6 王修增;慎用Web郵箱過濾功能[N];中國電腦教育報;2004年
7 中國反垃圾郵件聯(lián)盟 王興宇 葉豪;反垃圾郵件方案誰堪重任?[N];計算機世界;2004年
8 ;發(fā)現(xiàn)就處理[N];中國計算機報;2004年
9 星雨;解除垃圾郵件的困擾[N];中國計算機報;2003年
10 沈生;多管齊下清理網(wǎng)上垃圾[N];中國計算機報;2004年
中國博士學(xué)位論文全文數(shù)據(jù)庫 前1條
1 惠孛;基于即時分類的垃圾郵件過濾關(guān)鍵技術(shù)的研究[D];電子科技大學(xué);2009年
中國碩士學(xué)位論文全文數(shù)據(jù)庫 前10條
1 周威成;信息過濾方法的研究與應(yīng)用[D];華北電力大學(xué)(北京);2003年
2 單成海;反垃圾郵件研究[D];電子科技大學(xué);2006年
3 高慶國;基于雙隸屬度模糊支持向量機的郵件過濾[D];哈爾濱理工大學(xué);2009年
4 甘棠儀;基于屬性論方法的垃圾郵件過濾系統(tǒng)設(shè)計與研究[D];上海海事大學(xué);2005年
5 胡可;基于人工免疫系統(tǒng)的信息過濾技術(shù)研究[D];西南交通大學(xué);2006年
6 于洪杰;垃圾郵件過濾技術(shù)算法研究[D];大連海事大學(xué);2007年
7 王悅;Linux下Webmail反垃圾郵件模型的研究與實現(xiàn)[D];沈陽工業(yè)大學(xué);2005年
8 林青;垃圾郵件過濾技術(shù)研究[D];廈門大學(xué);2006年
9 李春玲;文本挖掘在垃圾郵件過濾中的應(yīng)用研究[D];中國人民大學(xué);2008年
10 高加旺;基于支持向量機的垃圾郵件過濾模型研究[D];哈爾濱理工大學(xué);2008年
,本文編號:1239142
本文鏈接:http://sikaile.net/guanlilunwen/ydhl/1239142.html