垃圾郵件過濾中信息增益的改進(jìn)研究
本文關(guān)鍵詞:垃圾郵件過濾中信息增益的改進(jìn)研究
更多相關(guān)文章: 信息增益 特征選擇 垃圾郵件 樸素貝葉斯
【摘要】:針對(duì)垃圾郵件過濾中的特征項(xiàng)選擇問題,提出了一種改進(jìn)的信息增益方法。首先利用特征詞的先驗(yàn)概率定義增益比,然后利用增益比對(duì)特征詞為整個(gè)分類所提供的信息量進(jìn)行放大或弱化,從而對(duì)特征詞的類別條件熵計(jì)算作了改進(jìn),采用極大后驗(yàn)假設(shè)樸素貝葉斯決策方法在英文語料庫上進(jìn)行實(shí)驗(yàn),通過召回率、正確率、精確率和錯(cuò)誤率對(duì)算法進(jìn)行評(píng)價(jià)分析。實(shí)驗(yàn)結(jié)果表明,改進(jìn)后的算法提高了過濾器的分類精度,降低了過濾器對(duì)合法郵件的誤判給用戶帶來的損失。
【作者單位】: 渤海大學(xué);沈陽大學(xué);
【基金】:國(guó)家自然科學(xué)基金(61104106)資助
【分類號(hào)】:TP393.098;TP393.08
【正文快照】: 1引言電子郵件(E-mail)在人們?nèi)粘9ぷ骱蜕钪邪l(fā)揮著越來越重要的作用。與此同時(shí),大量包含欺詐、營(yíng)銷、暴力、色情和病毒等信息的垃圾郵件也隨之產(chǎn)生。垃圾郵件日益泛濫,不僅占據(jù)了大量的網(wǎng)絡(luò)帶寬資源,而且產(chǎn)生一系列嚴(yán)重的網(wǎng)絡(luò)安全問題。針對(duì)垃圾郵件問題的處理,目前主要以
【參考文獻(xiàn)】
中國(guó)期刊全文數(shù)據(jù)庫 前3條
1 鄧維斌;王國(guó)胤;洪智勇;;基于粗糙集的加權(quán)樸素貝葉斯郵件過濾方法[J];計(jì)算機(jī)科學(xué);2011年02期
2 陳孝禮;劉培玉;;應(yīng)用于垃圾郵件過濾的詞序列核[J];計(jì)算機(jī)應(yīng)用;2011年03期
3 黃國(guó)偉;許昱瑋;;基于用戶反饋的混合型垃圾郵件過濾方法[J];計(jì)算機(jī)應(yīng)用;2013年07期
【共引文獻(xiàn)】
中國(guó)期刊全文數(shù)據(jù)庫 前10條
1 翟軍昌;車偉偉;劉艷麗;康建軍;;基于改進(jìn)信息增益的垃圾郵件過濾研究[J];電子設(shè)計(jì)工程;2012年13期
2 趙春生;馮林;蔣勱;李聰;;一種基于DTRS模型與α-正域的郵件過濾方法[J];重慶郵電大學(xué)學(xué)報(bào)(自然科學(xué)版);2013年01期
3 王麗娟;楊習(xí)貝;楊靜宇;吳陳;;基于覆蓋的粗糙集模型比較[J];計(jì)算機(jī)科學(xué);2012年07期
4 翟軍昌;秦玉平;車偉偉;;應(yīng)用特征詞分類貢獻(xiàn)的垃圾郵件過濾研究[J];計(jì)算機(jī)工程與應(yīng)用;2012年34期
5 曾青華;袁家斌;張?jiān)浦?;基于Hadoop的貝葉斯過濾MapReduce模型[J];計(jì)算機(jī)工程;2013年11期
6 翟軍昌;車偉偉;;一種基于條件熵的垃圾郵件過濾算法[J];計(jì)算機(jī)與現(xiàn)代化;2014年02期
7 陳宇;;基于用戶行為的個(gè)性化郵件分類算法[J];福建工程學(xué)院學(xué)報(bào);2014年01期
8 王超;;基于Parzen窗概率密度估計(jì)的小樣本選煤數(shù)據(jù)分類算法研究[J];煤炭技術(shù);2014年01期
9 王輝;陳泓予;劉淑芬;;基于改進(jìn)樸素貝葉斯算法的入侵檢測(cè)系統(tǒng)[J];計(jì)算機(jī)科學(xué);2014年04期
10 陳治平;譚義紅;趙碧海;;基于用戶行為的郵件分類算法[J];計(jì)算機(jī)應(yīng)用;2014年05期
中國(guó)碩士學(xué)位論文全文數(shù)據(jù)庫 前4條
1 韓燁;基于粗糙集理論的垃圾郵件識(shí)別方法[D];吉林大學(xué);2012年
2 薛正元;基于云計(jì)算技術(shù)的郵件過濾機(jī)制研究與實(shí)現(xiàn)[D];鄭州大學(xué);2012年
3 項(xiàng)光亮;公安局域網(wǎng)郵件過濾網(wǎng)關(guān)的研究與應(yīng)用[D];電子科技大學(xué);2013年
4 陸春芽;基于決策粗糙集的個(gè)性化郵件過濾方法[D];廣西大學(xué);2013年
【二級(jí)參考文獻(xiàn)】
中國(guó)期刊全文數(shù)據(jù)庫 前9條
1 鄧蔚;秦志光;劉嶠;程紅蓉;;抗好詞攻擊的中文垃圾郵件過濾模型[J];電子測(cè)量與儀器學(xué)報(bào);2010年12期
2 李志君;王國(guó)胤;吳渝;;基于Rough Set的電子郵件分類系統(tǒng)[J];計(jì)算機(jī)科學(xué);2004年03期
3 鄧維斌;王國(guó)胤;王燕;;基于Rough Set的加權(quán)樸素貝葉斯分類算法[J];計(jì)算機(jī)科學(xué);2007年02期
4 熊忠陽;杜圣東;張玉芳;;一種改進(jìn)的支持向量機(jī)郵件分類器[J];計(jì)算機(jī)科學(xué);2007年09期
5 王祖輝;姜維;;基于支持向量機(jī)的垃圾郵件過濾方法[J];計(jì)算機(jī)工程;2009年13期
6 王國(guó)胤,于洪,楊大春;基于條件信息熵的決策表約簡(jiǎn)[J];計(jì)算機(jī)學(xué)報(bào);2002年07期
7 惠孛;吳躍;;基于不完全樸素貝葉斯分類模型的垃圾郵件分類模型[J];計(jì)算機(jī)應(yīng)用;2009年03期
8 陶永才;薛正元;石磊;;基于MapReduce的貝葉斯垃圾郵件過濾機(jī)制[J];計(jì)算機(jī)應(yīng)用;2011年09期
9 唐晉韜;王挺;王戟;;適合復(fù)雜網(wǎng)絡(luò)分析的最短路徑近似算法[J];軟件學(xué)報(bào);2011年10期
【相似文獻(xiàn)】
中國(guó)期刊全文數(shù)據(jù)庫 前10條
1 張義;孔穎;朱翔;;基于神經(jīng)網(wǎng)絡(luò)模型的垃圾郵件過濾器的設(shè)計(jì)與實(shí)現(xiàn)[J];電腦知識(shí)與技術(shù);2010年12期
2 周威成,馬素霞,齊林海;一種基于機(jī)器學(xué)習(xí)的垃圾郵件智能過濾方法[J];現(xiàn)代電力;2003年01期
3 周瀟;帥建梅;;基于感知學(xué)習(xí)的垃圾郵件過濾算法[J];計(jì)算機(jī)工程與應(yīng)用;2007年28期
4 陳柄汗;垃圾郵件過濾專家——MailMate[J];電腦技術(shù)-HELLO-IT;2003年09期
5 盛亮;李弼程;林琛;;基于信息粒度原理的垃圾郵件過濾方法[J];信息工程大學(xué)學(xué)報(bào);2007年01期
6 張學(xué)農(nóng);張立成;;基于簡(jiǎn)單貝葉斯的中英文垃圾郵件過濾的比較分析[J];計(jì)算機(jī)應(yīng)用與軟件;2008年08期
7 張學(xué)農(nóng);張立成;;累積反饋學(xué)習(xí)的簡(jiǎn)單貝葉斯垃圾郵件過濾[J];計(jì)算機(jī)應(yīng)用與軟件;2008年10期
8 歐德寧;馬軍;;基于內(nèi)含鏈接特征分析的垃圾郵件過濾技術(shù)[J];鄭州大學(xué)學(xué)報(bào)(理學(xué)版);2009年02期
9 余承依;;基于貝葉斯增量分類的郵件過濾研究[J];科學(xué)技術(shù)與工程;2009年09期
10 趙晶瑩;郭海;王玲芬;;基于事例推理的中文垃圾郵件過濾[J];微電子學(xué)與計(jì)算機(jī);2009年12期
中國(guó)重要會(huì)議論文全文數(shù)據(jù)庫 前4條
1 潘文鋒;王斌;于滿泉;譚松波;;Winnow算法在垃圾郵件過濾中的應(yīng)用[A];NCIRCS2004第一屆全國(guó)信息檢索與內(nèi)容安全學(xué)術(shù)會(huì)議論文集[C];2004年
2 張海雷;王會(huì)珍;王安慧;朱靖波;;基于樸素貝葉斯模型的垃圾郵件過濾技術(shù)比較分析[A];全國(guó)網(wǎng)絡(luò)與信息安全技術(shù)研討會(huì)論文集(下冊(cè))[C];2007年
3 鄧蔚;秦志光;;基于Kolmogorov復(fù)雜性的垃圾信息過濾研究綜述[A];中國(guó)電子學(xué)會(huì)第十七屆信息論學(xué)術(shù)年會(huì)論文集[C];2010年
4 岑芳明;王明文;王鵬鳴;戴玉娟;;基于核偏最小二乘分類的垃圾郵件過濾[A];第四屆全國(guó)信息檢索與內(nèi)容安全學(xué)術(shù)會(huì)議論文集(上)[C];2008年
中國(guó)重要報(bào)紙全文數(shù)據(jù)庫 前10條
1 華子;圖解垃圾郵件過濾方法[N];計(jì)算機(jī)世界;2004年
2 ;測(cè)試?yán)]件過濾系統(tǒng)[N];網(wǎng)絡(luò)世界;2003年
3 陳柄汗;垃圾郵件過濾專家-MailMate[N];中國(guó)計(jì)算機(jī)報(bào);2003年
4 湖北 張湘凱;慎用Web郵箱過濾功能[N];電腦報(bào);2002年
5 本報(bào)記者 宋麗娜;整體大于部分之和[N];網(wǎng)絡(luò)世界;2004年
6 王修增;慎用Web郵箱過濾功能[N];中國(guó)電腦教育報(bào);2004年
7 中國(guó)反垃圾郵件聯(lián)盟 王興宇 葉豪;反垃圾郵件方案誰堪重任?[N];計(jì)算機(jī)世界;2004年
8 ;發(fā)現(xiàn)就處理[N];中國(guó)計(jì)算機(jī)報(bào);2004年
9 星雨;解除垃圾郵件的困擾[N];中國(guó)計(jì)算機(jī)報(bào);2003年
10 沈生;多管齊下清理網(wǎng)上垃圾[N];中國(guó)計(jì)算機(jī)報(bào);2004年
中國(guó)博士學(xué)位論文全文數(shù)據(jù)庫 前1條
1 惠孛;基于即時(shí)分類的垃圾郵件過濾關(guān)鍵技術(shù)的研究[D];電子科技大學(xué);2009年
中國(guó)碩士學(xué)位論文全文數(shù)據(jù)庫 前10條
1 周威成;信息過濾方法的研究與應(yīng)用[D];華北電力大學(xué)(北京);2003年
2 單成海;反垃圾郵件研究[D];電子科技大學(xué);2006年
3 高慶國(guó);基于雙隸屬度模糊支持向量機(jī)的郵件過濾[D];哈爾濱理工大學(xué);2009年
4 甘棠儀;基于屬性論方法的垃圾郵件過濾系統(tǒng)設(shè)計(jì)與研究[D];上海海事大學(xué);2005年
5 胡可;基于人工免疫系統(tǒng)的信息過濾技術(shù)研究[D];西南交通大學(xué);2006年
6 于洪杰;垃圾郵件過濾技術(shù)算法研究[D];大連海事大學(xué);2007年
7 王悅;Linux下Webmail反垃圾郵件模型的研究與實(shí)現(xiàn)[D];沈陽工業(yè)大學(xué);2005年
8 林青;垃圾郵件過濾技術(shù)研究[D];廈門大學(xué);2006年
9 李春玲;文本挖掘在垃圾郵件過濾中的應(yīng)用研究[D];中國(guó)人民大學(xué);2008年
10 高加旺;基于支持向量機(jī)的垃圾郵件過濾模型研究[D];哈爾濱理工大學(xué);2008年
,本文編號(hào):1239142
本文鏈接:http://sikaile.net/guanlilunwen/ydhl/1239142.html