改進(jìn)的樸素貝葉斯算法在垃圾郵件過(guò)濾中的研究
本文選題:郵件過(guò)濾 + 樸素貝葉斯; 參考:《通信學(xué)報(bào)》2017年04期
【摘要】:提出了一種利用支持向量機(jī)改進(jìn)的樸素貝葉斯算法——TSVM-NB算法。首先利用NB算法對(duì)樣本集進(jìn)行初次訓(xùn)練,利用支持向量機(jī)構(gòu)造一個(gè)最優(yōu)分類(lèi)超平面,每個(gè)樣本根據(jù)與其距離最近樣本的類(lèi)型是否相同進(jìn)行取舍,這樣既降低樣本空間規(guī)模,又提高每個(gè)樣本類(lèi)別的獨(dú)立性,最后再次用樸素貝葉斯算法訓(xùn)練樣本集從而生成分類(lèi)模型。仿真實(shí)驗(yàn)結(jié)果表明,該算法在樣本空間進(jìn)行取舍過(guò)程當(dāng)中消除了冗余屬性,可以快速得到分類(lèi)特征子集,提高了垃圾郵件過(guò)濾的分類(lèi)速度、召回率和正確率。
[Abstract]:An improved naive Bayesian algorithm based on support vector machine (SVM) is proposed in this paper. First, the NB algorithm is used to train the sample set for the first time, and the support vector mechanism is used to construct an optimal classification hyperplane. Each sample is chosen according to whether the type of the nearest sample is the same or not, so the size of the sample space is reduced. Finally, the naive Bayes algorithm is used to train the sample set to generate the classification model. The simulation results show that the algorithm eliminates redundant attributes in the process of sample space selection and can quickly obtain the classification feature subset and improve the classification speed recall rate and accuracy of spam filtering.
【作者單位】: 哈爾濱工程大學(xué)計(jì)算機(jī)科學(xué)與技術(shù)學(xué)院;中國(guó)科學(xué)院信息工程研究所;
【基金】:國(guó)家自然科學(xué)基金資助項(xiàng)目(No.61202455,No.61472096)~~
【分類(lèi)號(hào)】:TP393.098;TP18
【相似文獻(xiàn)】
相關(guān)期刊論文 前10條
1 張羿;周建國(guó);晏蒲柳;;垃圾郵件過(guò)濾系統(tǒng)的研究與實(shí)現(xiàn)[J];計(jì)算機(jī)工程;2006年18期
2 徐衛(wèi);;一種垃圾郵件過(guò)濾網(wǎng)關(guān)的設(shè)計(jì)[J];電腦知識(shí)與技術(shù);2006年35期
3 項(xiàng)濤;龔儉;丁偉;;垃圾郵件過(guò)濾系統(tǒng)的評(píng)估模型研究[J];計(jì)算機(jī)工程與設(shè)計(jì);2007年18期
4 歐德寧;馬軍;;基于內(nèi)含鏈接特征分析的垃圾郵件過(guò)濾技術(shù)[J];鄭州大學(xué)學(xué)報(bào)(理學(xué)版);2009年02期
5 金彩琴;裘國(guó)永;;對(duì)垃圾郵件過(guò)濾技術(shù)的問(wèn)題研究[J];計(jì)算機(jī)技術(shù)與發(fā)展;2011年09期
6 丁上凌;呂后坤;;垃圾郵件過(guò)濾技術(shù)研究[J];漯河職業(yè)技術(shù)學(xué)院學(xué)報(bào);2012年02期
7 趙文清;一種混合型垃圾郵件過(guò)濾系統(tǒng)的研究與設(shè)計(jì)[J];山西電子技術(shù);2004年06期
8 陳長(zhǎng)偉;劉罡;洪躍楓;;電子垃圾郵件過(guò)濾技術(shù)的應(yīng)用[J];辦公自動(dòng)化;2004年06期
9 劉震,佘X,周明天;基于多級(jí)屬性集的垃圾郵件過(guò)濾技術(shù)[J];計(jì)算機(jī)應(yīng)用研究;2005年07期
10 陳治平;王雷;;基于自學(xué)習(xí)K近鄰的垃圾郵件過(guò)濾算法[J];計(jì)算機(jī)應(yīng)用;2005年S1期
相關(guān)會(huì)議論文 前10條
1 李軍;何曉寧;黃成哲;齊浩亮;雷國(guó)華;;基于特征貢獻(xiàn)度的垃圾郵件過(guò)濾方法[A];第六屆全國(guó)信息檢索學(xué)術(shù)會(huì)議論文集[C];2010年
2 潘文鋒;王斌;譚松波;;貝葉斯垃圾郵件過(guò)濾研究[A];全國(guó)網(wǎng)絡(luò)與信息安全技術(shù)研討會(huì)’2004論文集[C];2004年
3 劉紅翼;;一種垃圾郵件過(guò)濾器的設(shè)計(jì)與實(shí)現(xiàn)[A];廣西計(jì)算機(jī)學(xué)會(huì)2005年學(xué)術(shù)年會(huì)論文集[C];2005年
4 張尼;方濱興;;垃圾郵件過(guò)濾技術(shù)綜述[A];全國(guó)網(wǎng)絡(luò)與信息安全技術(shù)研討會(huì)'2005論文集(下冊(cè))[C];2005年
5 張志斌;施水才;呂學(xué)強(qiáng);;基于貝葉斯方法的中文垃圾郵件過(guò)濾技術(shù)綜述[A];中文信息處理前沿進(jìn)展——中國(guó)中文信息學(xué)會(huì)二十五周年學(xué)術(shù)會(huì)議論文集[C];2006年
6 周立兵;柳景超;;貝葉斯理論在垃圾郵件過(guò)濾中的應(yīng)用分析[A];中國(guó)造船工程學(xué)會(huì)電子技術(shù)學(xué)術(shù)委員會(huì)2006學(xué)術(shù)年會(huì)論文集(上冊(cè))[C];2006年
7 張海雷;王會(huì)珍;王安慧;朱靖波;;基于樸素貝葉斯模型的垃圾郵件過(guò)濾技術(shù)比較分析[A];全國(guó)網(wǎng)絡(luò)與信息安全技術(shù)研討會(huì)論文集(下冊(cè))[C];2007年
8 米淑云;辛陽(yáng);羅群;;一種新型垃圾郵件過(guò)濾系統(tǒng)的設(shè)計(jì)和研究[A];2008通信理論與技術(shù)新進(jìn)展——第十三屆全國(guó)青年通信學(xué)術(shù)會(huì)議論文集(上)[C];2008年
9 岑芳明;王明文;王鵬鳴;戴玉娟;;基于核偏最小二乘分類(lèi)的垃圾郵件過(guò)濾[A];第四屆全國(guó)信息檢索與內(nèi)容安全學(xué)術(shù)會(huì)議論文集(上)[C];2008年
10 牛明珠;;病毒和垃圾郵件過(guò)濾技術(shù)淺析[A];二○○九年全國(guó)電力企業(yè)信息化大會(huì)論文集[C];2009年
相關(guān)重要報(bào)紙文章 前10條
1 ;“垃圾郵件過(guò)濾系統(tǒng)”幾乎沒(méi)有一個(gè)完善的[N];新華每日電訊;2003年
2 ;測(cè)試?yán)]件過(guò)濾系統(tǒng)[N];網(wǎng)絡(luò)世界;2003年
3 本報(bào)記者 高穎;清除網(wǎng)絡(luò)“牛皮癬”勝算幾何?[N];計(jì)算機(jī)世界;2003年
4 John D. Halamka;IT手段的兩面性[N];計(jì)算機(jī)世界;2007年
5 ;不止是垃圾郵件過(guò)濾[N];網(wǎng)絡(luò)世界;2005年
6 ;2003十大網(wǎng)絡(luò)應(yīng)用電子郵箱[N];中國(guó)電腦教育報(bào);2003年
7 本報(bào)記者 李建平;Comdex走向?qū)WN];計(jì)算機(jī)世界;2003年
8 張穎;東西方交流不會(huì)被“垃圾”阻斷[N];中國(guó)經(jīng)營(yíng)報(bào);2002年
9 ;如何選擇和使用UTM設(shè)備[N];網(wǎng)絡(luò)世界;2009年
10 ;用戶(hù)關(guān)心的問(wèn)題:MSN 8值嗎?[N];計(jì)算機(jī)世界;2002年
相關(guān)博士學(xué)位論文 前5條
1 董建設(shè);協(xié)作式垃圾郵件過(guò)濾關(guān)鍵技術(shù)研究[D];蘭州理工大學(xué);2009年
2 惠孛;基于即時(shí)分類(lèi)的垃圾郵件過(guò)濾關(guān)鍵技術(shù)的研究[D];電子科技大學(xué);2009年
3 鄧蔚;垃圾郵件過(guò)濾中的敵手分類(lèi)問(wèn)題研究[D];電子科技大學(xué);2011年
4 孫晶濤;基于內(nèi)容的垃圾郵件過(guò)濾技術(shù)研究[D];蘭州理工大學(xué);2010年
5 張澤明;人工免疫算法及其應(yīng)用研究[D];中國(guó)科學(xué)技術(shù)大學(xué);2007年
相關(guān)碩士學(xué)位論文 前10條
1 甘棠儀;基于屬性論方法的垃圾郵件過(guò)濾系統(tǒng)設(shè)計(jì)與研究[D];上海海事大學(xué);2005年
2 王申;基于內(nèi)容的垃圾郵件過(guò)濾技術(shù)的若干研究[D];中國(guó)科學(xué)院研究生院(計(jì)算技術(shù)研究所);2005年
3 田月霞;基于疫苗機(jī)制的垃圾郵件過(guò)濾模型的研究[D];鄭州輕工業(yè)學(xué)院;2015年
4 鄧曾;遺傳算法和貝葉斯模型在垃圾郵件過(guò)濾中的應(yīng)用[D];電子科技大學(xué);2015年
5 徐兆志;基于AAPE分類(lèi)模型的垃圾郵件過(guò)濾技術(shù)的研究與實(shí)現(xiàn)[D];電子科技大學(xué);2014年
6 次曲(Tse Qu);基于樸素貝葉斯算法的藏文垃圾郵件過(guò)濾關(guān)鍵技術(shù)研究[D];電子科技大學(xué);2013年
7 王浩;基于發(fā)送方異常行為檢測(cè)的垃圾郵件過(guò)濾系統(tǒng)的研究與實(shí)現(xiàn)[D];東北大學(xué);2013年
8 陸元;基于多特征融合的垃圾郵件過(guò)濾系統(tǒng)[D];重慶大學(xué);2015年
9 魏如玉;中文垃圾郵件過(guò)濾方法的研究[D];遼寧大學(xué);2016年
10 胡瑋;基于語(yǔ)義的垃圾郵件過(guò)濾技術(shù)的研究[D];重慶大學(xué);2016年
,本文編號(hào):1932248
本文鏈接:http://sikaile.net/kejilunwen/zidonghuakongzhilunwen/1932248.html