基于多項(xiàng)式模型和低風(fēng)險(xiǎn)的貝葉斯垃圾郵件過濾算法
[Abstract]:When the existing Bayesian algorithm is applied to spam filtering, Bayesian Bernoulli model can not distinguish the importance of message text feature vector, which leads to low recall rate of mail classification. At the same time, there is the risk of legal mail being misjudged. Bayesian polynomial model is used to weight the feature vector to distinguish the importance of feature vector, and then the low risk strategy is adopted to reduce the risk of legal mail misjudgment. A Bayesian spam filtering algorithm based on polynomial model and low risk is proposed. Experimental results show that the algorithm can effectively improve the accuracy and recall rate of mail classification, reduce the risk of legal mail misjudgment, and have a stable performance when filtering messages with large number of text characters. Characteristic of being less volatile.
【作者單位】: 湖南大學(xué)信息科學(xué)與工程學(xué)院;
【基金】:國家自然科學(xué)基金資助項(xiàng)目(61272401,61133005,61173167,61070194) 國家高技術(shù)研究發(fā)展計(jì)劃(“973”計(jì)劃)子項(xiàng)目(2012CB315801)
【分類號(hào)】:TP393.098
【參考文獻(xiàn)】
相關(guān)期刊論文 前4條
1 于金龍,李曉紅,孫立新;連續(xù)屬性值的整體離散化[J];哈爾濱工業(yè)大學(xué)學(xué)報(bào);2000年03期
2 林珊,寧國寧,趙之霖;中文分詞在郵件過濾系統(tǒng)中的應(yīng)用[J];華南理工大學(xué)學(xué)報(bào)(自然科學(xué)版);2004年S1期
3 張文良;黃亞樓;倪維健;;基于差分貢獻(xiàn)的垃圾郵件過濾特征選擇方法[J];計(jì)算機(jī)工程;2007年08期
4 蘇貴洋,馬穎華,李建華;一種基于內(nèi)容的信息過濾改進(jìn)模型[J];上海交通大學(xué)學(xué)報(bào);2004年12期
【共引文獻(xiàn)】
相關(guān)期刊論文 前10條
1 張付志;伍朝輝;姚芳;;基于貝葉斯算法的垃圾郵件過濾技術(shù)的研究與改進(jìn)[J];燕山大學(xué)學(xué)報(bào);2009年01期
2 張利;張立勇;張曉淼;耿鐵鎖;岳宗閣;;基于改進(jìn)BP網(wǎng)絡(luò)的中文歧義字段分詞方法研究[J];大連理工大學(xué)學(xué)報(bào);2007年01期
3 楊敏;宋暉;;基于文本的安全過濾研究[J];計(jì)算機(jī)安全;2009年05期
4 黃保華;霍林;;內(nèi)容安全研究進(jìn)展與教學(xué)內(nèi)容選擇[J];大眾科技;2012年02期
5 涂智壽;數(shù)據(jù)開采若干新方法研究[J];信息技術(shù);2002年06期
6 劉斌;倪志偉;趙敏;;基于屬性重要性的貪心算法的改進(jìn)算法[J];合肥工業(yè)大學(xué)學(xué)報(bào)(自然科學(xué)版);2010年08期
7 李學(xué)勇;高國紅;孫甲霞;;基于互信息和K-means聚類的信息安全風(fēng)險(xiǎn)評(píng)估[J];河南師范大學(xué)學(xué)報(bào)(自然科學(xué)版);2011年02期
8 朱磊;沈煥生;;一種基于數(shù)字水印和信息內(nèi)容的網(wǎng)絡(luò)信息安全技術(shù)[J];解放軍理工大學(xué)學(xué)報(bào)(自然科學(xué)版);2010年01期
9 李艷玲;;基于內(nèi)容的不良信息文本實(shí)時(shí)識(shí)別方法研究[J];計(jì)算機(jī)與信息技術(shù);2007年05期
10 李鈍;曹元大;萬月亮;;基于關(guān)聯(lián)規(guī)則的安全特色關(guān)鍵詞提取研究[J];計(jì)算機(jī)工程與應(yīng)用;2006年S1期
相關(guān)博士學(xué)位論文 前7條
1 張登峰;動(dòng)態(tài)系統(tǒng)的故障檢測與診斷研究[D];南京理工大學(xué);2003年
2 譚天樂;基于粗糙集的過程建模、控制與故障診斷[D];浙江大學(xué);2003年
3 鄧發(fā)云;基于用戶需求的信息可信度研究[D];西南交通大學(xué);2006年
4 劉云霞;數(shù)據(jù)歸約的統(tǒng)計(jì)方法研究及應(yīng)用[D];廈門大學(xué);2007年
5 鄧林;網(wǎng)絡(luò)信息安全防護(hù)理論與方法的研究[D];合肥工業(yè)大學(xué);2009年
6 周科松;全文檢索與GIS一體化及在應(yīng)急管理中的應(yīng)用研究[D];華東師范大學(xué);2009年
7 叢蓉;作戰(zhàn)指揮決策支持系統(tǒng)目標(biāo)融合識(shí)別研究[D];大連理工大學(xué);2010年
相關(guān)碩士學(xué)位論文 前10條
1 劉明珠;基于粗糙集理論的沉積微相識(shí)別方法研究[D];中國海洋大學(xué);2010年
2 李霞;文本過濾防火墻技術(shù)研究[D];北方工業(yè)大學(xué);2011年
3 李健;數(shù)據(jù)驅(qū)動(dòng)的電站運(yùn)行優(yōu)化目標(biāo)值研究[D];華北電力大學(xué)(北京);2011年
4 王曉燕;計(jì)算機(jī)病毒傳播模型及檢測研究[D];華中師范大學(xué);2011年
5 古麗拜天.卡米爾;基于Web數(shù)據(jù)挖掘的智能推薦研究[D];中南大學(xué);2010年
6 文敬斌;基于網(wǎng)絡(luò)設(shè)備的網(wǎng)頁過濾設(shè)計(jì)與實(shí)現(xiàn)[D];電子科技大學(xué);2011年
7 趙愛國;基于Web的PGP安全電子郵件系統(tǒng)研究與實(shí)現(xiàn)[D];解放軍信息工程大學(xué);2009年
8 隋福寧;面向信息服務(wù)的Web文本分類技術(shù)研究[D];國防科學(xué)技術(shù)大學(xué);2010年
9 李真;多值數(shù)據(jù)轉(zhuǎn)換成單值定性符號(hào)的數(shù)學(xué)方法研究[D];燕山大學(xué);2012年
10 唐玲;基于粗集理論的大曲理化指標(biāo)重要性研究[D];電子科技大學(xué);2011年
【二級(jí)參考文獻(xiàn)】
相關(guān)期刊論文 前4條
1 蔡立軍,施榮華;一種新的電子郵件過濾系統(tǒng)模型的設(shè)計(jì)[J];計(jì)算機(jī)工程;2003年16期
2 洪家榮;示例式學(xué)習(xí)及多功能學(xué)習(xí)系統(tǒng)AE5[J];計(jì)算機(jī)學(xué)報(bào);1989年02期
3 王科,高常波,翟雪峰,羅萬伯;漢語分詞的主要技術(shù)及其應(yīng)用展望[J];通信技術(shù);2003年06期
4 黃],符紹宏;自動(dòng)分詞技術(shù)及其在信息檢索中應(yīng)用的研究[J];現(xiàn)代圖書情報(bào)技術(shù);2001年03期
【相似文獻(xiàn)】
相關(guān)期刊論文 前10條
1 卓高明;林世平;;郵件過濾中信息增益方法的改進(jìn)[J];計(jì)算機(jī)工程與應(yīng)用;2006年S1期
2 李文斌;劉椿年;陳嶷瑛;;基于混合高斯模型的電子郵件多過濾器融合方法[J];電子學(xué)報(bào);2006年02期
3 司廣濤;朱巧明;李培峰;;基于最大熵方法的垃圾郵件過濾插件的設(shè)計(jì)與實(shí)現(xiàn)[J];計(jì)算機(jī)應(yīng)用研究;2007年05期
4 石義;錢步仁;;基于內(nèi)容與行為特征的反垃圾郵件系統(tǒng)[J];網(wǎng)絡(luò)安全技術(shù)與應(yīng)用;2009年04期
5 祁巍;李一軍;李英來;謝偉全;;智能化企業(yè)電子郵件分類管理模型研究[J];中國軟科學(xué);2007年08期
6 蔡健,黃國興,謝孟軍;基于數(shù)據(jù)挖掘方法的電子郵件過濾[J];微型電腦應(yīng)用;2001年08期
7 張昕;馬力;王娟;;淺析反垃圾郵件技術(shù)[J];網(wǎng)絡(luò)安全技術(shù)與應(yīng)用;2006年05期
8 李雯;劉培玉;;基于貝葉斯的垃圾郵件過濾算法的研究[J];計(jì)算機(jī)工程與應(yīng)用;2007年23期
9 劉霞;;基于ISO27001的信息安全管理體系規(guī)劃[J];電腦知識(shí)與技術(shù);2010年10期
10 敖挺,胡昌振;多層次立體防護(hù)——基于風(fēng)險(xiǎn)評(píng)估的網(wǎng)絡(luò)安全體系研究及系統(tǒng)實(shí)現(xiàn)[J];計(jì)算機(jī)安全;2004年10期
相關(guān)會(huì)議論文 前10條
1 周振宇;沈建京;;基于多Agent的網(wǎng)絡(luò)安全風(fēng)險(xiǎn)評(píng)估系統(tǒng)模型[A];2005年中國智能自動(dòng)化會(huì)議論文集[C];2005年
2 陳曦;曾凡鋒;;數(shù)據(jù)挖掘算法在風(fēng)險(xiǎn)評(píng)估中的應(yīng)用[A];2007通信理論與技術(shù)新發(fā)展——第十二屆全國青年通信學(xué)術(shù)會(huì)議論文集(上冊)[C];2007年
3 侯紅霞;郭曙光;范九倫;;基于SSE-CMM的數(shù)據(jù)網(wǎng)風(fēng)險(xiǎn)評(píng)估方法研究[A];2008'中國信息技術(shù)與應(yīng)用學(xué)術(shù)論壇論文集(一)[C];2008年
4 陳琴;;基于GA-SOM網(wǎng)絡(luò)的垃圾郵件的特征提取的研究[A];全國第19屆計(jì)算機(jī)技術(shù)與應(yīng)用(CACIS)學(xué)術(shù)會(huì)議論文集(下冊)[C];2008年
5 丁愛鵬;;基于熵權(quán)系數(shù)法的網(wǎng)絡(luò)安全風(fēng)險(xiǎn)評(píng)估及其在電信網(wǎng)絡(luò)中的應(yīng)用[A];2008通信理論與技術(shù)新進(jìn)展——第十三屆全國青年通信學(xué)術(shù)會(huì)議論文集(上)[C];2008年
6 劉欣然;;一種新型網(wǎng)絡(luò)攻擊分類體系[A];全國網(wǎng)絡(luò)與信息安全技術(shù)研討會(huì)'2005論文集(上冊)[C];2005年
7 趙洪松;;一種基于CVE特征的IDS規(guī)則庫[A];黑龍江省通信學(xué)會(huì)學(xué)術(shù)年會(huì)論文集[C];2005年
8 辛毅;方濱興;賀龍濤;云曉春;李志東;;基于通信特征分析的蠕蟲檢測和特征提取方法的研究[A];全國網(wǎng)絡(luò)與信息安全技術(shù)研討會(huì)論文集(上冊)[C];2007年
9 馬驍;王曉龍;王軒;卜永忠;;基于網(wǎng)頁信息結(jié)構(gòu)的網(wǎng)頁體裁聚類分析[A];第四屆全國信息檢索與內(nèi)容安全學(xué)術(shù)會(huì)議論文集(上)[C];2008年
10 蘇繼斌;肖宗水;肖迎杰;;一種基于滲透圖的風(fēng)險(xiǎn)評(píng)估分析與實(shí)現(xiàn)[A];全國第19屆計(jì)算機(jī)技術(shù)與應(yīng)用(CACIS)學(xué)術(shù)會(huì)議論文集(下冊)[C];2008年
相關(guān)重要報(bào)紙文章 前10條
1 本報(bào)記者 邊歆;云計(jì)算的七宗罪[N];網(wǎng)絡(luò)世界;2010年
2 喬珊;備份你的郵件過濾規(guī)則[N];電腦報(bào);2004年
3 鄭惠榮;利用人工智能進(jìn)行郵件過濾[N];中國計(jì)算機(jī)報(bào);2003年
4 ;冠群金辰赤宵KILL郵件過濾網(wǎng)關(guān)— 采用獨(dú)立的硬件平臺(tái)殺毒[N];計(jì)算機(jī)世界;2003年
5 唐慧;讓電子郵件更安全[N];網(wǎng)絡(luò)世界;2002年
6 溫遠(yuǎn);構(gòu)筑E-mail安全堡壘[N];中國電子報(bào);2003年
7 編譯 沈建苗;網(wǎng)絡(luò)安全的五大秘密[N];計(jì)算機(jī)世界;2005年
8 ;Sobig.F緣何成為網(wǎng)絡(luò)[殺手][N];中國電腦教育報(bào);2003年
9 吳倩;讓E-mail更安全[N];中國計(jì)算機(jī)報(bào);2002年
10 范紅;安全風(fēng)險(xiǎn)評(píng)估現(xiàn)狀與展望[N];中國計(jì)算機(jī)報(bào);2005年
相關(guān)博士學(xué)位論文 前10條
1 鄧蔚;垃圾郵件過濾中的敵手分類問題研究[D];電子科技大學(xué);2011年
2 董建設(shè);協(xié)作式垃圾郵件過濾關(guān)鍵技術(shù)研究[D];蘭州理工大學(xué);2009年
3 涂浩;蠕蟲自動(dòng)防御的關(guān)鍵問題研究[D];華中科技大學(xué);2008年
4 田旭;互聯(lián)網(wǎng)流量識(shí)別技術(shù)研究[D];北京郵電大學(xué);2012年
5 呂鎮(zhèn)邦;模糊認(rèn)知與關(guān)聯(lián)融合在信息安全保障中的應(yīng)用[D];西安電子科技大學(xué);2008年
6 胡燕;基于Web信息抽取的專業(yè)知識(shí)獲取方法研究[D];武漢理工大學(xué);2007年
7 鄧林;網(wǎng)絡(luò)信息安全防護(hù)理論與方法的研究[D];合肥工業(yè)大學(xué);2009年
8 王海龍;僵尸網(wǎng)絡(luò)檢測關(guān)鍵技術(shù)研究[D];國防科學(xué)技術(shù)大學(xué);2011年
9 彭俊好;信息安全風(fēng)險(xiǎn)評(píng)估及網(wǎng)絡(luò)蠕蟲傳播模型[D];北京郵電大學(xué);2008年
10 王文惠;基于內(nèi)容的圖像檢索技術(shù)研究[D];國防科學(xué)技術(shù)大學(xué);2001年
相關(guān)碩士學(xué)位論文 前10條
1 楊盛;電子郵件過濾系統(tǒng)的研究與設(shè)計(jì)[D];中南大學(xué);2005年
2 吳碩;基于信息融合準(zhǔn)則的郵件過濾系統(tǒng)的研究與實(shí)現(xiàn)[D];北京郵電大學(xué);2008年
3 楊大偉;基于Sendmail的電子郵件網(wǎng)關(guān)系統(tǒng)設(shè)計(jì)與實(shí)現(xiàn)[D];哈爾濱工程大學(xué);2005年
4 李學(xué)勇;基于三層網(wǎng)絡(luò)設(shè)備的郵件過濾系統(tǒng)[D];華北工學(xué)院;2003年
5 呂栗;郵件過濾系統(tǒng)中數(shù)據(jù)庫的性能優(yōu)化[D];哈爾濱工程大學(xué);2005年
6 肖明;基于SVM的智能郵件過濾系統(tǒng)研究與實(shí)現(xiàn)[D];電子科技大學(xué);2005年
7 楊麗華;基于內(nèi)容的垃圾郵件過濾技術(shù)研究[D];西南交通大學(xué);2006年
8 周波;信息安全風(fēng)險(xiǎn)評(píng)估技術(shù)的研究[D];南京航空航天大學(xué);2010年
9 石霞軍;郵件信息過濾算法研究與實(shí)現(xiàn)[D];湖南大學(xué);2002年
10 周俊怡;一種混合垃圾郵件過濾技術(shù)研究[D];電子科技大學(xué);2009年
,本文編號(hào):2184492
本文鏈接:http://sikaile.net/guanlilunwen/ydhl/2184492.html