基于RSSI的貝葉斯垃圾郵件過濾算法
本文關鍵詞:基于RSSI的貝葉斯垃圾郵件過濾算法
更多相關文章: 郵件分類 貝葉斯分類器 特征提取 多項式事件模型 過擬合
【摘要】:針對現(xiàn)有貝葉斯算法應用于垃圾郵件過濾時,貝努利模型精度低、不能區(qū)分文本特征重要性、多項式模型計算量大、無關特征項浪費計算時間、對出現(xiàn)次數(shù)少的特征項反應敏感等缺點,提出RSSI(remove similar and sensitive items)特征模型。通過計算并比較特征項出現(xiàn)的頻率,去除無關和敏感特征項,減小運算量,增加正確率,減少過擬合。Matlab仿真結果表明,與現(xiàn)有的樸素貝葉斯算法(na錵ve Bayes)和支持向量機(support vector machine,SVM)等算法相比,RSSI算法能顯著減少分類時間,降低合法郵件被誤判的概率。
【作者單位】: 鄭州大學電氣工程學院;
【基金】:教育部高等學校博士學科點專項科研基金項目(20114101110005)
【分類號】:TP393.098
【正文快照】: 0引言基于內容的垃圾郵件過濾法比一般白名單與黑名單技術、規(guī)則過濾以及基于關鍵詞匹配的內容掃描等智能化程度高,可采用屬于有監(jiān)督學習的樸素貝葉斯分類器,實踐結果表明分類效果佳。其中,貝葉斯過濾器是基于文本的過濾技術,準確率較高,但是,現(xiàn)有樸素貝葉斯分類器基于一個假
【參考文獻】
中國期刊全文數(shù)據(jù)庫 前5條
1 劉紅芝;;中文分詞技術的研究[J];電腦開發(fā)與應用;2010年03期
2 楊凱峰;張毅坤;李燕;;基于文檔頻率的特征選擇方法[J];計算機工程;2010年17期
3 符會濤;卡米力·木衣丁;;一種改進的文本特征選擇方法的研究與設計[J];計算機應用與軟件;2011年04期
4 鄭冬冬;宋順林;;圖片垃圾郵件過濾技術綜述[J];計算機工程與設計;2010年01期
5 李瀟;羅軍勇;尹美娟;;基于結構特征分析與文本分類的郵件篩選[J];計算機工程與設計;2010年21期
【共引文獻】
中國期刊全文數(shù)據(jù)庫 前10條
1 于洪波;;中文分詞技術研究[J];東莞理工學院學報;2010年05期
2 陳玫;蒙祖強;;面向醫(yī)學知識的中文分詞詞典設計與實現(xiàn)[J];大眾科技;2010年11期
3 陳凱星;陳建英;;一種改進的基于樸素貝葉斯算法的垃圾短信過濾技術[J];福建電腦;2014年03期
4 張宇;汪豐;黃海誠;喬子晏;;基于Web的高血壓非藥物治療知識庫構建[J];工業(yè)控制計算機;2014年05期
5 謝小民;;基于貝葉斯的垃圾郵件過濾算法設計研究[J];電子技術與軟件工程;2014年15期
6 郭俊楓;趙仁亮;鄭嬌龍;;面向網(wǎng)頁文本的地理要素變化發(fā)現(xiàn)[J];地理信息世界;2015年01期
7 胡龍茂;;中文文本分類技術比較研究[J];安慶師范學院學報(自然科學版);2015年02期
8 陳二恒;賀德強;劉建仁;向偉彬;周繼續(xù);;基于小波包和貝葉斯分類的機車走行部滾動軸承故障診斷研究[J];鐵道科學與工程學報;2015年03期
9 武毅;鐘志農(nóng);;基于Lucene.Net的安全信息系統(tǒng)全文檢索引擎的設計與實現(xiàn)[J];計算機與信息技術;2011年Z2期
10 王剛;劉元寧;張曉旭;趙正東;朱曉冬;劉震;;基于模糊自適應粒子群的垃圾郵件過濾新方法[J];吉林大學學報(工學版);2011年03期
中國重要會議論文全文數(shù)據(jù)庫 前1條
1 鄧蔚;秦志光;;基于Kolmogorov復雜性的垃圾信息過濾研究綜述[A];中國電子學會第十七屆信息論學術年會論文集[C];2010年
中國博士學位論文全文數(shù)據(jù)庫 前6條
1 鄧蔚;垃圾郵件過濾中的敵手分類問題研究[D];電子科技大學;2011年
2 劉伍穎;面向垃圾信息過濾的主動多域學習文本分類方法研究[D];國防科學技術大學;2011年
3 李偉;基于內容的漢語語音檢索技術研究與系統(tǒng)實現(xiàn)[D];清華大學;2011年
4 宋強;中國互聯(lián)網(wǎng)低俗內容監(jiān)管研究[D];北京郵電大學;2012年
5 夏虎;移動社交網(wǎng)絡結構和行為研究及其應用[D];電子科技大學;2012年
6 董堅峰;面向公共危機預警的網(wǎng)絡輿情分析研究[D];武漢大學;2013年
中國碩士學位論文全文數(shù)據(jù)庫 前10條
1 呂萬里;中文文本分類技術研究[D];山東科技大學;2010年
2 胡少榮;一種輿情信息預處理平臺的研究與實現(xiàn)[D];北京交通大學;2010年
3 戴雪梅;面向購物的聚類搜索引擎的研究與實現(xiàn)[D];北京交通大學;2011年
4 王榮;智能手機入侵檢測系統(tǒng)的研究[D];北京交通大學;2011年
5 王詢;面向航運領域的文本分類系統(tǒng)[D];大連海事大學;2011年
6 魏莎莎;一種中文未登錄詞識別及詞典設計新方法[D];西南大學;2011年
7 徐西孟;基于OODA決策循環(huán)的主題發(fā)現(xiàn)技術的研究與設計[D];濟南大學;2011年
8 符會濤;基于互信息的文本自動分類特征選擇方法研究[D];新疆大學;2011年
9 董平;關聯(lián)特征提取與貝葉斯網(wǎng)絡的文本分類研究[D];華南理工大學;2011年
10 王超;基于圖像底層特征的圖像型垃圾郵件識別研究[D];電子科技大學;2011年
【二級參考文獻】
中國期刊全文數(shù)據(jù)庫 前10條
1 胡錫衡;;正向最大匹配法在中文分詞技術中的應用[J];鞍山師范學院學報;2008年02期
2 孫鐵利,楊鳳芹;根據(jù)用戶隱式反饋建立和更新用戶興趣模型[J];東北師大學報(自然科學版);2003年03期
3 何培舟;溫向明;鄭偉;;圖像垃圾郵件的發(fā)展和防范[J];電信科學;2008年07期
4 于金龍,李曉紅,孫立新;連續(xù)屬性值的整體離散化[J];哈爾濱工業(yè)大學學報;2000年03期
5 林珊,寧國寧,趙之霖;中文分詞在郵件過濾系統(tǒng)中的應用[J];華南理工大學學報(自然科學版);2004年S1期
6 尚文倩;黃厚寬;劉玉玲;林永民;瞿有利;董紅斌;;文本分類中基于基尼指數(shù)的特征選擇算法研究[J];計算機研究與發(fā)展;2006年10期
7 譚瓊,史忠植;分詞中的歧義處理[J];計算機工程與應用;2002年11期
8 單松巍,馮是聰,李曉明;幾種典型特征選取方法在中文網(wǎng)頁分類上的效果比較[J];計算機工程與應用;2003年22期
9 徐鳳亞,羅振聲;文本自動分類中特征權重算法的改進研究[J];計算機工程與應用;2005年01期
10 呂震宇;林永民;趙爽;陳景年;朱衛(wèi)東;;基于類信息的文本特征選擇與加權算法研究[J];計算機工程與應用;2008年20期
中國碩士學位論文全文數(shù)據(jù)庫 前2條
1 潘文鋒;基于內容的垃圾郵件過濾研究[D];中國科學院研究生院(計算技術研究所);2004年
2 李東林;中文信息過濾技術的研究與應用[D];遼寧科技大學;2006年
【相似文獻】
中國期刊全文數(shù)據(jù)庫 前10條
1 陳長偉;劉罡;洪躍楓;;電子垃圾郵件過濾技術的應用[J];辦公自動化;2004年06期
2 劉震,佘X,周明天;基于多級屬性集的垃圾郵件過濾技術[J];計算機應用研究;2005年07期
3 陳治平;王雷;;基于自學習K近鄰的垃圾郵件過濾算法[J];計算機應用;2005年S1期
4 李星;田瑩;段海新;;中文垃圾郵件過濾系統(tǒng)的實現(xiàn)和評估[J];大連理工大學學報;2005年S1期
5 劉紅翼;;一種垃圾郵件過濾器的設計與實現(xiàn)[J];廣西科學院學報;2005年04期
6 詹川;盧顯良;周旭;侯孟書;袁連海;;基于貝葉斯公式的垃圾郵件過濾方法[J];計算機科學;2005年02期
7 張強;;基于阻斷發(fā)送源的垃圾郵件過濾技術[J];網(wǎng)絡安全技術與應用;2006年02期
8 胡永杰;卜紅霞;;垃圾郵件過濾技術研究[J];河北師范大學學報;2006年02期
9 王倩倩;段震;;基于神經(jīng)網(wǎng)絡的垃圾郵件過濾[J];合肥學院學報(自然科學版);2006年01期
10 袁耀文;盛勵;;基于信息免疫技術的垃圾郵件過濾技術[J];計算機應用研究;2006年05期
中國重要會議論文全文數(shù)據(jù)庫 前10條
1 李軍;何曉寧;黃成哲;齊浩亮;雷國華;;基于特征貢獻度的垃圾郵件過濾方法[A];第六屆全國信息檢索學術會議論文集[C];2010年
2 潘文鋒;王斌;譚松波;;貝葉斯垃圾郵件過濾研究[A];全國網(wǎng)絡與信息安全技術研討會’2004論文集[C];2004年
3 劉紅翼;;一種垃圾郵件過濾器的設計與實現(xiàn)[A];廣西計算機學會2005年學術年會論文集[C];2005年
4 張尼;方濱興;;垃圾郵件過濾技術綜述[A];全國網(wǎng)絡與信息安全技術研討會'2005論文集(下冊)[C];2005年
5 張志斌;施水才;呂學強;;基于貝葉斯方法的中文垃圾郵件過濾技術綜述[A];中文信息處理前沿進展——中國中文信息學會二十五周年學術會議論文集[C];2006年
6 周立兵;柳景超;;貝葉斯理論在垃圾郵件過濾中的應用分析[A];中國造船工程學會電子技術學術委員會2006學術年會論文集(上冊)[C];2006年
7 張海雷;王會珍;王安慧;朱靖波;;基于樸素貝葉斯模型的垃圾郵件過濾技術比較分析[A];全國網(wǎng)絡與信息安全技術研討會論文集(下冊)[C];2007年
8 米淑云;辛陽;羅群;;一種新型垃圾郵件過濾系統(tǒng)的設計和研究[A];2008通信理論與技術新進展——第十三屆全國青年通信學術會議論文集(上)[C];2008年
9 岑芳明;王明文;王鵬鳴;戴玉娟;;基于核偏最小二乘分類的垃圾郵件過濾[A];第四屆全國信息檢索與內容安全學術會議論文集(上)[C];2008年
10 牛明珠;;病毒和垃圾郵件過濾技術淺析[A];二○○九年全國電力企業(yè)信息化大會論文集[C];2009年
中國重要報紙全文數(shù)據(jù)庫 前10條
1 ;測試垃圾郵件過濾系統(tǒng)[N];網(wǎng)絡世界;2003年
2 ;如何選擇和使用UTM設備[N];網(wǎng)絡世界;2009年
3 本報記者 朱杰;中小企業(yè)網(wǎng)絡也能云安全[N];中國計算機報;2009年
4 本報記者 宋麗娜;整合安全平臺的魅力[N];網(wǎng)絡世界;2004年
5 宋偉;終結混合威脅攻擊[N];中國計算機報;2004年
6 湖北 張湘凱;慎用Web郵箱過濾功能[N];電腦報;2002年
7 張振;CA eTrust Secure Content Manager提升運營效率[N];電腦商報;2003年
8 雷雷;如虎添翼加入UTM的3D-SMP[N];科技日報;2006年
9 記者 馬霞;下一代防火墻整體性能達320G[N];科技日報;2012年
10 ;FCI過濾惡意流量[N];中國計算機報;2004年
中國博士學位論文全文數(shù)據(jù)庫 前4條
1 董建設;協(xié)作式垃圾郵件過濾關鍵技術研究[D];蘭州理工大學;2009年
2 惠孛;基于即時分類的垃圾郵件過濾關鍵技術的研究[D];電子科技大學;2009年
3 鄧蔚;垃圾郵件過濾中的敵手分類問題研究[D];電子科技大學;2011年
4 孫晶濤;基于內容的垃圾郵件過濾技術研究[D];蘭州理工大學;2010年
中國碩士學位論文全文數(shù)據(jù)庫 前10條
1 陳俊偉;圖片垃圾郵件過濾系統(tǒng)[D];華東師范大學;2009年
2 徐雋;基于流數(shù)據(jù)特性的垃圾郵件過濾技術研究[D];復旦大學;2009年
3 林偉;基于貝葉斯分類的垃圾郵件過濾系統(tǒng)研究與實現(xiàn)[D];西華大學;2009年
4 徐熙;基于內容的多級垃圾郵件過濾系統(tǒng)研究[D];西華大學;2009年
5 盧揚竹;基于內容的垃圾郵件過濾技術研究[D];西南交通大學;2009年
6 鄭春光;基于免疫的垃圾郵件過濾技術研究[D];哈爾濱理工大學;2009年
7 歐德寧;垃圾郵件過濾技術研究[D];山東大學;2009年
8 王志波;基于數(shù)據(jù)挖掘的垃圾郵件過濾技術研究[D];陜西師范大學;2009年
9 王劍;惰性學習分類法在垃圾郵件過濾中的應用研究[D];上海師范大學;2009年
10 孫雪;基于內容的垃圾郵件過濾系統(tǒng)研究[D];河北大學;2010年
,本文編號:1189892
本文鏈接:http://sikaile.net/guanlilunwen/ydhl/1189892.html