基于短語(yǔ)的貝葉斯中文垃圾郵件過濾方法
本文關(guān)鍵詞:基于短語(yǔ)的貝葉斯中文垃圾郵件過濾方法
更多相關(guān)文章: 垃圾郵件過濾 貝葉斯 特征項(xiàng)提取 基于短語(yǔ) 中文分詞
【摘要】:樸素貝葉斯算法在垃圾郵件過濾領(lǐng)域得到了廣泛應(yīng)用,該算法中,特征提取是一個(gè)必不可少的環(huán)節(jié)。過去針對(duì)中文的垃圾郵件過濾方法都以詞作為文本的特征項(xiàng)單位進(jìn)行提取,面對(duì)大規(guī)模的郵件訓(xùn)練樣本,這種算法的時(shí)間效率會(huì)成為郵件過濾技術(shù)中的一個(gè)瓶頸。對(duì)此,提出一種基于短語(yǔ)的貝葉斯中文垃圾郵件過濾方法,在特征項(xiàng)提取階段結(jié)合文本分類領(lǐng)域提出的新的短語(yǔ)分析方法,按照基本名詞短語(yǔ)、基本動(dòng)詞短語(yǔ)、基本語(yǔ)義分析規(guī)則,以短語(yǔ)為單位進(jìn)行提取。通過分別以詞和短語(yǔ)為單位進(jìn)行垃圾郵件過濾的對(duì)比測(cè)試實(shí)驗(yàn)證實(shí)了所提出方法的有效性。
【作者單位】: 遼寧大學(xué)信息學(xué)院;
【關(guān)鍵詞】: 垃圾郵件過濾 貝葉斯 特征項(xiàng)提取 基于短語(yǔ) 中文分詞
【基金】:國(guó)家社科青年基金項(xiàng)目:基于空間計(jì)量分析的人口規(guī)模、結(jié)構(gòu)對(duì)資源環(huán)境的影響效應(yīng)研究(13CRK027)資助
【分類號(hào)】:TP393.098
【正文快照】: 隨著Internet的全球化普及,電子郵件成為了常用的通訊交流方式,與此同時(shí)日益增多的垃圾郵件給人們的生產(chǎn)生活帶來(lái)了極大的不便,造成了人力物力資源的浪費(fèi)。據(jù)統(tǒng)計(jì),我國(guó)已經(jīng)成為全球第二大垃圾郵件受害國(guó)[1,2]。目前主要的垃圾郵件過濾技術(shù)為黑名單技術(shù)[3]、基于規(guī)則的過濾技術(shù)
【相似文獻(xiàn)】
中國(guó)期刊全文數(shù)據(jù)庫(kù) 前10條
1 張羿;周建國(guó);晏蒲柳;;垃圾郵件過濾系統(tǒng)的研究與實(shí)現(xiàn)[J];計(jì)算機(jī)工程;2006年18期
2 徐衛(wèi);;一種垃圾郵件過濾網(wǎng)關(guān)的設(shè)計(jì)[J];電腦知識(shí)與技術(shù);2006年35期
3 項(xiàng)濤;龔儉;丁偉;;垃圾郵件過濾系統(tǒng)的評(píng)估模型研究[J];計(jì)算機(jī)工程與設(shè)計(jì);2007年18期
4 歐德寧;馬軍;;基于內(nèi)含鏈接特征分析的垃圾郵件過濾技術(shù)[J];鄭州大學(xué)學(xué)報(bào)(理學(xué)版);2009年02期
5 金彩琴;裘國(guó)永;;對(duì)垃圾郵件過濾技術(shù)的問題研究[J];計(jì)算機(jī)技術(shù)與發(fā)展;2011年09期
6 丁上凌;呂后坤;;垃圾郵件過濾技術(shù)研究[J];漯河職業(yè)技術(shù)學(xué)院學(xué)報(bào);2012年02期
7 趙文清;一種混合型垃圾郵件過濾系統(tǒng)的研究與設(shè)計(jì)[J];山西電子技術(shù);2004年06期
8 陳長(zhǎng)偉;劉罡;洪躍楓;;電子垃圾郵件過濾技術(shù)的應(yīng)用[J];辦公自動(dòng)化;2004年06期
9 劉震,佘X,周明天;基于多級(jí)屬性集的垃圾郵件過濾技術(shù)[J];計(jì)算機(jī)應(yīng)用研究;2005年07期
10 陳治平;王雷;;基于自學(xué)習(xí)K近鄰的垃圾郵件過濾算法[J];計(jì)算機(jī)應(yīng)用;2005年S1期
中國(guó)重要會(huì)議論文全文數(shù)據(jù)庫(kù) 前10條
1 李軍;何曉寧;黃成哲;齊浩亮;雷國(guó)華;;基于特征貢獻(xiàn)度的垃圾郵件過濾方法[A];第六屆全國(guó)信息檢索學(xué)術(shù)會(huì)議論文集[C];2010年
2 潘文鋒;王斌;譚松波;;貝葉斯垃圾郵件過濾研究[A];全國(guó)網(wǎng)絡(luò)與信息安全技術(shù)研討會(huì)’2004論文集[C];2004年
3 劉紅翼;;一種垃圾郵件過濾器的設(shè)計(jì)與實(shí)現(xiàn)[A];廣西計(jì)算機(jī)學(xué)會(huì)2005年學(xué)術(shù)年會(huì)論文集[C];2005年
4 張尼;方濱興;;垃圾郵件過濾技術(shù)綜述[A];全國(guó)網(wǎng)絡(luò)與信息安全技術(shù)研討會(huì)'2005論文集(下冊(cè))[C];2005年
5 張志斌;施水才;呂學(xué)強(qiáng);;基于貝葉斯方法的中文垃圾郵件過濾技術(shù)綜述[A];中文信息處理前沿進(jìn)展——中國(guó)中文信息學(xué)會(huì)二十五周年學(xué)術(shù)會(huì)議論文集[C];2006年
6 周立兵;柳景超;;貝葉斯理論在垃圾郵件過濾中的應(yīng)用分析[A];中國(guó)造船工程學(xué)會(huì)電子技術(shù)學(xué)術(shù)委員會(huì)2006學(xué)術(shù)年會(huì)論文集(上冊(cè))[C];2006年
7 張海雷;王會(huì)珍;王安慧;朱靖波;;基于樸素貝葉斯模型的垃圾郵件過濾技術(shù)比較分析[A];全國(guó)網(wǎng)絡(luò)與信息安全技術(shù)研討會(huì)論文集(下冊(cè))[C];2007年
8 米淑云;辛陽(yáng);羅群;;一種新型垃圾郵件過濾系統(tǒng)的設(shè)計(jì)和研究[A];2008通信理論與技術(shù)新進(jìn)展——第十三屆全國(guó)青年通信學(xué)術(shù)會(huì)議論文集(上)[C];2008年
9 岑芳明;王明文;王鵬鳴;戴玉娟;;基于核偏最小二乘分類的垃圾郵件過濾[A];第四屆全國(guó)信息檢索與內(nèi)容安全學(xué)術(shù)會(huì)議論文集(上)[C];2008年
10 牛明珠;;病毒和垃圾郵件過濾技術(shù)淺析[A];二○○九年全國(guó)電力企業(yè)信息化大會(huì)論文集[C];2009年
中國(guó)重要報(bào)紙全文數(shù)據(jù)庫(kù) 前10條
1 ;“垃圾郵件過濾系統(tǒng)”幾乎沒有一個(gè)完善的[N];新華每日電訊;2003年
2 ;測(cè)試?yán)]件過濾系統(tǒng)[N];網(wǎng)絡(luò)世界;2003年
3 本報(bào)記者 高穎;清除網(wǎng)絡(luò)“牛皮癬”勝算幾何?[N];計(jì)算機(jī)世界;2003年
4 John D. Halamka;IT手段的兩面性[N];計(jì)算機(jī)世界;2007年
5 ;不止是垃圾郵件過濾[N];網(wǎng)絡(luò)世界;2005年
6 ;2003十大網(wǎng)絡(luò)應(yīng)用電子郵箱[N];中國(guó)電腦教育報(bào);2003年
7 本報(bào)記者 李建平;Comdex走向?qū)WN];計(jì)算機(jī)世界;2003年
8 張穎;東西方交流不會(huì)被“垃圾”阻斷[N];中國(guó)經(jīng)營(yíng)報(bào);2002年
9 ;如何選擇和使用UTM設(shè)備[N];網(wǎng)絡(luò)世界;2009年
10 ;用戶關(guān)心的問題:MSN 8值嗎?[N];計(jì)算機(jī)世界;2002年
中國(guó)博士學(xué)位論文全文數(shù)據(jù)庫(kù) 前5條
1 董建設(shè);協(xié)作式垃圾郵件過濾關(guān)鍵技術(shù)研究[D];蘭州理工大學(xué);2009年
2 惠孛;基于即時(shí)分類的垃圾郵件過濾關(guān)鍵技術(shù)的研究[D];電子科技大學(xué);2009年
3 鄧蔚;垃圾郵件過濾中的敵手分類問題研究[D];電子科技大學(xué);2011年
4 孫晶濤;基于內(nèi)容的垃圾郵件過濾技術(shù)研究[D];蘭州理工大學(xué);2010年
5 張澤明;人工免疫算法及其應(yīng)用研究[D];中國(guó)科學(xué)技術(shù)大學(xué);2007年
中國(guó)碩士學(xué)位論文全文數(shù)據(jù)庫(kù) 前10條
1 甘棠儀;基于屬性論方法的垃圾郵件過濾系統(tǒng)設(shè)計(jì)與研究[D];上海海事大學(xué);2005年
2 王申;基于內(nèi)容的垃圾郵件過濾技術(shù)的若干研究[D];中國(guó)科學(xué)院研究生院(計(jì)算技術(shù)研究所);2005年
3 田月霞;基于疫苗機(jī)制的垃圾郵件過濾模型的研究[D];鄭州輕工業(yè)學(xué)院;2015年
4 鄧曾;遺傳算法和貝葉斯模型在垃圾郵件過濾中的應(yīng)用[D];電子科技大學(xué);2015年
5 徐兆志;基于AAPE分類模型的垃圾郵件過濾技術(shù)的研究與實(shí)現(xiàn)[D];電子科技大學(xué);2014年
6 次曲(Tse Qu);基于樸素貝葉斯算法的藏文垃圾郵件過濾關(guān)鍵技術(shù)研究[D];電子科技大學(xué);2013年
7 王浩;基于發(fā)送方異常行為檢測(cè)的垃圾郵件過濾系統(tǒng)的研究與實(shí)現(xiàn)[D];東北大學(xué);2013年
8 許建明;基于內(nèi)容挖掘的中文垃圾郵件過濾技術(shù)研究與實(shí)現(xiàn)[D];湖南大學(xué);2008年
9 鄭梅;基于規(guī)則的垃圾郵件過濾系統(tǒng)設(shè)計(jì)與實(shí)現(xiàn)[D];電子科技大學(xué);2008年
10 王鵬鳴;基于偏最小二乘方法的垃圾郵件過濾研究[D];江西師范大學(xué);2008年
,本文編號(hào):904386
本文鏈接:http://sikaile.net/guanlilunwen/ydhl/904386.html