基于Boosting算法的垃圾郵件過濾方法研究
本文選題:Boosting算法 + 垃圾郵件 ; 參考:《北京理工大學(xué)學(xué)報(bào)》2013年01期
【摘要】:為解決垃圾郵件過濾的精確度和有效性問題,提出了一種基于郵件內(nèi)容過濾的垃圾郵件過濾方法,該方法采用Boosting算法構(gòu)造了一種垃圾郵件過濾器,利用該垃圾郵件過濾器實(shí)現(xiàn)對(duì)垃圾郵件的過濾.本文借鑒文本分類和信息檢索領(lǐng)域所使用的評(píng)價(jià)指標(biāo),構(gòu)建了垃圾郵件過濾器的評(píng)價(jià)體系,利用該評(píng)價(jià)體系,針對(duì)基于Boosting算法所構(gòu)造的垃圾郵件過濾器對(duì)垃圾郵件的過濾實(shí)驗(yàn)所得到的數(shù)據(jù)進(jìn)行了測(cè)試和評(píng)估,測(cè)試和評(píng)估的結(jié)果驗(yàn)證了Boosting算法在垃圾郵件過濾中的有效性,其性能優(yōu)于傳統(tǒng)的貝葉斯算法.
[Abstract]:In order to solve the problem of accuracy and validity of spam filtering, a spam filtering method based on email content filtering is proposed, which uses Boosting algorithm to construct a spam filter. The spam filter is used to filter spam. Based on the evaluation indexes used in the field of text classification and information retrieval, the evaluation system of spam filter is constructed in this paper. The data of spam filter based on Boosting algorithm is tested and evaluated. The result of test and evaluation verifies the validity of Boosting algorithm in spam filtering. Its performance is superior to the traditional Bayesian algorithm.
【作者單位】: 齊齊哈爾大學(xué)應(yīng)用技術(shù)學(xué)院;齊齊哈爾大學(xué)網(wǎng)絡(luò)信息中心;北京首都國際機(jī)場(chǎng)股份有限公司;林甸縣第一中學(xué);
【基金】:黑龍江齊齊哈爾市科學(xué)技術(shù)計(jì)劃項(xiàng)目(GYGG2010-06-02)
【分類號(hào)】:TP393.098
【參考文獻(xiàn)】
相關(guān)期刊論文 前1條
1 曾春,邢春曉,周立柱;基于內(nèi)容過濾的個(gè)性化搜索算法[J];軟件學(xué)報(bào);2003年05期
相關(guān)碩士學(xué)位論文 前1條
1 潘文鋒;基于內(nèi)容的垃圾郵件過濾研究[D];中國科學(xué)院研究生院(計(jì)算技術(shù)研究所);2004年
【共引文獻(xiàn)】
相關(guān)期刊論文 前10條
1 張玉霞;;改進(jìn)的個(gè)性化智能文獻(xiàn)推送方法在數(shù)字圖書館中的應(yīng)用研究[J];情報(bào)理論與實(shí)踐;2012年07期
2 蔣宗禮,肖華,趙欽;WebSifter:個(gè)性化網(wǎng)絡(luò)搜索輔助系統(tǒng)[J];清華大學(xué)學(xué)報(bào)(自然科學(xué)版);2005年S1期
3 王鑫;陳光英;段海新;李學(xué)農(nóng);;基于用戶反饋和增量學(xué)習(xí)的垃圾郵件識(shí)別方法[J];清華大學(xué)學(xué)報(bào)(自然科學(xué)版);2006年01期
4 楊獻(xiàn)峰;侯志松;;基于Agent的搜索引擎?zhèn)性化服務(wù)系統(tǒng)[J];軟件導(dǎo)刊;2008年03期
5 沈杰峰,杜亞軍,唐俊;基于蟻群算法的網(wǎng)頁推薦[J];西華大學(xué)學(xué)報(bào)(自然科學(xué)版);2005年06期
6 宋宇;;網(wǎng)絡(luò)資源定題采集系統(tǒng)設(shè)計(jì)與實(shí)現(xiàn)[J];山東圖書館學(xué)刊;2010年02期
7 陳梟;劉天華;朱宏峰;劉駿;;基于詞匯相關(guān)度模型的個(gè)性化元搜索引擎[J];計(jì)算機(jī)工程與設(shè)計(jì);2007年19期
8 羊晶t,
本文編號(hào):1981018
本文鏈接:http://sikaile.net/guanlilunwen/ydhl/1981018.html