基于用戶行為的郵件分類算法
本文選題:分類算法 + 垃圾郵件。 參考:《計算機應用》2014年05期
【摘要】:針對垃圾郵件過濾過程中分類模型難以個性化、難以適應用戶興趣動態(tài)變化的問題,提出了一種基于用戶行為的郵件分類算法。通過分析樸素貝葉(NB)斯分類算法的原理,改造樸素貝葉斯算法,使其具有動態(tài)調整能力。郵件服務器接收到新郵件后自動進行分類判別,用戶瀏覽郵件的過程中對郵件進行操作,根據(jù)用戶對錯分郵件的處理自動將該郵件加入訓練數(shù)據(jù)集,并動態(tài)更新相應特征的統(tǒng)計概率,使郵件分類算法能夠依據(jù)用戶對不同郵件的操作行為動態(tài)調整分類模型,以達到有效過濾垃圾郵件的目的。與常用的貝葉斯分類算法的實驗比較表明在給定小樣本集合進行訓練的情況下,新算法對于垃圾郵件的識別率比傳統(tǒng)的樸素貝葉斯方法、基于風險敏感的樸素貝葉斯方法等提高了10%,獲得了較好的分類性能。
[Abstract]:In order to solve the problem that the classification model is difficult to personalize and adapt to the dynamic changes of users' interests in spam filtering, a classification algorithm based on user behavior is proposed. By analyzing the principle of NBs classification algorithm, the naive Bayes algorithm is modified to make it have the ability of dynamic adjustment. After receiving the new mail, the mail server automatically classifies and discriminates. During the process of browsing the mail, the mail is operated, and the mail is automatically added to the training data set according to the processing of the user's right and wrong mail. The statistical probability of the corresponding features is dynamically updated so that the mail classification algorithm can dynamically adjust the classification model according to the user's operation behavior to achieve the purpose of filtering spam effectively. The experimental results show that the new algorithm is more efficient than the traditional naive Bayesian algorithm in the case of training the set of small samples. The naive Bayes method based on risk sensitivity improves 10% and achieves better classification performance.
【作者單位】: 長沙學院信息與計算科學系;
【分類號】:TP393.098
【參考文獻】
相關期刊論文 前9條
1 鄧文韜;王國胤;董振興;;一種改進KNN個性化郵件過濾的方法[J];重慶郵電大學學報(自然科學版);2011年06期
2 劉伍穎;王挺;;結構化集成學習垃圾郵件過濾[J];計算機研究與發(fā)展;2012年03期
3 馬小龍;;一種改進的貝葉斯算法在垃圾郵件過濾中的研究[J];計算機應用研究;2012年03期
4 秦逸;;基于行為的垃圾郵件檢測技術[J];計算機科學;2012年11期
5 薛正元;;基于改進貝葉斯決策的郵件過濾[J];計算機工程與應用;2013年07期
6 雷劍剛;孫細斌;;一種智能垃圾郵件過濾模型的仿真研究[J];計算機仿真;2013年05期
7 黃國偉;許昱瑋;;基于用戶反饋的混合型垃圾郵件過濾方法[J];計算機應用;2013年07期
8 李淵;廖聞劍;彭艷兵;程光;;復雜網(wǎng)絡性質探討及在垃圾郵件過濾中的運用[J];計算機科學;2013年S1期
9 Guanglu Sun;Hongyue Sun;Yingcai Ma;Yuewu Shen;;Spam Filtering:Online Naive Bayes Based on TONE[J];ZTE Communications;2013年02期
【共引文獻】
相關期刊論文 前10條
1 申鉉京;何月;張博;龍建武;;基于空間信息及隸屬度約束的FCM圖像分割算法[J];北京工業(yè)大學學報;2012年07期
2 蘇艷剛;;一種改進自動更新的中文郵件過濾模型的設計[J];電腦知識與技術;2013年20期
3 翟軍昌;車偉偉;;一種基于條件熵的垃圾郵件過濾算法[J];計算機與現(xiàn)代化;2014年02期
4 楊赫;孫廣路;何勇軍;;基于樸素貝葉斯模型的郵件過濾技術[J];哈爾濱理工大學學報;2014年01期
5 陳宇;;基于用戶行為的個性化郵件分類算法[J];福建工程學院學報;2014年01期
6 周全強;張付志;;基于仿生模式識別的用戶概貌攻擊集成檢測方法[J];計算機研究與發(fā)展;2014年04期
7 郭軍權;諸葛建偉;孫東紅;段海新;;Spampot:基于分布式蜜罐的垃圾郵件捕獲系統(tǒng)[J];計算機研究與發(fā)展;2014年05期
8 翟軍昌;秦玉平;車偉偉;;垃圾郵件過濾中信息增益的改進研究[J];計算機科學;2014年06期
9 陳念;唐振民;;QBC主動采樣學習在垃圾郵件在線過濾中的應用[J];計算機工程與應用;2014年22期
10 楊艷燕;郭紅轉;路新華;;基于粗糙集的帶決策規(guī)則邊界的郵件過濾算法[J];計算機應用研究;2015年01期
【二級參考文獻】
相關期刊論文 前10條
1 閻艷;黃智興;邱玉輝;;一種基于派系過濾的社區(qū)進化發(fā)現(xiàn)研究[J];重慶師范大學學報(自然科學版);2009年02期
2 洪艷;程克勤;;基于電子郵件原理的垃圾郵件過濾策略[J];電腦知識與技術(學術交流);2007年09期
3 鄧蔚;秦志光;劉嶠;程紅蓉;;抗好詞攻擊的中文垃圾郵件過濾模型[J];電子測量與儀器學報;2010年12期
4 胡佳妮,徐蔚然,郭軍,鄧偉洪;中文文本分類中的特征選擇算法研究[J];光通信研究;2005年03期
5 王美珍;李芝棠;吳漢濤;;改進的貝葉斯垃圾郵件過濾算法[J];華中科技大學學報(自然科學版);2009年08期
6 韓家煒,孟小峰,王靜,李盛恩;Web挖掘研究[J];計算機研究與發(fā)展;2001年04期
7 姜遠;周志華;;基于詞頻分類器集成的文本分類方法[J];計算機研究與發(fā)展;2006年10期
8 王濤;李舟軍;顏躍進;陳火旺;;數(shù)據(jù)流挖掘分類技術綜述[J];計算機研究與發(fā)展;2007年11期
9 劉赫;劉大有;裴志利;高瀅;;一種基于特征重要度的文本分類特征加權方法[J];計算機研究與發(fā)展;2009年10期
10 朱明,王俊普,蔡慶生;一種最優(yōu)特征集的選擇算法[J];計算機研究與發(fā)展;1998年09期
【相似文獻】
相關期刊論文 前10條
1 呢仔男孩;垃圾郵件防守戰(zhàn)[J];電腦愛好者;2001年09期
2 馮小民;徹底拒絕垃圾郵件[J];電腦愛好者;2001年16期
3 林義湘;如何避免垃圾郵件的騷擾[J];電子與電腦;2002年10期
4 志杰;垃圾郵件大清除[J];計算機與農業(yè);2002年03期
5 垂天翼;教您七個防護妙招使您遠離垃圾郵件困擾[J];微計算機信息;2002年12期
6 徐濤;讓垃圾郵件靜靜的走開[J];計算機與網(wǎng)絡;2002年06期
7 茍宏,李龍海,周利華;高性能郵件轉發(fā)服務器的設計與實現(xiàn)[J];計算機應用研究;2002年01期
8 金哲凡,石教英;基于統(tǒng)一消息的郵件通知系統(tǒng)的研究與實現(xiàn)[J];計算機工程與應用;2003年14期
9 趙江;走出垃圾郵件的泥潭[J];個人電腦;2003年11期
10 劉洋,杜孝平,黃星華,侯志輝,郭晨,周二勝,駱煥林;垃圾郵件的智能過濾系統(tǒng)設計探討[J];微機發(fā)展;2003年04期
相關會議論文 前10條
1 張晶;姚建民;董守斌;張凌;;基于自然語言同現(xiàn)詞匯的郵件過濾[A];第三屆全國信息檢索與內容安全學術會議論文集[C];2007年
2 薛亞楠;廖聞劍;彭艷兵;;垃圾郵件行為識別研究[A];中國電子學會第十六屆信息論學術年會論文集[C];2009年
3 蒯莉;;網(wǎng)絡垃圾郵件的防范與治理[A];第十六次全國計算機安全學術交流會論文集[C];2001年
4 沈衛(wèi)超;;郵件過濾器系統(tǒng)的設計與實現(xiàn)[A];中國工程物理研究院科技年報(2001)[C];2001年
5 石艷榮;孫丹寧;賀永強;;一種基于內容的郵件過濾模型的研究與性能分析[A];2007通信理論與技術新發(fā)展——第十二屆全國青年通信學術會議論文集(上冊)[C];2007年
6 張尼;姜譽;方濱興;郭莉;;一個基于郵件路徑地理屬性分析的垃圾郵件過濾算法[A];全國網(wǎng)絡與信息安全技術研討會論文集(下冊)[C];2007年
7 朱巧明;周志軍;李培峰;;中文郵件語料庫建設及其分類研究[A];第六屆漢語詞匯語義學研討會論文集[C];2005年
8 仇小鋒;陳鳴;賈永興;;垃圾郵件及其防范技術[A];第九屆全國青年通信學術會議論文集[C];2004年
9 張相於;陳繼東;李玉坤;孟小峰;;TEXEM:一種基于實體的郵件任務提取策略[A];第二十五屆中國數(shù)據(jù)庫學術會議論文集(二)[C];2008年
10 李婧;張煥國;;應用于貝葉斯過濾器的噪音消除算法研究[A];2005通信理論與技術新進展——第十屆全國青年通信學術會議論文集[C];2005年
相關重要報紙文章 前10條
1 ;砍斷垃圾郵件黑手[N];計算機世界;2003年
2 本報記者 張琳;防垃圾郵件怎樣“行為識別”[N];網(wǎng)絡世界;2005年
3 新華社記者 王緬 毛磊 楊駿 何德功 潘治;垃圾郵件全球泛濫,法律怎么辦[N];新華每日電訊;2003年
4 阮光塵邋朱元春;多層構建郵件免疫機能[N];中國計算機報;2007年
5 ;垃圾郵件傳播追隨“熱點”[N];網(wǎng)絡世界;2007年
6 劉向晨;垃圾郵件防治任重道遠[N];中國電腦教育報;2003年
7 小新;郵箱也能自動過濾垃圾郵件[N];中國電腦教育報;2003年
8 絲雨;“垃圾郵件”任憑圍剿輕松反圍剿[N];大眾科技報;2002年
9 ;企業(yè)備戰(zhàn)垃圾郵件[N];計算機世界;2004年
10 樂天;對付垃圾郵件德國出新招[N];計算機世界;2011年
相關博士學位論文 前6條
1 陳彬;垃圾郵件的特征選擇及檢測方法研究[D];華南理工大學;2010年
2 劉震;垃圾郵件過濾理論和關鍵技術研究[D];電子科技大學;2008年
3 王友衛(wèi);基于統(tǒng)計的垃圾郵件識別關鍵技術研究[D];吉林大學;2015年
4 劉衛(wèi)紅;垃圾郵件檢測與過濾關鍵技術研究[D];華南理工大學;2010年
5 詹川;反垃圾郵件技術的研究[D];電子科技大學;2005年
6 王會珍;文本內容分類和主題追蹤關鍵技術研究[D];東北大學;2008年
相關碩士學位論文 前10條
1 代偉;郵件過濾器的設計與實現(xiàn)[D];吉林大學;2010年
2 戴少鋒;基于多層架構的郵件過濾系統(tǒng)研究[D];第一軍醫(yī)大學;2006年
3 肖e,
本文編號:2040897
本文鏈接:http://sikaile.net/guanlilunwen/ydhl/2040897.html