基于Elastic Net-Decision Tree的垃圾郵件過濾研究
本文關鍵詞:基于Elastic Net-Decision Tree的垃圾郵件過濾研究
【摘要】:針對垃圾郵件文本數(shù)據(jù)高維、稀疏及詞條相關等特點,提出Elastic Net-Decision Tree(EN-DT)兩步分類算法。第一步,利用Elastic Net提取郵件文本特征變量,將高維文本數(shù)據(jù)降至低維。第二步,將所提取的低維特征變量輸入到Decision Tree中進行郵件分類。根據(jù)分類評價指標對分類結果進行評價。利用Mark Hopkins等人收集的Spam郵件文本數(shù)據(jù)進行仿真,實驗結果表明相比于PLS、PCA和Lasso等算法EN-DT分類性能更佳。
【作者單位】: 華東交通大學電氣與電子工程學院;
【關鍵詞】: 垃圾郵件 Elastic Net 決策樹
【基金】:國家自然科學基金(61263010;60904049) 江西省青年科學基金(20114BAB211014) 江西省教育廳研究項目(GJJ14399) 國家留學基金(2011836118)資助
【分類號】:TP393.098
【正文快照】: 江西省青年科學基金(20114BAB211014),江西省教育廳研究項目(GJJ14399)、國家留學基金(2011836118)資助隨著互聯(lián)網(wǎng)的不斷發(fā)展,電子郵件的使用越來越廣泛,給人們日常交流帶來極大方便。然而其副產(chǎn)品垃圾郵件正像洪水一樣侵襲著全球互聯(lián)網(wǎng)。垃圾郵件不僅占用了大量的網(wǎng)絡存儲空
【參考文獻】
中國期刊全文數(shù)據(jù)庫 前7條
1 謝小民;;基于貝葉斯的垃圾郵件過濾算法設計研究[J];電子技術與軟件工程;2014年15期
2 任劍鋒;梁雪;李淑紅;;基于非線性流形學習和支持向量機的文本分類算法[J];計算機科學;2012年01期
3 云煒;段禪倫;;基于粗糙集理論的雙向垃圾郵件分類模型的研究[J];計算機工程與科學;2008年10期
4 王斌,潘文鋒;基于內容的垃圾郵件過濾技術綜述[J];中文信息學報;2005年05期
5 岑芳明;王明文;王鵬鳴;戴玉娟;;基于核偏最小二乘分類的垃圾郵件過濾[J];中文信息學報;2009年02期
6 計宏;;改進貝葉斯垃圾郵件過濾技術的研究[J];計算機測量與控制;2013年08期
7 王綱;李誠;;基于貝葉斯理論的垃圾郵件算法研究[J];齊齊哈爾大學學報(自然科學版);2012年01期
中國重要會議論文全文數(shù)據(jù)庫 前1條
1 王琦;;基于貝葉斯決策樹算法的垃圾郵件識別機制[A];2011年通信與信息技術新進展——第八屆中國通信學會學術年會論文集[C];2011年
中國碩士學位論文全文數(shù)據(jù)庫 前2條
1 陳孝禮;基于改進SVM的垃圾郵件過濾系統(tǒng)研究與實現(xiàn)[D];山東師范大學;2011年
2 羅常泳;基于內容的垃圾郵件檢測方法研究[D];浙江大學;2014年
【共引文獻】
中國期刊全文數(shù)據(jù)庫 前10條
1 程衛(wèi)華;尤晉元;;基于內容過濾的反垃圾郵件系統(tǒng)的設計與實現(xiàn)[J];安徽大學學報(自然科學版);2007年03期
2 黃文良;李石堅;劉菊新;徐從富;;一個大規(guī)模垃圾短信實時過濾系統(tǒng)[J];北京郵電大學學報;2008年03期
3 董振興;李榮;陳龍;;一種基于主動學習和TCM-EKNN的郵件過濾方法[J];重慶郵電大學學報(自然科學版);2011年01期
4 鄧文韜;王國胤;董振興;;一種改進KNN個性化郵件過濾的方法[J];重慶郵電大學學報(自然科學版);2011年06期
5 劉洋;曹津寧;劉昊;秦玉平;;基于貝葉斯方法的垃圾郵件處理模型研究[J];長春工程學院學報(自然科學版);2007年03期
6 沈競;蔣僑;;DSTFA分布式短文本過濾算法[J];四川兵工學報;2011年10期
7 田林;;基于SMTP會話控制的主動式垃圾郵件過濾技術的研究[J];楚雄師范學院學報;2009年06期
8 孫晶濤;張秋余;袁占亭;董建設;;博弈論在郵件特征選擇中的應用[J];電子科技大學學報;2011年01期
9 莊鎖法;陳興梅;;客戶端防范垃圾郵件策略的探討[J];電腦知識與技術;2006年23期
10 徐衛(wèi);;一種垃圾郵件過濾網(wǎng)關的設計[J];電腦知識與技術;2006年35期
中國重要會議論文全文數(shù)據(jù)庫 前5條
1 王琦;;基于貝葉斯決策樹算法的垃圾郵件識別機制[A];2011年通信與信息技術新進展——第八屆中國通信學會學術年會論文集[C];2011年
2 張艷;李毅;顧健;;垃圾郵件與反垃圾郵件新技術追蹤[A];全國計算機安全學術交流會論文集·第二十五卷[C];2010年
3 黃文良;李石堅;劉菊新;徐從富;;大規(guī)模垃圾短信實時過濾系統(tǒng)的設計與實現(xiàn)[A];中國通信學會第五屆學術年會論文集[C];2008年
4 蘇綏;林鴻飛;葉正;;基于字符語言模型的垃圾郵件過濾[A];第四屆全國信息檢索與內容安全學術會議論文集(上)[C];2008年
5 李勁;岳昆;杭菲璐;;一種基于自適應Markov模型的中文垃圾郵件過濾方法[A];第二十五屆中國數(shù)據(jù)庫學術會議論文集(一)[C];2008年
中國博士學位論文全文數(shù)據(jù)庫 前10條
1 孫晶濤;基于內容的垃圾郵件過濾技術研究[D];蘭州理工大學;2010年
2 劉伍穎;面向垃圾信息過濾的主動多域學習文本分類方法研究[D];國防科學技術大學;2011年
3 曹渝昆;基于神經(jīng)網(wǎng)絡和模糊邏輯的智能推薦系統(tǒng)研究[D];重慶大學;2006年
4 何申;面向3G移動通信網(wǎng)絡的安全框架研究[D];中國科學技術大學;2007年
5 劉震;垃圾郵件過濾理論和關鍵技術研究[D];電子科技大學;2008年
6 黃文良;垃圾短信過濾關鍵技術研究[D];浙江大學;2008年
7 陳黎飛;高維數(shù)據(jù)的聚類方法研究與應用[D];廈門大學;2008年
8 惠孛;基于即時分類的垃圾郵件過濾關鍵技術的研究[D];電子科技大學;2009年
9 李東方;Web 2.0環(huán)境下互聯(lián)網(wǎng)信息過濾理論與方法研究[D];中國科學技術大學;2009年
10 陳彬;垃圾郵件的特征選擇及檢測方法研究[D];華南理工大學;2010年
中國碩士學位論文全文數(shù)據(jù)庫 前10條
1 岳廣飛;基于二次搜索的搜索引擎技術研究[D];山東科技大學;2010年
2 劉維會;不平衡數(shù)據(jù)集上支持向量機算法研究[D];山東科技大學;2010年
3 于洪霞;基于SVM的中文垃圾郵件過濾[D];哈爾濱工程大學;2009年
4 李福轉;基于內容的垃圾郵件過濾技術的研究[D];電子科技大學;2010年
5 石晶;一種高效垃圾短信過濾系統(tǒng)的實現(xiàn)[D];電子科技大學;2010年
6 蘇保君;在線組合分類器應用于大規(guī)模垃圾郵件過濾的研究[D];浙江大學;2010年
7 徐麗平;基于內容挖掘的中文垃圾郵件過濾技術研究[D];東北財經(jīng)大學;2010年
8 王海波;垃圾短信的屏蔽機制與應用研究[D];東華大學;2011年
9 陳孝禮;基于改進SVM的垃圾郵件過濾系統(tǒng)研究與實現(xiàn)[D];山東師范大學;2011年
10 陳強;基于貝葉斯方法的垃圾郵件過濾技術的研究[D];沈陽工業(yè)大學;2011年
【二級參考文獻】
中國期刊全文數(shù)據(jù)庫 前10條
1 曾立梅;;基于文本數(shù)據(jù)挖掘的碩士論文分類技術[J];重慶郵電大學學報(自然科學版);2010年05期
2 趙曉明,鄭少仁;電子郵件過濾器的分析與設計[J];東南大學學報(自然科學版);2001年05期
3 張長君;電子郵件的一種過濾方法[J];計算機安全;2002年02期
4 盧志茂;劉挺;李生;;統(tǒng)計詞義消歧的研究進展[J];電子學報;2006年02期
5 王彪;段禪倫;趙俊嵐;;一種基于粗糙集的小型電子商務挖掘模型[J];中國管理信息化(綜合版);2007年02期
6 胡佳妮,徐蔚然,郭軍,鄧偉洪;中文文本分類中的特征選擇算法研究[J];光通信研究;2005年03期
7 林珊,寧國寧,趙之霖;中文分詞在郵件過濾系統(tǒng)中的應用[J];華南理工大學學報(自然科學版);2004年S1期
8 王美珍;李芝棠;吳漢濤;;改進的貝葉斯垃圾郵件過濾算法[J];華中科技大學學報(自然科學版);2009年08期
9 落紅衛(wèi),劉建毅,王樅,鐘義信;智能郵件過濾系統(tǒng)的研究與實現(xiàn)[J];機電產(chǎn)品開發(fā)與創(chuàng)新;2003年01期
10 朱明,王俊普,蔡慶生;一種最優(yōu)特征集的選擇算法[J];計算機研究與發(fā)展;1998年09期
中國博士學位論文全文數(shù)據(jù)庫 前3條
1 孫晶濤;基于內容的垃圾郵件過濾技術研究[D];蘭州理工大學;2010年
2 詹川;反垃圾郵件技術的研究[D];電子科技大學;2005年
3 王博;文本分類中特征選擇技術的研究[D];國防科學技術大學;2009年
中國碩士學位論文全文數(shù)據(jù)庫 前4條
1 李雯;基于貝葉斯技術的郵件過濾研究[D];山東師范大學;2008年
2 王洪斌;基于決策樹算法的垃圾郵件通信行為檢測過濾技術研究[D];哈爾濱理工大學;2008年
3 張立偉;網(wǎng)絡信息過濾中反饋機制的研究及應用[D];山東師范大學;2010年
4 馮禹;基于內容的垃圾郵件檢測特征降維算法研究[D];浙江大學;2013年
【相似文獻】
中國期刊全文數(shù)據(jù)庫 前10條
1 趙文清;一種混合型垃圾郵件過濾系統(tǒng)的研究與設計[J];山西電子技術;2004年06期
2 陳長偉;劉罡;洪躍楓;;電子垃圾郵件過濾技術的應用[J];辦公自動化;2004年06期
3 劉震,佘X,周明天;基于多級屬性集的垃圾郵件過濾技術[J];計算機應用研究;2005年07期
4 陳治平;王雷;;基于自學習K近鄰的垃圾郵件過濾算法[J];計算機應用;2005年S1期
5 李星;田瑩;段海新;;中文垃圾郵件過濾系統(tǒng)的實現(xiàn)和評估[J];大連理工大學學報;2005年S1期
6 劉紅翼;;一種垃圾郵件過濾器的設計與實現(xiàn)[J];廣西科學院學報;2005年04期
7 詹川;盧顯良;周旭;侯孟書;袁連海;;基于貝葉斯公式的垃圾郵件過濾方法[J];計算機科學;2005年02期
8 張強;;基于阻斷發(fā)送源的垃圾郵件過濾技術[J];網(wǎng)絡安全技術與應用;2006年02期
9 胡永杰;卜紅霞;;垃圾郵件過濾技術研究[J];河北師范大學學報;2006年02期
10 王倩倩;段震;;基于神經(jīng)網(wǎng)絡的垃圾郵件過濾[J];合肥學院學報(自然科學版);2006年01期
中國重要會議論文全文數(shù)據(jù)庫 前10條
1 李軍;何曉寧;黃成哲;齊浩亮;雷國華;;基于特征貢獻度的垃圾郵件過濾方法[A];第六屆全國信息檢索學術會議論文集[C];2010年
2 潘文鋒;王斌;譚松波;;貝葉斯垃圾郵件過濾研究[A];全國網(wǎng)絡與信息安全技術研討會’2004論文集[C];2004年
3 劉紅翼;;一種垃圾郵件過濾器的設計與實現(xiàn)[A];廣西計算機學會2005年學術年會論文集[C];2005年
4 張尼;方濱興;;垃圾郵件過濾技術綜述[A];全國網(wǎng)絡與信息安全技術研討會'2005論文集(下冊)[C];2005年
5 張志斌;施水才;呂學強;;基于貝葉斯方法的中文垃圾郵件過濾技術綜述[A];中文信息處理前沿進展——中國中文信息學會二十五周年學術會議論文集[C];2006年
6 周立兵;柳景超;;貝葉斯理論在垃圾郵件過濾中的應用分析[A];中國造船工程學會電子技術學術委員會2006學術年會論文集(上冊)[C];2006年
7 張海雷;王會珍;王安慧;朱靖波;;基于樸素貝葉斯模型的垃圾郵件過濾技術比較分析[A];全國網(wǎng)絡與信息安全技術研討會論文集(下冊)[C];2007年
8 米淑云;辛陽;羅群;;一種新型垃圾郵件過濾系統(tǒng)的設計和研究[A];2008通信理論與技術新進展——第十三屆全國青年通信學術會議論文集(上)[C];2008年
9 岑芳明;王明文;王鵬鳴;戴玉娟;;基于核偏最小二乘分類的垃圾郵件過濾[A];第四屆全國信息檢索與內容安全學術會議論文集(上)[C];2008年
10 牛明珠;;病毒和垃圾郵件過濾技術淺析[A];二○○九年全國電力企業(yè)信息化大會論文集[C];2009年
中國重要報紙全文數(shù)據(jù)庫 前10條
1 ;“垃圾郵件過濾系統(tǒng)”幾乎沒有一個完善的[N];新華每日電訊;2003年
2 ;測試垃圾郵件過濾系統(tǒng)[N];網(wǎng)絡世界;2003年
3 本報記者 高穎;清除網(wǎng)絡“牛皮癬”勝算幾何?[N];計算機世界;2003年
4 John D. Halamka;IT手段的兩面性[N];計算機世界;2007年
5 ;不止是垃圾郵件過濾[N];網(wǎng)絡世界;2005年
6 ;2003十大網(wǎng)絡應用電子郵箱[N];中國電腦教育報;2003年
7 本報記者 李建平;Comdex走向專注[N];計算機世界;2003年
8 張穎;東西方交流不會被“垃圾”阻斷[N];中國經(jīng)營報;2002年
9 ;如何選擇和使用UTM設備[N];網(wǎng)絡世界;2009年
10 ;用戶關心的問題:MSN 8值嗎?[N];計算機世界;2002年
中國博士學位論文全文數(shù)據(jù)庫 前5條
1 董建設;協(xié)作式垃圾郵件過濾關鍵技術研究[D];蘭州理工大學;2009年
2 惠孛;基于即時分類的垃圾郵件過濾關鍵技術的研究[D];電子科技大學;2009年
3 鄧蔚;垃圾郵件過濾中的敵手分類問題研究[D];電子科技大學;2011年
4 孫晶濤;基于內容的垃圾郵件過濾技術研究[D];蘭州理工大學;2010年
5 張澤明;人工免疫算法及其應用研究[D];中國科學技術大學;2007年
中國碩士學位論文全文數(shù)據(jù)庫 前10條
1 陳俊偉;圖片垃圾郵件過濾系統(tǒng)[D];華東師范大學;2009年
2 徐雋;基于流數(shù)據(jù)特性的垃圾郵件過濾技術研究[D];復旦大學;2009年
3 林偉;基于貝葉斯分類的垃圾郵件過濾系統(tǒng)研究與實現(xiàn)[D];西華大學;2009年
4 徐熙;基于內容的多級垃圾郵件過濾系統(tǒng)研究[D];西華大學;2009年
5 盧揚竹;基于內容的垃圾郵件過濾技術研究[D];西南交通大學;2009年
6 鄭春光;基于免疫的垃圾郵件過濾技術研究[D];哈爾濱理工大學;2009年
7 歐德寧;垃圾郵件過濾技術研究[D];山東大學;2009年
8 王志波;基于數(shù)據(jù)挖掘的垃圾郵件過濾技術研究[D];陜西師范大學;2009年
9 王劍;惰性學習分類法在垃圾郵件過濾中的應用研究[D];上海師范大學;2009年
10 孫雪;基于內容的垃圾郵件過濾系統(tǒng)研究[D];河北大學;2010年
,本文編號:538971
本文鏈接:http://sikaile.net/guanlilunwen/ydhl/538971.html