基于KNN-SVM的垃圾郵件過(guò)濾模型
本文關(guān)鍵詞:基于KNN-SVM的垃圾郵件過(guò)濾模型
更多相關(guān)文章: 垃圾郵件 模式識(shí)別提取 K近鄰算法 特征提取
【摘要】:垃圾郵件具有特征維數(shù)高、樣本不平衡等特點(diǎn),針對(duì)近鄰算法(KNN)或支持向量機(jī)(SVM)存在虛警率高等難題,基于組合優(yōu)化理論,提出基于KNN-SVM的垃圾郵件過(guò)濾組合模型。首先提取垃圾郵件的特征項(xiàng),并構(gòu)建垃圾郵件過(guò)濾模型的輸入向量,然后采用KNN對(duì)垃圾郵件訓(xùn)練樣本進(jìn)行選擇,將訓(xùn)練樣本縮減到k個(gè),并采用支持向量機(jī)對(duì)k個(gè)樣本訓(xùn)練和建模進(jìn)行垃圾郵件過(guò)濾,最后采用中文郵件集對(duì)KNN-SVM的性能進(jìn)行分析。結(jié)果表明,KNN-SVM提高了垃圾郵件過(guò)濾的準(zhǔn)確率,大幅度降低了虛警率,而且垃圾郵件的過(guò)濾速度可以滿足郵件處理的在線需求。
【作者單位】: 常州大學(xué)懷德學(xué)院;
【關(guān)鍵詞】: 垃圾郵件 模式識(shí)別提取 K近鄰算法 特征提取
【分類號(hào)】:TP393.098
【正文快照】: 0引言電子郵件(Email)是包含文字、圖像、視頻的特殊文本,已經(jīng)成為網(wǎng)絡(luò)上交流、溝通的工具[1]。大量統(tǒng)計(jì)與研究報(bào)告表明,垃圾郵件占了全世界郵件的50%以上,對(duì)人們生活、工作帶來(lái)了干擾,而且浪費(fèi)了大量的網(wǎng)絡(luò)帶寬[2]。提高垃圾郵件過(guò)濾的準(zhǔn)確率,保證信息安全,引起了人們的廣泛
【相似文獻(xiàn)】
中國(guó)期刊全文數(shù)據(jù)庫(kù) 前10條
1 張羿;周建國(guó);晏蒲柳;;垃圾郵件過(guò)濾系統(tǒng)的研究與實(shí)現(xiàn)[J];計(jì)算機(jī)工程;2006年18期
2 徐衛(wèi);;一種垃圾郵件過(guò)濾網(wǎng)關(guān)的設(shè)計(jì)[J];電腦知識(shí)與技術(shù);2006年35期
3 項(xiàng)濤;龔儉;丁偉;;垃圾郵件過(guò)濾系統(tǒng)的評(píng)估模型研究[J];計(jì)算機(jī)工程與設(shè)計(jì);2007年18期
4 歐德寧;馬軍;;基于內(nèi)含鏈接特征分析的垃圾郵件過(guò)濾技術(shù)[J];鄭州大學(xué)學(xué)報(bào)(理學(xué)版);2009年02期
5 金彩琴;裘國(guó)永;;對(duì)垃圾郵件過(guò)濾技術(shù)的問(wèn)題研究[J];計(jì)算機(jī)技術(shù)與發(fā)展;2011年09期
6 丁上凌;呂后坤;;垃圾郵件過(guò)濾技術(shù)研究[J];漯河職業(yè)技術(shù)學(xué)院學(xué)報(bào);2012年02期
7 趙文清;一種混合型垃圾郵件過(guò)濾系統(tǒng)的研究與設(shè)計(jì)[J];山西電子技術(shù);2004年06期
8 陳長(zhǎng)偉;劉罡;洪躍楓;;電子垃圾郵件過(guò)濾技術(shù)的應(yīng)用[J];辦公自動(dòng)化;2004年06期
9 劉震,佘X,周明天;基于多級(jí)屬性集的垃圾郵件過(guò)濾技術(shù)[J];計(jì)算機(jī)應(yīng)用研究;2005年07期
10 陳治平;王雷;;基于自學(xué)習(xí)K近鄰的垃圾郵件過(guò)濾算法[J];計(jì)算機(jī)應(yīng)用;2005年S1期
中國(guó)重要會(huì)議論文全文數(shù)據(jù)庫(kù) 前10條
1 李軍;何曉寧;黃成哲;齊浩亮;雷國(guó)華;;基于特征貢獻(xiàn)度的垃圾郵件過(guò)濾方法[A];第六屆全國(guó)信息檢索學(xué)術(shù)會(huì)議論文集[C];2010年
2 潘文鋒;王斌;譚松波;;貝葉斯垃圾郵件過(guò)濾研究[A];全國(guó)網(wǎng)絡(luò)與信息安全技術(shù)研討會(huì)’2004論文集[C];2004年
3 劉紅翼;;一種垃圾郵件過(guò)濾器的設(shè)計(jì)與實(shí)現(xiàn)[A];廣西計(jì)算機(jī)學(xué)會(huì)2005年學(xué)術(shù)年會(huì)論文集[C];2005年
4 張尼;方濱興;;垃圾郵件過(guò)濾技術(shù)綜述[A];全國(guó)網(wǎng)絡(luò)與信息安全技術(shù)研討會(huì)'2005論文集(下冊(cè))[C];2005年
5 張志斌;施水才;呂學(xué)強(qiáng);;基于貝葉斯方法的中文垃圾郵件過(guò)濾技術(shù)綜述[A];中文信息處理前沿進(jìn)展——中國(guó)中文信息學(xué)會(huì)二十五周年學(xué)術(shù)會(huì)議論文集[C];2006年
6 周立兵;柳景超;;貝葉斯理論在垃圾郵件過(guò)濾中的應(yīng)用分析[A];中國(guó)造船工程學(xué)會(huì)電子技術(shù)學(xué)術(shù)委員會(huì)2006學(xué)術(shù)年會(huì)論文集(上冊(cè))[C];2006年
7 張海雷;王會(huì)珍;王安慧;朱靖波;;基于樸素貝葉斯模型的垃圾郵件過(guò)濾技術(shù)比較分析[A];全國(guó)網(wǎng)絡(luò)與信息安全技術(shù)研討會(huì)論文集(下冊(cè))[C];2007年
8 米淑云;辛陽(yáng);羅群;;一種新型垃圾郵件過(guò)濾系統(tǒng)的設(shè)計(jì)和研究[A];2008通信理論與技術(shù)新進(jìn)展——第十三屆全國(guó)青年通信學(xué)術(shù)會(huì)議論文集(上)[C];2008年
9 岑芳明;王明文;王鵬鳴;戴玉娟;;基于核偏最小二乘分類的垃圾郵件過(guò)濾[A];第四屆全國(guó)信息檢索與內(nèi)容安全學(xué)術(shù)會(huì)議論文集(上)[C];2008年
10 牛明珠;;病毒和垃圾郵件過(guò)濾技術(shù)淺析[A];二○○九年全國(guó)電力企業(yè)信息化大會(huì)論文集[C];2009年
中國(guó)重要報(bào)紙全文數(shù)據(jù)庫(kù) 前10條
1 ;測(cè)試?yán)]件過(guò)濾系統(tǒng)[N];網(wǎng)絡(luò)世界;2003年
2 ;如何選擇和使用UTM設(shè)備[N];網(wǎng)絡(luò)世界;2009年
3 本報(bào)記者 朱杰;中小企業(yè)網(wǎng)絡(luò)也能云安全[N];中國(guó)計(jì)算機(jī)報(bào);2009年
4 宋偉;終結(jié)混合威脅攻擊[N];中國(guó)計(jì)算機(jī)報(bào);2004年
5 本報(bào)記者 宋麗娜;整合安全平臺(tái)的魅力[N];網(wǎng)絡(luò)世界;2004年
6 湖北 張湘凱;慎用Web郵箱過(guò)濾功能[N];電腦報(bào);2002年
7 張振;CA eTrust Secure Content Manager提升運(yùn)營(yíng)效率[N];電腦商報(bào);2003年
8 雷雷;如虎添翼加入U(xiǎn)TM的3D-SMP[N];科技日?qǐng)?bào);2006年
9 記者 馬霞;下一代防火墻整體性能達(dá)320G[N];科技日?qǐng)?bào);2012年
10 ;FCI過(guò)濾惡意流量[N];中國(guó)計(jì)算機(jī)報(bào);2004年
中國(guó)博士學(xué)位論文全文數(shù)據(jù)庫(kù) 前4條
1 董建設(shè);協(xié)作式垃圾郵件過(guò)濾關(guān)鍵技術(shù)研究[D];蘭州理工大學(xué);2009年
2 惠孛;基于即時(shí)分類的垃圾郵件過(guò)濾關(guān)鍵技術(shù)的研究[D];電子科技大學(xué);2009年
3 鄧蔚;垃圾郵件過(guò)濾中的敵手分類問(wèn)題研究[D];電子科技大學(xué);2011年
4 孫晶濤;基于內(nèi)容的垃圾郵件過(guò)濾技術(shù)研究[D];蘭州理工大學(xué);2010年
中國(guó)碩士學(xué)位論文全文數(shù)據(jù)庫(kù) 前10條
1 甘棠儀;基于屬性論方法的垃圾郵件過(guò)濾系統(tǒng)設(shè)計(jì)與研究[D];上海海事大學(xué);2005年
2 王申;基于內(nèi)容的垃圾郵件過(guò)濾技術(shù)的若干研究[D];中國(guó)科學(xué)院研究生院(計(jì)算技術(shù)研究所);2005年
3 田月霞;基于疫苗機(jī)制的垃圾郵件過(guò)濾模型的研究[D];鄭州輕工業(yè)學(xué)院;2015年
4 許建明;基于內(nèi)容挖掘的中文垃圾郵件過(guò)濾技術(shù)研究與實(shí)現(xiàn)[D];湖南大學(xué);2008年
5 鄭梅;基于規(guī)則的垃圾郵件過(guò)濾系統(tǒng)設(shè)計(jì)與實(shí)現(xiàn)[D];電子科技大學(xué);2008年
6 王鵬鳴;基于偏最小二乘方法的垃圾郵件過(guò)濾研究[D];江西師范大學(xué);2008年
7 陳俊偉;圖片垃圾郵件過(guò)濾系統(tǒng)[D];華東師范大學(xué);2009年
8 徐雋;基于流數(shù)據(jù)特性的垃圾郵件過(guò)濾技術(shù)研究[D];復(fù)旦大學(xué);2009年
9 林偉;基于貝葉斯分類的垃圾郵件過(guò)濾系統(tǒng)研究與實(shí)現(xiàn)[D];西華大學(xué);2009年
10 徐熙;基于內(nèi)容的多級(jí)垃圾郵件過(guò)濾系統(tǒng)研究[D];西華大學(xué);2009年
,本文編號(hào):829166
本文鏈接:http://sikaile.net/guanlilunwen/ydhl/829166.html