基于樸素貝葉斯的偽裝型垃圾網(wǎng)頁(yè)檢測(cè)
[Abstract]:Aiming at the problems of hiding, fraud and difficult to detect, the binary classification method is used to detect the camouflaged garbage pages. The method decomposes web pages into content features and link features, and uses naive Bayesian (NB) algorithm to classify and detect masquerade spam pages. Finally, the NB algorithm and several common classification algorithms are tested on the same data set. The results show that the comprehensive evaluation F1 value of the naive Bayesian algorithm is 94.644.It is obviously higher than the other classification algorithms. It can effectively detect the camouflaged spam pages and improve the quality of network information retrieval.
【作者單位】: 西南交通大學(xué)信息科學(xué)與技術(shù)學(xué)院;
【分類(lèi)號(hào)】:TP393.092
【參考文獻(xiàn)】
相關(guān)期刊論文 前2條
1 段軍峰;黃維通;陸玉昌;;中文網(wǎng)頁(yè)分類(lèi)研究與系統(tǒng)實(shí)現(xiàn)[J];計(jì)算機(jī)科學(xué);2007年06期
2 張彬;蔣濤;徐雨明;;Web Spam技術(shù)研究綜述(英文)[J];衡陽(yáng)師范學(xué)院學(xué)報(bào);2008年06期
相關(guān)碩士學(xué)位論文 前1條
1 段晶;樸素貝葉斯分類(lèi)及其應(yīng)用研究[D];大連海事大學(xué);2011年
【共引文獻(xiàn)】
相關(guān)期刊論文 前7條
1 任玉;樊勇;鄭家恒;;基于分塊的網(wǎng)頁(yè)主題文本抽取[J];廣西師范大學(xué)學(xué)報(bào)(自然科學(xué)版);2009年01期
2 胡軍;楊先芬;劉喜亮;黃慎;;基于屬性agent模型的新聞信息網(wǎng)頁(yè)篩選技術(shù)[J];計(jì)算機(jī)應(yīng)用研究;2009年05期
3 孫明柱;魏海平;;基于結(jié)構(gòu)樹(shù)的網(wǎng)頁(yè)正文內(nèi)容抽取方法[J];科學(xué)技術(shù)與工程;2011年28期
4 余一驕;劉芹;;基于語(yǔ)義的中文網(wǎng)頁(yè)檢索[J];計(jì)算機(jī)科學(xué);2012年08期
5 朱志寧;黃青松;;快速的中文網(wǎng)頁(yè)分類(lèi)方法實(shí)現(xiàn)[J];山西電子技術(shù);2008年04期
6 張素智;樊得強(qiáng);;網(wǎng)頁(yè)去重方法研究及算法設(shè)計(jì)[J];鄭州輕工業(yè)學(xué)院學(xué)報(bào)(自然科學(xué)版);2010年02期
7 朱興統(tǒng);左敬龍;張晶華;;改進(jìn)量子粒子群優(yōu)化支持向量機(jī)的網(wǎng)頁(yè)分類(lèi)[J];湖南科技大學(xué)學(xué)報(bào)(自然科學(xué)版);2012年03期
相關(guān)碩士學(xué)位論文 前10條
1 梁曄平;中文文本自動(dòng)分類(lèi)相關(guān)算法的研究與實(shí)現(xiàn)[D];華南理工大學(xué);2010年
2 鄧彩鳳;中文文本分類(lèi)中互信息特征選擇方法研究[D];西南大學(xué);2011年
3 彭浩林;基于內(nèi)容的敏感信息過(guò)濾系統(tǒng)研究[D];武漢科技大學(xué);2011年
4 王莎莎;元搜索引擎結(jié)果合成技術(shù)的研究[D];燕山大學(xué);2011年
5 汪光慶;基于SVM的網(wǎng)頁(yè)分類(lèi)技術(shù)研究[D];中國(guó)石油大學(xué);2011年
6 伍菲;面向主題型的網(wǎng)頁(yè)分類(lèi)技術(shù)的研究與實(shí)現(xiàn)[D];華中科技大學(xué);2011年
7 王舟;面向論壇信息文本的有效數(shù)據(jù)抽取研究[D];華中科技大學(xué);2011年
8 樊德強(qiáng);WEB個(gè)性化信息采集與管理關(guān)鍵技術(shù)研究[D];鄭州輕工業(yè)學(xué)院;2011年
9 胡銀娥;基于粗糙集的樸素貝葉斯分類(lèi)算法研究[D];長(zhǎng)沙理工大學(xué);2012年
10 馮靜;基于向量空間模型的中文網(wǎng)頁(yè)自動(dòng)分類(lèi)技術(shù)研究[D];中國(guó)石油大學(xué);2008年
【二級(jí)參考文獻(xiàn)】
相關(guān)期刊論文 前10條
1 孫藝軍;;冠心病的基本病機(jī)為氣虛血瘀[J];長(zhǎng)春中醫(yī)藥大學(xué)學(xué)報(bào);2011年01期
2 李秀玉;;中西醫(yī)結(jié)合治療冠心病心衰60例臨床觀察[J];湖南中醫(yī)雜志;2010年02期
3 周水庚,關(guān)佶紅,胡運(yùn)發(fā),周傲英;一個(gè)無(wú)需詞典支持和切詞處理的中文文檔分類(lèi)系統(tǒng)[J];計(jì)算機(jī)研究與發(fā)展;2001年07期
4 石洪波,黃厚寬,王志海;基于Boosting的TAN組合分類(lèi)器[J];計(jì)算機(jī)研究與發(fā)展;2004年02期
5 眭俊明;姜遠(yuǎn);周志華;;基于頻繁項(xiàng)集挖掘的貝葉斯分類(lèi)算法[J];計(jì)算機(jī)研究與發(fā)展;2007年08期
6 單松巍,馮是聰,李曉明;幾種典型特征選取方法在中文網(wǎng)頁(yè)分類(lèi)上的效果比較[J];計(jì)算機(jī)工程與應(yīng)用;2003年22期
7 鄧維斌;王國(guó)胤;王燕;;基于Rough Set的加權(quán)樸素貝葉斯分類(lèi)算法[J];計(jì)算機(jī)科學(xué);2007年02期
8 馬光志,陳鳳華;基于關(guān)聯(lián)規(guī)則的ABN分類(lèi)器構(gòu)造[J];計(jì)算機(jī)工程與科學(xué);2005年05期
9 陳永惠;;“益氣活血化痰湯”治療冠心病68例臨床觀察[J];江蘇中醫(yī)藥;2011年02期
10 黃科,馬少平;基于統(tǒng)計(jì)分詞的中文網(wǎng)頁(yè)分類(lèi)[J];中文信息學(xué)報(bào);2002年06期
【相似文獻(xiàn)】
相關(guān)期刊論文 前10條
1 陳治平;王雷;;基于自學(xué)習(xí)K近鄰的垃圾郵件過(guò)濾算法[J];計(jì)算機(jī)應(yīng)用;2005年S1期
2 李君;張順頤;王浩云;李翠蓮;;基于貝葉斯網(wǎng)絡(luò)的Peer-to-Peer識(shí)別方法[J];應(yīng)用科學(xué)學(xué)報(bào);2009年02期
3 謝偉全;葉強(qiáng);李一軍;;基于用戶知識(shí)的中文電子郵件分類(lèi)[J];計(jì)算機(jī)應(yīng)用研究;2007年03期
4 徐治國(guó);;基于樸素貝葉斯的垃圾郵件分類(lèi)系統(tǒng)的設(shè)計(jì)[J];鹽城工學(xué)院學(xué)報(bào)(自然科學(xué)版);2008年02期
5 吳艷;劉建波;;電子郵件自動(dòng)處理的用戶模型設(shè)計(jì)[J];沈陽(yáng)化工學(xué)院學(xué)報(bào);2005年04期
6 王旭仁;許榕生;;基于機(jī)器學(xué)習(xí)的入侵檢測(cè)系統(tǒng)研究[J];計(jì)算機(jī)工程;2006年14期
7 楊柳;熊德意;;基于內(nèi)容的反垃圾郵件過(guò)濾器研究[J];電腦知識(shí)與技術(shù)(學(xué)術(shù)交流);2007年06期
8 閆鵬;鄭雪峰;朱建勇;肖峗泓;;一種基于嵌入式特征選擇的垃圾郵件過(guò)濾模型[J];小型微型計(jì)算機(jī)系統(tǒng);2009年08期
9 唐繼勇;宋華;孫浩;鄧亞平;;基于粗糙集理論與核匹配追蹤的入侵檢測(cè)[J];計(jì)算機(jī)應(yīng)用;2010年05期
10 王德文;趙文清;朱永利;;一個(gè)基于粗糙集理論的郵件分類(lèi)模型[J];計(jì)算機(jī)工程與應(yīng)用;2006年18期
相關(guān)會(huì)議論文 前10條
1 陳時(shí)敏;韓心慧;;基于機(jī)器學(xué)習(xí)的網(wǎng)頁(yè)木馬識(shí)別方法研究[A];第26次全國(guó)計(jì)算機(jī)安全學(xué)術(shù)交流會(huì)論文集[C];2011年
2 鄧蔚;秦志光;;基于Kolmogorov復(fù)雜性的垃圾信息過(guò)濾研究綜述[A];中國(guó)電子學(xué)會(huì)第十七屆信息論學(xué)術(shù)年會(huì)論文集[C];2010年
3 柳斌;李之棠;涂浩;;一種基于半監(jiān)督學(xué)習(xí)的應(yīng)用層流量分類(lèi)方法[A];2008年全國(guó)開(kāi)放式分布與并行計(jì)算機(jī)學(xué)術(shù)會(huì)議論文集(下冊(cè))[C];2008年
4 張少波;劉明;賈曉靜;朱衛(wèi)東;;數(shù)據(jù)包分類(lèi)算法研究與設(shè)計(jì)[A];教育部中南地區(qū)高等學(xué)校電子電氣基礎(chǔ)課教學(xué)研究會(huì)第二十屆學(xué)術(shù)年會(huì)會(huì)議論文集(下冊(cè))[C];2010年
5 王超;辛陽(yáng);;C5.0分類(lèi)算法在網(wǎng)絡(luò)入侵檢測(cè)中的應(yīng)用[A];第十三屆中國(guó)科協(xié)年會(huì)第11分會(huì)場(chǎng)-中國(guó)智慧城市論壇論文集[C];2011年
6 丁山山;陳世平;;智能Agent技術(shù)在個(gè)性化WEB信息代理中的應(yīng)用研究[A];輝煌二十年——中國(guó)中文信息學(xué)會(huì)二十周年學(xué)術(shù)會(huì)議論文集[C];2001年
7 余磊;鄧亞平;王江波;李欽;陳云;;一種多維IP包分類(lèi)算法[A];2006年全國(guó)開(kāi)放式分布與并行計(jì)算學(xué)術(shù)會(huì)議論文集(一)[C];2006年
8 李毅;顧健;顧鐵軍;;基于樸素貝葉斯方法的郵件樣本預(yù)篩選[A];全國(guó)計(jì)算機(jī)安全學(xué)術(shù)交流會(huì)論文集·第二十五卷[C];2010年
9 劉曉勇;;基于GA與SVM融合的網(wǎng)頁(yè)分類(lèi)算法[A];中國(guó)運(yùn)籌學(xué)會(huì)模糊信息與模糊工程分會(huì)第五屆學(xué)術(shù)年會(huì)論文集[C];2010年
10 陳鑫;梁海潔;廖騰峰;;基于TSVM分類(lèi)器和混合型特征選擇方法的入侵檢測(cè)研究[A];2010年全國(guó)開(kāi)放式分布與并行計(jì)算機(jī)學(xué)術(shù)會(huì)議論文集[C];2010年
相關(guān)重要報(bào)紙文章 前10條
1 ;SecuiWALL獨(dú)創(chuàng)分類(lèi)算法[N];計(jì)算機(jī)世界;2002年
2 ;銳捷RG-WALL系列防火墻[N];電腦商報(bào);2004年
3 阮光塵邋朱元春;多層構(gòu)建郵件免疫機(jī)能[N];中國(guó)計(jì)算機(jī)報(bào);2007年
4 沈生;多管齊下清理網(wǎng)上垃圾[N];中國(guó)計(jì)算機(jī)報(bào);2004年
5 ;三星防火墻為人!氨kU(xiǎn)”[N];計(jì)算機(jī)世界;2002年
6 ;百兆防火墻[N];計(jì)算機(jī)世界;2002年
7 ;關(guān)注移動(dòng)應(yīng)用 諾基亞打造Nokia Access Mobilizer[N];網(wǎng)絡(luò)世界;2003年
8 ;銳捷網(wǎng)絡(luò)落戶山東萊陽(yáng)[N];網(wǎng)絡(luò)世界;2004年
9 ;確保電信網(wǎng)安全[N];中國(guó)計(jì)算機(jī)報(bào);2002年
10 劉宏偉;整合是一種趨勢(shì)[N];中國(guó)計(jì)算機(jī)報(bào);2004年
相關(guān)博士學(xué)位論文 前10條
1 陳治平;智能搜索引擎理論與應(yīng)用研究[D];湖南大學(xué);2003年
2 賈銀山;支持向量機(jī)算法及其在網(wǎng)絡(luò)入侵檢測(cè)中的應(yīng)用[D];大連海事大學(xué);2004年
3 左申正;基于機(jī)器學(xué)習(xí)的網(wǎng)絡(luò)異常分析及響應(yīng)研究[D];北京郵電大學(xué);2010年
4 何召衛(wèi);受限本體相似[D];北京郵電大學(xué);2008年
5 李戰(zhàn)春;入侵檢測(cè)中的機(jī)器學(xué)習(xí)方法及其應(yīng)用研究[D];華中科技大學(xué);2007年
6 柳斌;P2P流的測(cè)量與識(shí)別方法研究[D];華中科技大學(xué);2008年
7 王美珍;垃圾郵件行為模式識(shí)別與過(guò)濾方法研究[D];華中科技大學(xué);2009年
8 彭元喜;高速I(mǎi)P分組分類(lèi)算法及其實(shí)現(xiàn)技術(shù)的研究[D];國(guó)防科學(xué)技術(shù)大學(xué);2001年
9 夏迎炬;文本過(guò)濾關(guān)鍵技術(shù)研究[D];復(fù)旦大學(xué);2003年
10 鄒濤;智能網(wǎng)絡(luò)入侵檢測(cè)系統(tǒng)關(guān)鍵技術(shù)研究[D];國(guó)防科學(xué)技術(shù)大學(xué);2004年
相關(guān)碩士學(xué)位論文 前10條
1 李笛;基于內(nèi)容的垃圾郵件過(guò)濾方法研究[D];合肥工業(yè)大學(xué);2008年
2 亢華愛(ài);入侵檢測(cè)系統(tǒng)中基于代價(jià)敏感分類(lèi)算法的研究[D];太原理工大學(xué);2005年
3 張艦波;基于內(nèi)容的垃圾郵件智能過(guò)濾系統(tǒng)研究[D];貴州大學(xué);2008年
4 向光;基于機(jī)器學(xué)習(xí)和數(shù)據(jù)挖掘的入侵檢測(cè)技術(shù)研究[D];東北大學(xué);2005年
5 黃際洲;聊天機(jī)器人知識(shí)庫(kù)自動(dòng)抽取算法的研究與實(shí)現(xiàn)[D];重慶大學(xué);2006年
6 蘆明;語(yǔ)義網(wǎng)服務(wù)中基于機(jī)器學(xué)習(xí)的本體映射研究[D];大連海事大學(xué);2008年
7 蔣道霞;基于機(jī)器學(xué)習(xí)的入侵檢測(cè)系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)[D];南京理工大學(xué);2005年
8 李東升;主題搜索引擎研究[D];哈爾濱工程大學(xué);2005年
9 那力嘉;基于個(gè)人信息管理的郵件處理系統(tǒng)[D];天津大學(xué);2004年
10 成寶國(guó);基于統(tǒng)計(jì)方法的垃圾郵件處理技術(shù)研究[D];西北大學(xué);2006年
,本文編號(hào):2297315
本文鏈接:http://sikaile.net/guanlilunwen/ydhl/2297315.html