天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

基于網(wǎng)頁結(jié)構(gòu)的網(wǎng)站檢測研究

發(fā)布時間:2018-08-31 11:41
【摘要】:為了準(zhǔn)確檢測出仿冒網(wǎng)站,提出了一種基于網(wǎng)頁結(jié)構(gòu)的頁面相似度計算方法。該方法首先將網(wǎng)頁分塊并進(jìn)行合理的篩選,其次通過初步比對確定相似節(jié)點(diǎn)群,最后將網(wǎng)頁數(shù)據(jù)量化并計算出網(wǎng)頁是否相似。試驗(yàn)表明,該方法可以有效地檢測出網(wǎng)頁相似情況,對于仿冒網(wǎng)站的鏡像尤其明顯,誤報率及漏報率均不超過10%。
[Abstract]:In order to accurately detect fake websites, a page similarity calculation method based on web structure is proposed. In this method, the web pages are divided into blocks and selected reasonably, and then the similar node groups are determined by preliminary comparison. Finally, the web page data is quantized and the similarity of the pages is calculated. Experiments show that this method can effectively detect the similarity of web pages, especially for the mirror images of fake websites, and the false alarm rate and false alarm rate are not more than 10%.
【作者單位】: 哈爾濱工業(yè)大學(xué)計算機(jī)科學(xué)與技術(shù)學(xué)院;
【基金】:國家自然科學(xué)基金(61170262,61371177)資助項(xiàng)目
【分類號】:TP393.092

【參考文獻(xiàn)】

相關(guān)期刊論文 前3條

1 朱毅華;張超群;曾通;吳龍鳳;徐瑪麗;王東波;李曉暉;;基于子樹相似度計算的網(wǎng)頁評論提取算法研究[J];現(xiàn)代圖書情報技術(shù);2013年11期

2 何忠秀;王霜;安禮成;;基于向量空間的網(wǎng)頁內(nèi)容相似度計算方法研究[J];計算機(jī)與現(xiàn)代化;2010年09期

3 郭淼霞;吳揚(yáng)揚(yáng);;基于Web超鏈接結(jié)構(gòu)信息的網(wǎng)頁分類技術(shù)研究[J];泉州師范學(xué)院學(xué)報;2008年04期

【共引文獻(xiàn)】

相關(guān)期刊論文 前5條

1 李大輝;何清剛;王佰玲;鄒新一;;基于網(wǎng)頁結(jié)構(gòu)的網(wǎng)站檢測研究[J];高技術(shù)通訊;2015年Z2期

2 趙濤;張?zhí)t;陳燕紅;;中文農(nóng)業(yè)網(wǎng)頁去重及相似度判斷研究[J];計算機(jī)技術(shù)與發(fā)展;2015年01期

3 蔣宗禮;時福林;;基于鏈接關(guān)系的網(wǎng)頁分類優(yōu)化算法[J];計算機(jī)與現(xiàn)代化;2014年05期

4 郭淼霞;;中文網(wǎng)頁分類研究綜述[J];赤峰學(xué)院學(xué)報(自然科學(xué)版);2011年12期

5 郭淼霞;;網(wǎng)頁分類中的數(shù)據(jù)預(yù)處理方法研究[J];莆田學(xué)院學(xué)報;2011年05期

【二級參考文獻(xiàn)】

相關(guān)期刊論文 前10條

1 劉偉;嚴(yán)華梁;肖建國;曾建勛;;一種Web評論自動抽取方法[J];軟件學(xué)報;2010年12期

2 聶卉;黃貴鵬;;樹編輯距離在Web信息抽取中的應(yīng)用與實(shí)現(xiàn)[J];現(xiàn)代圖書情報技術(shù);2010年05期

3 王利;劉宗田;王燕華;廖濤;;基于內(nèi)容相似度的網(wǎng)頁正文提取[J];計算機(jī)工程;2010年06期

4 安增文;徐杰鋒;;基于視覺特征的網(wǎng)頁正文提取方法研究[J];微型機(jī)與應(yīng)用;2010年03期

5 許世明;武波;馬翠;邸思;徐洪奎;杜如虛;;一種基于預(yù)分類的高效SVM中文網(wǎng)頁分類器[J];計算機(jī)工程與應(yīng)用;2010年01期

6 陳芨熙;顧新建;陳國海;魏江;;基于向量空間模型和專利文獻(xiàn)特征的相似專利確定方法[J];浙江大學(xué)學(xué)報(工學(xué)版);2009年10期

7 毛雪云;曾國蓀;王偉;;基于向量空間模型的網(wǎng)頁文本可信性分類方法[J];計算機(jī)工程與應(yīng)用;2008年25期

8 李姜;;基于DOM的評論發(fā)現(xiàn)及抽取模型研究[J];計算機(jī)工程與設(shè)計;2007年09期

9 郭晨娟;李戰(zhàn)懷;;基于概念的網(wǎng)頁相似度處理算法研究[J];計算機(jī)應(yīng)用;2006年12期

10 馬輝民;李衛(wèi)華;吳良元;;VSM在中文文本聚類中的應(yīng)用及實(shí)證分析[J];武漢理工大學(xué)學(xué)報(信息與管理工程版);2006年04期

,

本文編號:2214880

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/guanlilunwen/ydhl/2214880.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶d7c69***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com