天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁 > 科技論文 > 搜索引擎論文 >

基于網(wǎng)頁內(nèi)容塊策略的主題爬行

發(fā)布時(shí)間:2018-05-31 02:25

  本文選題:定題搜索 + 主題爬行 ; 參考:《計(jì)算機(jī)工程與應(yīng)用》2008年09期


【摘要】:因特網(wǎng)的迅速發(fā)展對傳統(tǒng)的爬行器和搜索引擎提出了巨大的挑戰(zhàn)。各種針對特定領(lǐng)域、特定人群的搜索引擎應(yīng)運(yùn)而生。Web主題信息搜索系統(tǒng)(網(wǎng)絡(luò)蜘蛛)是主題搜索引擎的最主要的部分,它的任務(wù)是將搜集到的符合要求的Web頁面返回給用戶或保存在索引庫中。Web上的信息資源如此廣泛,如何全面而高效地搜集到感興趣的內(nèi)容是網(wǎng)絡(luò)蜘蛛的研究重點(diǎn)。提出了基于網(wǎng)頁分塊技術(shù)的主題爬行,實(shí)驗(yàn)結(jié)果表明,相對于其它的爬行算法,提出的算法具有較高的效率、爬準(zhǔn)率、爬全率及穿越隧道的能力。
[Abstract]:The rapid development of the Internet poses a great challenge to the traditional crawlers and search engines. A variety of search engines for specific areas, specific groups of search engines emerge as the times require. Web subject information search system (web spider) is the most important part of the theme search engine. Its task is to return the collected Web pages to users or to store the information resources on the index library. How to collect the content of interest is the research focus of web spiders. A topic crawling algorithm based on web partitioning technology is proposed. The experimental results show that the proposed algorithm has higher efficiency, accuracy rate, total crawling rate and the ability to cross the tunnel than other crawling algorithms.
【作者單位】: 沈陽炮兵學(xué)院基礎(chǔ)部計(jì)算機(jī)實(shí)驗(yàn)中心 沈陽炮兵學(xué)院基礎(chǔ)部計(jì)算機(jī)實(shí)驗(yàn)中心 沈陽炮兵學(xué)院基礎(chǔ)部計(jì)算機(jī)實(shí)驗(yàn)中心
【分類號】:TP391.9

【參考文獻(xiàn)】

相關(guān)期刊論文 前1條

1 赫楓齡,左萬利;利用超鏈接信息改進(jìn)網(wǎng)頁爬行器的搜索策略[J];吉林大學(xué)學(xué)報(bào)(信息科學(xué)版);2005年01期

【共引文獻(xiàn)】

相關(guān)碩士學(xué)位論文 前3條

1 林樂彬;Inar網(wǎng)絡(luò)爬蟲的設(shè)計(jì)與實(shí)現(xiàn)[D];哈爾濱工業(yè)大學(xué);2006年

2 韓亮;基于本體的消防信息檢索系統(tǒng)的研究[D];大連海事大學(xué);2008年

3 操衛(wèi)平;基于結(jié)構(gòu)化向量空間模型的中文信息檢索系統(tǒng)研究與實(shí)現(xiàn)[D];北京工業(yè)大學(xué);2008年

【二級參考文獻(xiàn)】

相關(guān)期刊論文 前1條

1 赫楓齡,陶文學(xué),李凱,周力,左萬利;新一代網(wǎng)絡(luò)搜索引擎系統(tǒng)CHINA_VIVI的實(shí)現(xiàn)[J];吉林大學(xué)學(xué)報(bào)(理學(xué)版);2003年02期

【相似文獻(xiàn)】

相關(guān)期刊論文 前8條

1 宋聚平,王永成,尹中航,滕偉;面向主題的網(wǎng)頁搜索系統(tǒng)[J];上海交通大學(xué)學(xué)報(bào);2003年03期

2 陳定權(quán);基于超鏈分析的Web資源自動發(fā)現(xiàn)技術(shù)[J];圖書情報(bào)工作;2003年09期

3 龍宇巍,王永成,許歡慶;定題搜索引擎Robot的設(shè)計(jì)與算法[J];計(jì)算機(jī)仿真;2004年04期

4 陳樤;企業(yè)競爭情報(bào)的服務(wù)模式[J];軟件工程師;2004年06期

5 譚思亮;;一種新的主題爬行算法[J];微計(jì)算機(jī)信息;2007年06期

6 吳曉平;張長利;朱麗娜;;基于網(wǎng)頁內(nèi)容塊策略的主題爬行[J];計(jì)算機(jī)工程與應(yīng)用;2008年09期

7 李曉亞;赫楓齡;左萬利;;基于網(wǎng)頁分塊技術(shù)主題爬行器的實(shí)現(xiàn)[J];吉林大學(xué)學(xué)報(bào)(理學(xué)版);2007年06期

8 張忠元;王洪肖;;基于網(wǎng)頁分塊技術(shù)的主題爬行[J];中國高新技術(shù)企業(yè);2008年16期

相關(guān)博士學(xué)位論文 前3條

1 彭濤;面向?qū)I(yè)搜索引擎的主題爬行技術(shù)研究[D];吉林大學(xué);2007年

2 陳竹敏;面向垂直搜索引擎的主題爬行技術(shù)研究[D];山東大學(xué);2008年

3 羅娜;基于本體的主題爬行技術(shù)研究[D];吉林大學(xué);2009年

相關(guān)碩士學(xué)位論文 前10條

1 肖曉軍;數(shù)字圖書館信息服務(wù)子系統(tǒng)若干項(xiàng)目的設(shè)計(jì)和實(shí)現(xiàn)[D];國防科學(xué)技術(shù)大學(xué);2001年

2 王煜;基于頁面劃分的網(wǎng)面預(yù)測[D];吉林大學(xué);2005年

3 張長利;網(wǎng)頁相似性算法的研究與實(shí)現(xiàn)[D];吉林大學(xué);2005年

4 柳周頻;基于鏈接上下文的網(wǎng)頁預(yù)測[D];吉林大學(xué);2006年

5 劉志強(qiáng);基于文本經(jīng)驗(yàn)?zāi)P偷闹黝}爬行系統(tǒng)[D];吉林大學(xué);2006年

6 董靜茹;基于鏈接背景信息的啟發(fā)式主題爬行[D];吉林大學(xué);2006年

7 辛銳銘;分塊主題爬行[D];吉林大學(xué);2006年

8 姜鑫;基于網(wǎng)頁連通信息的主題爬行技術(shù)研究與實(shí)現(xiàn)[D];吉林大學(xué);2007年

9 張超群;基于網(wǎng)頁分塊技術(shù)的主題爬行[D];吉林大學(xué);2007年

10 姚忠存;錨文本增量主題爬行[D];吉林大學(xué);2007年

,

本文編號:1957927

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/sousuoyinqinglunwen/1957927.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶d2fc8***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com