天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁 > 科技論文 > 搜索引擎論文 >

主題網(wǎng)絡(luò)爬蟲研究綜述

發(fā)布時間:2017-11-01 23:13

  本文關(guān)鍵詞:主題網(wǎng)絡(luò)爬蟲研究綜述


  更多相關(guān)文章: 主題網(wǎng)絡(luò)爬蟲 信息檢索 Web挖掘


【摘要】:首先給出了主題網(wǎng)絡(luò)爬蟲的定義和研究目標(biāo);然后系統(tǒng)分析了近年來國內(nèi)外主題爬蟲的研究方法和技術(shù),包括基于文字內(nèi)容的方法、基于超鏈分析的方法、基于分類器預(yù)測的方法以及其他主題爬行方法,并比較了各種方法優(yōu)缺點(diǎn);最后對未來的研究方向進(jìn)行了展望。
【作者單位】: 解放軍電子工程學(xué)院網(wǎng)絡(luò)系 解放軍電子工程學(xué)院網(wǎng)絡(luò)系
【關(guān)鍵詞】主題網(wǎng)絡(luò)爬蟲 信息檢索 Web挖掘
【分類號】:TP391.3
【正文快照】: 0引言隨著網(wǎng)絡(luò)上海量信息的爆炸式增長,通用搜索引擎面臨著索引規(guī)模、更新速度和個性化需求等多方面的挑戰(zhàn)[1,2]。面對這些挑戰(zhàn),適應(yīng)特定主題和個性化搜索的主題網(wǎng)絡(luò)爬蟲(fo-cused craw ler or top ical craw ler)應(yīng)運(yùn)而生[3,4]。基于主題網(wǎng)絡(luò)爬蟲的搜索引擎(即第四代搜索引擎

【參考文獻(xiàn)】

中國期刊全文數(shù)據(jù)庫 前2條

1 李衛(wèi);劉建毅;何華燦;王樅;;基于主題的智能Web信息采集系統(tǒng)的研究與實(shí)現(xiàn)[J];計算機(jī)應(yīng)用研究;2006年02期

2 傅向華,馮博琴,馬兆豐,何明;可在線增量自學(xué)習(xí)的聚焦爬行方法[J];西安交通大學(xué)學(xué)報;2004年06期

【共引文獻(xiàn)】

中國期刊全文數(shù)據(jù)庫 前3條

1 趙佳鶴;王秀坤;劉亞欣;;基于語義分析的主題信息采集系統(tǒng)的設(shè)計與實(shí)現(xiàn)[J];計算機(jī)應(yīng)用;2007年02期

2 傅向華;馮博琴;;一種支持復(fù)雜查詢的有組織P2P搜索方法[J];小型微型計算機(jī)系統(tǒng);2006年03期

3 傅向華;馮博琴;;主題驅(qū)動的P2P分布式信息搜索機(jī)制研究[J];小型微型計算機(jī)系統(tǒng);2006年04期

中國博士學(xué)位論文全文數(shù)據(jù)庫 前1條

1 尹世群;Web文本分類關(guān)鍵技術(shù)研究[D];西南大學(xué);2008年

中國碩士學(xué)位論文全文數(shù)據(jù)庫 前9條

1 吳東華;Web信息獲取技術(shù)研究[D];南京理工大學(xué);2004年

2 壽周翔;專業(yè)搜索引擎的研究與設(shè)計[D];浙江大學(xué);2005年

3 馬驪;基于搜索引擎技術(shù)的警情信息搜集系統(tǒng)的研究與實(shí)現(xiàn)[D];山東大學(xué);2006年

4 趙佳鶴;基于語義分析的網(wǎng)絡(luò)信息采集算法研究與應(yīng)用[D];大連理工大學(xué);2006年

5 劉潔清;網(wǎng)站聚焦爬蟲研究[D];江西財經(jīng)大學(xué);2006年

6 孫雷;面向特定領(lǐng)域的智能搜索技術(shù)研究[D];哈爾濱工程大學(xué);2007年

7 魏霞;面向網(wǎng)絡(luò)教育的學(xué)習(xí)評價依據(jù)采集系統(tǒng)的研究與實(shí)現(xiàn)[D];浙江工業(yè)大學(xué);2007年

8 謝德輝;面向刑偵網(wǎng)頁的信息抽取與主題爬蟲應(yīng)用研究[D];大連理工大學(xué);2007年

9 許琦;個性化信息服務(wù)技術(shù)研究[D];浙江大學(xué);2007年

【二級參考文獻(xiàn)】

中國期刊全文數(shù)據(jù)庫 前3條

1 蘇偉峰,李紹滋,李堂秋;一個基于概念的中文文本分類模型[J];計算機(jī)工程與應(yīng)用;2002年06期

2 代六玲,黃河燕,陳肇雄;中文文本分類中特征抽取方法的比較研究[J];中文信息學(xué)報;2004年01期

3 宮秀軍,史忠植;基于Bayes潛在語義模型的半監(jiān)督Web挖掘[J];軟件學(xué)報;2002年08期

【相似文獻(xiàn)】

中國期刊全文數(shù)據(jù)庫 前10條

1 葉鷹,馬景娣,黃晨,朱聰,胡曉珍,劉瓊;信息檢索網(wǎng)上自助教學(xué)探索[J];大學(xué)圖書館學(xué)報;2000年02期

2 賴俊;周琳;張學(xué)平;;基于Web挖掘的主題式搜索引擎的設(shè)計[J];軍事通信技術(shù);2004年03期

3 彭波,閆宏飛;搜索引擎檢索系統(tǒng)質(zhì)量評估[J];計算機(jī)研究與發(fā)展;2005年10期

4 王國金,康耀紅;基于布爾檢索策略的問答系統(tǒng)性能研究[J];科技廣場;2005年10期

5 李雷;;常用醫(yī)學(xué)搜索引擎簡介[J];西北醫(yī)學(xué)教育;2005年05期

6 張選平;蔣宇;袁明軒;馬琮;梁平;;一種基于概念的信息檢索查詢擴(kuò)展[J];微電子學(xué)與計算機(jī);2006年04期

7 劉策;;垂直搜索——電子商務(wù)領(lǐng)域的新秀[J];軟件導(dǎo)刊;2006年11期

8 吳紅;;網(wǎng)上免費(fèi)農(nóng)業(yè)信息資源的檢索挖掘策略[J];農(nóng)業(yè)網(wǎng)絡(luò)信息;2006年09期

9 唐利;藍(lán)強(qiáng);;對網(wǎng)絡(luò)搜索引擎的比較研究[J];重慶文理學(xué)院學(xué)報(自然科學(xué)版);2006年04期

10 韓建福;盧葦;;文檔聚類在Web搜索結(jié)果中的應(yīng)用研究[J];中國科技信息;2006年23期

中國重要會議論文全文數(shù)據(jù)庫 前10條

1 ;編者的話[A];第二屆全國信息檢索與內(nèi)容安全學(xué)術(shù)會議(NCIRCS-2005)論文集[C];2005年

2 米曉紅;;一種基于LSI的用戶興趣模型構(gòu)建方法[A];計算機(jī)技術(shù)與應(yīng)用進(jìn)展——全國第17屆計算機(jī)科學(xué)與技術(shù)應(yīng)用(CACIS)學(xué)術(shù)會議論文集(上冊)[C];2006年

3 王敬成;;HNC農(nóng)村智能信息檢索系統(tǒng)[A];2006年首屆ICT大會信息、知識、智能及其轉(zhuǎn)換理論第一次高峰論壇會議論文集[C];2006年

4 李應(yīng)興;付婷;李勇;;基于LUCENE的藏文信息檢索的研究與應(yīng)用[A];民族語言文字信息技術(shù)研究——第十一屆全國民族語言文字信息學(xué)術(shù)研討會論文集[C];2007年

5 田田;馬軍;李躍軍;;應(yīng)用多本體進(jìn)行信息檢索的研究[A];第二十二屆中國數(shù)據(jù)庫學(xué)術(shù)會議論文集(研究報告篇)[C];2005年

6 吳立德;黃萱菁;;前言[A];NCIRCS2004第一屆全國信息檢索與內(nèi)容安全學(xué)術(shù)會議論文集[C];2004年

7 吳曉;李丹寧;林潔;冀肖榆;李丹;;個性化搜索引擎中用戶興趣模型的研究[A];第三屆全國信息檢索與內(nèi)容安全學(xué)術(shù)會議論文集[C];2007年

8 秦鵬;李恒訓(xùn);張華平;劉金剛;;基于關(guān)鍵詞提取的搜索結(jié)果聚類研究[A];第五屆全國信息檢索學(xué)術(shù)會議論文集[C];2009年

9 陳志瑋;肖詩斌;施水才;王昕;;一種基于HTML位置信息的查詢擴(kuò)展技術(shù)[A];第三屆學(xué)生計算語言學(xué)研討會論文集[C];2006年

10 文健;李舟軍;;基于聚類語言模型的生物文獻(xiàn)檢索技術(shù)研究[A];第三屆全國信息檢索與內(nèi)容安全學(xué)術(shù)會議論文集[C];2007年

中國重要報紙全文數(shù)據(jù)庫 前10條

1 希安;微軟試水信息檢索[N];經(jīng)濟(jì)日報;2004年

2 本報記者 潘永花;組件化平臺提升信息檢索效率[N];網(wǎng)絡(luò)世界;2003年

3 柏榮;國家973項目在因特網(wǎng)大規(guī)模信息檢索領(lǐng)域取得突破[N];中國高新技術(shù)產(chǎn)業(yè)導(dǎo)報;2003年

4 微軟中國研究院 陳正 李明鏡 馬維英;互聯(lián)網(wǎng)上圖像信息檢索[N];計算機(jī)世界;2001年

5 于振海;Microsoft Office 2003的翻譯服務(wù)你用了嗎?[N];中國電腦教育報;2004年

6 高麗華;信息化遭遇新雷區(qū)[N];計算機(jī)世界;2007年

7 李茂 編譯;創(chuàng)新是技術(shù)素養(yǎng)的第一要求[N];中國教師報;2007年

8 西安 張樹忠 時劍;如何使用Word 2003翻譯功能[N];電子報;2004年

9 涂序彥 陳泓娟;在網(wǎng)絡(luò)信息海洋中淘金[N];計算機(jī)世界;2001年

10 清華大學(xué)計算機(jī)系智能技術(shù)與系統(tǒng)國家重點(diǎn)實(shí)驗室 張敏 金奕江;“!敝袚啤罢洹盵N];計算機(jī)世界;2003年

中國博士學(xué)位論文全文數(shù)據(jù)庫 前10條

1 左家莉;信息檢索中Markov網(wǎng)絡(luò)圖模型研究[D];江西財經(jīng)大學(xué);2011年

2 吳定峰;基于本體的語義搜索模型研究[D];中國農(nóng)業(yè)科學(xué)院;2012年

3 董道國;高維數(shù)據(jù)索引結(jié)構(gòu)研究[D];復(fù)旦大學(xué);2005年

4 翟海軍;面向Web信息檢索的知識挖掘[D];中國科學(xué)技術(shù)大學(xué);2010年

5 林建方;詞搭配抽取及在信息檢索中的應(yīng)用研究[D];哈爾濱工業(yè)大學(xué);2010年

6 郭永明;XML文檔交互式信息檢索技術(shù)研究[D];東華大學(xué);2010年

7 林古立;互聯(lián)網(wǎng)信息檢索中的多樣化排序研究及應(yīng)用[D];華南理工大學(xué);2011年

8 馬馬杜 桑卡雷;基于多智能體的流體動力行業(yè)虛擬聯(lián)盟信息檢索的研究[D];浙江大學(xué);2002年

9 劉云峰;基于潛在語義分析的中文概念檢索研究[D];華中科技大學(xué);2005年

10 張毅波;史文結(jié)構(gòu)化信息檢索系統(tǒng)的研究與實(shí)現(xiàn)[D];中國科學(xué)院研究生院(軟件研究所);2001年

中國碩士學(xué)位論文全文數(shù)據(jù)庫 前10條

1 喬智勇;Web數(shù)據(jù)挖掘系統(tǒng)的設(shè)計及關(guān)鍵技術(shù)研究[D];西安電子科技大學(xué);2002年

2 楊才峰;基于自動分類的元搜索引擎的研究與應(yīng)用[D];華北電力大學(xué)(河北);2005年

3 宋海林;基于語言模型的信息檢索中負(fù)反饋技術(shù)的研究與實(shí)現(xiàn)[D];內(nèi)蒙古大學(xué);2011年

4 杭月芹;基于文檔查詢信息的檢索系統(tǒng)研究與實(shí)現(xiàn)[D];揚(yáng)州大學(xué);2005年

5 史錦榮;基于多Agent智能搜索引擎模型研究[D];太原理工大學(xué);2005年

6 吳媛媛;移動終端上個人信息檢索核心子系統(tǒng)的設(shè)計與實(shí)現(xiàn)[D];北京郵電大學(xué);2011年

7 羅建利;基于用戶興趣的概念查詢擴(kuò)展研究[D];揚(yáng)州大學(xué);2005年

8 曹雙喜;研究生在CNKI數(shù)字圖書館信息檢索過程中的選擇行為研究[D];西南大學(xué);2006年

9 馬志柔;中文信息檢索分類技術(shù)的研究[D];北京化工大學(xué);2005年

10 袁曉豐;列表類自動問題問答系統(tǒng)的設(shè)計與實(shí)現(xiàn)[D];復(fù)旦大學(xué);2008年

,

本文編號:1128935

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/sousuoyinqinglunwen/1128935.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶e76dd***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com