基于本體的主題網(wǎng)絡(luò)爬蟲設(shè)計(jì)
[Abstract]:Web crawler is an important part of search engine. The working principle of topic network crawler is analyzed, the calculation method of topic correlation degree is studied, the solution of topic network crawler based on ontology is put forward, and the evaluation experiment system is designed and implemented. Finally, the experimental results are compared and its feasibility is demonstrated.
【作者單位】: 武漢理工大學(xué)計(jì)算機(jī)科學(xué)與技術(shù)學(xué)院;
【分類號】:TP391.3
【參考文獻(xiàn)】
相關(guān)期刊論文 前3條
1 李衛(wèi);劉建毅;何華燦;王樅;;基于主題的智能Web信息采集系統(tǒng)的研究與實(shí)現(xiàn)[J];計(jì)算機(jī)應(yīng)用研究;2006年02期
2 劉金紅;陸余良;;主題網(wǎng)絡(luò)爬蟲研究綜述[J];計(jì)算機(jī)應(yīng)用研究;2007年10期
3 汪濤,樊孝忠;鏈接分析對主題爬蟲的改進(jìn)[J];計(jì)算機(jī)應(yīng)用;2004年S2期
相關(guān)碩士學(xué)位論文 前1條
1 杜超華;基于本體的省情網(wǎng)垂直搜索引擎研究[D];華中師范大學(xué);2007年
【共引文獻(xiàn)】
相關(guān)期刊論文 前3條
1 趙佳鶴;王秀坤;劉亞欣;;基于語義分析的主題信息采集系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)[J];計(jì)算機(jī)應(yīng)用;2007年02期
2 劉金紅;陸余良;;主題網(wǎng)絡(luò)爬蟲研究綜述[J];計(jì)算機(jī)應(yīng)用研究;2007年10期
3 王二平;Web站點(diǎn)結(jié)構(gòu)及網(wǎng)頁特征信息的抽取[J];呂梁高等?茖W(xué)校學(xué)報(bào);2004年02期
相關(guān)會議論文 前3條
1 王棟;陳勇;徐建良;;基于預(yù)測的BitTorrent種子評估方法[A];2008'中國信息技術(shù)與應(yīng)用學(xué)術(shù)論壇論文集(二)[C];2008年
2 姜麗華;張宏斌;;基于Multi-Agent的個(gè)性化Web信息采集系統(tǒng)[A];中國農(nóng)業(yè)信息科技創(chuàng)新與學(xué)科發(fā)展大會論文匯編[C];2007年
3 戴玉剛;;藏文網(wǎng)頁采集技術(shù)研究[A];民族語言文字信息技術(shù)研究——第十一屆全國民族語言文字信息學(xué)術(shù)研討會論文集[C];2007年
相關(guān)博士學(xué)位論文 前1條
1 尹世群;Web文本分類關(guān)鍵技術(shù)研究[D];西南大學(xué);2008年
相關(guān)碩士學(xué)位論文 前10條
1 王秋玲;基于RDF的Web資源管理關(guān)鍵技術(shù)研究與應(yīng)用[D];解放軍信息工程大學(xué);2006年
2 朱玉麗;基于網(wǎng)格技術(shù)的主題爬蟲算法優(yōu)化的研究與實(shí)現(xiàn)[D];沈陽工業(yè)大學(xué);2007年
3 吳東華;Web信息獲取技術(shù)研究[D];南京理工大學(xué);2004年
4 壽周翔;專業(yè)搜索引擎的研究與設(shè)計(jì)[D];浙江大學(xué);2005年
5 李新安;基于領(lǐng)域主題的Web信息檢索技術(shù)研究[D];山東大學(xué);2006年
6 馬驪;基于搜索引擎技術(shù)的警情信息搜集系統(tǒng)的研究與實(shí)現(xiàn)[D];山東大學(xué);2006年
7 趙佳鶴;基于語義分析的網(wǎng)絡(luò)信息采集算法研究與應(yīng)用[D];大連理工大學(xué);2006年
8 劉潔清;網(wǎng)站聚焦爬蟲研究[D];江西財(cái)經(jīng)大學(xué);2006年
9 羅兵;支持AJAX的互聯(lián)網(wǎng)搜索引擎爬蟲設(shè)計(jì)與實(shí)現(xiàn)[D];浙江大學(xué);2007年
10 孫雷;面向特定領(lǐng)域的智能搜索技術(shù)研究[D];哈爾濱工程大學(xué);2007年
【二級參考文獻(xiàn)】
相關(guān)期刊論文 前10條
1 蘇偉峰,李紹滋,李堂秋;一個(gè)基于概念的中文文本分類模型[J];計(jì)算機(jī)工程與應(yīng)用;2002年06期
2 趙慶齡,錢平,蘇曉路,趙明;本體論在基于Web的土壤知識體系智能檢索系統(tǒng)中的應(yīng)用[J];計(jì)算機(jī)工程與應(yīng)用;2005年05期
3 朱華宇,孫正興,張福炎;一個(gè)基于向量空間模型的中文文本自動分類系統(tǒng)[J];計(jì)算機(jī)工程;2001年02期
4 萬捷,滕至陽;本體論在基于內(nèi)容信息檢索中的應(yīng)用[J];計(jì)算機(jī)工程;2003年04期
5 吳光遠(yuǎn),何丕廉,曹桂宏,聶頌;基于向量空間模型的詞共現(xiàn)研究及其在文本分類中的應(yīng)用[J];計(jì)算機(jī)應(yīng)用;2003年S1期
6 林春梅,何躍;創(chuàng)建企業(yè)本體模型的研究[J];計(jì)算機(jī)應(yīng)用研究;2003年01期
7 李衛(wèi);劉建毅;何華燦;王樅;;基于主題的智能Web信息采集系統(tǒng)的研究與實(shí)現(xiàn)[J];計(jì)算機(jī)應(yīng)用研究;2006年02期
8 代六玲,黃河燕,陳肇雄;中文文本分類中特征抽取方法的比較研究[J];中文信息學(xué)報(bào);2004年01期
9 張?jiān)?趙仲孟,沈鈞毅;一種基于向量空間模型的個(gè)性化搜索引擎研究[J];微電子學(xué)與計(jì)算機(jī);2003年11期
10 黃國景,崔志明;基于Ontology的個(gè)性化元搜索引擎研究[J];微電子學(xué)與計(jì)算機(jī);2004年12期
相關(guān)會議論文 前1條
1 顏偉;荀恩東;;基于WordNet的英語詞語相似度計(jì)算[A];第二屆全國學(xué)生計(jì)算語言學(xué)研討會論文集[C];2004年
【相似文獻(xiàn)】
相關(guān)期刊論文 前10條
1 王宇,張秀彬;集群式智能型網(wǎng)絡(luò)信息自動搜尋與采集系統(tǒng)[J];上海交通大學(xué)學(xué)報(bào);1998年08期
2 朱巖;;四海一家 AltaVista推出全球索引[J];每周電腦報(bào);1998年19期
3 林海;做個(gè)超級網(wǎng)蟲——鸚鵡螺網(wǎng)絡(luò)助手簡介[J];計(jì)算機(jī)與網(wǎng)絡(luò);2001年15期
4 鄧志鴻,唐世渭,楊冬青;基于本體的多Agent分布式數(shù)字圖書館資源信息發(fā)現(xiàn)服務(wù)模型之研究[J];計(jì)算機(jī)工程;2002年06期
5 汪小棟,董紅斌;一種基于Linux平臺的搜索引擎初探[J];計(jì)算機(jī)應(yīng)用研究;2002年06期
6 潘春華 ,常敏 ,武港山;面向Web的信息收集工具的設(shè)計(jì)與開發(fā)[J];計(jì)算機(jī)應(yīng)用研究;2002年06期
7 張曉星;基于知識管理的網(wǎng)絡(luò)資源管理[J];國家圖書館學(xué)刊;2003年01期
8 曹科;基于Internet的信息挖掘研究[J];計(jì)算技術(shù)與自動化;2003年01期
9 Sergey Brin;Lawrence Page;萬思;;Google搜索引擎剖析[J];程序員;2003年04期
10 劉琨,鄭有才;搜索引擎剖析[J];微機(jī)發(fā)展;2004年03期
相關(guān)會議論文 前1條
1 樸星海;趙鐵軍;鄭德權(quán);張迪;;面向Blog的網(wǎng)絡(luò)爬行器設(shè)計(jì)與實(shí)現(xiàn)[A];中文信息處理前沿進(jìn)展——中國中文信息學(xué)會二十五周年學(xué)術(shù)會議論文集[C];2006年
相關(guān)重要報(bào)紙文章 前2條
1 伍裕標(biāo);網(wǎng)絡(luò)監(jiān)控STOP![N];中國電腦教育報(bào);2003年
2 王猛祥 徐明華;六度分隔:下一代網(wǎng)絡(luò)交際[N];中國計(jì)算機(jī)報(bào);2004年
相關(guān)碩士學(xué)位論文 前10條
1 王斐;基于增量反饋和自適應(yīng)機(jī)制的主題爬蟲系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)[D];南京理工大學(xué);2005年
2 劉宇波;面向可下載資源的WEB搜索引擎的設(shè)計(jì)與實(shí)現(xiàn)[D];湖南大學(xué);2005年
3 車志軍;人工智能在搜索引擎資源獲取中的應(yīng)用[D];浙江大學(xué);2006年
4 王柏;中文資訊搜索引擎產(chǎn)品技術(shù)的研究和應(yīng)用[D];吉林大學(xué);2006年
5 蘇旋;分布式網(wǎng)絡(luò)爬蟲技術(shù)的研究與實(shí)現(xiàn)[D];哈爾濱工業(yè)大學(xué);2006年
6 劉瑋瑋;搜索引擎中主題爬蟲的研究與實(shí)現(xiàn)[D];南京理工大學(xué);2006年
7 林樂彬;Inar網(wǎng)絡(luò)爬蟲的設(shè)計(jì)與實(shí)現(xiàn)[D];哈爾濱工業(yè)大學(xué);2006年
8 蔣科;基于領(lǐng)域概念定制的主題爬蟲系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)[D];西安電子科技大學(xué);2007年
9 劉錚;定題Web搜索與挖掘的研究及系統(tǒng)實(shí)現(xiàn)[D];西安電子科技大學(xué);2007年
10 羅兵;支持AJAX的互聯(lián)網(wǎng)搜索引擎爬蟲設(shè)計(jì)與實(shí)現(xiàn)[D];浙江大學(xué);2007年
,本文編號:2486702
本文鏈接:http://sikaile.net/kejilunwen/sousuoyinqinglunwen/2486702.html