基于關(guān)鍵詞的主題網(wǎng)絡爬蟲
本文關(guān)鍵詞:基于關(guān)鍵詞的主題網(wǎng)絡爬蟲
更多相關(guān)文章: 網(wǎng)絡爬蟲 基于特定主題的網(wǎng)絡爬蟲 本體 關(guān)鍵詞 知識路徑
【摘要】:通常來說,用戶從搜索引擎獲取的網(wǎng)頁中,大部分都是不符合特定需求的,只有一小部分才是想要的結(jié)果。網(wǎng)絡爬蟲在搜索引擎中扮演著重要的角色,起著關(guān)鍵性的作用。本文主要講述了基于關(guān)鍵詞的網(wǎng)絡爬蟲,通過使用相關(guān)性決策機制和本體的知識來設計出最合適的爬蟲抓取路徑。和傳統(tǒng)的網(wǎng)絡爬蟲相比較,本文設計的爬蟲具有最優(yōu)性,并通過高準確性來提高搜索效率。
【作者單位】: 南京航空航天大學;
【分類號】:TP391.3
【正文快照】: 0引言網(wǎng)絡爬蟲主要下載主題相關(guān)的網(wǎng)頁或者滿足用戶需求的特定網(wǎng)頁,而不是像傳統(tǒng)的搜索引擎那樣下載整個Web網(wǎng)頁庫。因此,主題爬蟲的基本要求是選擇那些滿足用戶需求的網(wǎng)頁。鏈接分析算法和網(wǎng)頁排序算法一樣,通常根據(jù)URLs的相關(guān)性和搜索策略對URLs進行排序,然后優(yōu)先下載那些特
【相似文獻】
中國期刊全文數(shù)據(jù)庫 前10條
1 彭軻;廖聞劍;;基于瀏覽器服務的網(wǎng)絡爬蟲[J];硅谷;2009年04期
2 王江紅;朱麗君;李彩虹;;一種新型網(wǎng)絡爬蟲的設計與實現(xiàn)[J];微計算機信息;2010年03期
3 于成龍;于洪波;;網(wǎng)絡爬蟲技術(shù)研究[J];東莞理工學院學報;2011年03期
4 焦賽美;;網(wǎng)絡爬蟲技術(shù)的研究[J];瓊州學院學報;2011年05期
5 宋海洋;劉曉然;錢海俊;;一種新的主題網(wǎng)絡爬蟲爬行策略[J];計算機應用與軟件;2011年11期
6 劉金紅;陸余良;;主題網(wǎng)絡爬蟲研究綜述[J];計算機應用研究;2007年10期
7 鄒海亮;孫莉;;可定制的聚焦網(wǎng)絡爬蟲[J];電子科技;2009年01期
8 楊松梅;;網(wǎng)絡爬蟲[J];硅谷;2009年15期
9 張紅云;劉煒;熊前興;;一種基于語義本體的網(wǎng)絡爬蟲模型[J];計算機應用與軟件;2009年11期
10 張洪辰;;新浪微博數(shù)據(jù)抓取——高級搜索[J];信息與電腦(理論版);2013年11期
中國重要會議論文全文數(shù)據(jù)庫 前4條
1 夏詔杰;郭力;李曉霞;;化學主題網(wǎng)絡爬蟲的研究[A];第十屆全國計算(機)化學學術(shù)會議論文摘要集[C];2009年
2 李楠;谷利澤;鈕心忻;;用于XSS掃描的網(wǎng)絡爬蟲的設計與實現(xiàn)[A];2010年全國通信安全學術(shù)會議論文集[C];2010年
3 張軍;于浩;內(nèi)野寬治;;UGC中產(chǎn)品評論信息的挖掘[A];內(nèi)容計算的研究與應用前沿——第九屆全國計算語言學學術(shù)會議論文集[C];2007年
4 徐劍;柯貴明;;網(wǎng)絡爬蟲技術(shù)在搜索引擎中的應用[A];全國第21屆計算機技術(shù)與應用學術(shù)會議(CACIS·2010)暨全國第2屆安全關(guān)鍵技術(shù)與應用學術(shù)會議論文集[C];2010年
中國碩士學位論文全文數(shù)據(jù)庫 前10條
1 陶俊文;基于Heritrix框架的專業(yè)鎮(zhèn)信息網(wǎng)絡爬蟲系統(tǒng)[D];華南理工大學;2015年
2 馬漢超;基于主題網(wǎng)絡爬蟲的汽車行業(yè)多元信息web系統(tǒng)設計與實現(xiàn)[D];西南交通大學;2015年
3 金梅;網(wǎng)絡爬蟲性能提升與功能拓展的研究與實現(xiàn)[D];吉林大學;2012年
4 芮虎;比價購物平臺中網(wǎng)絡爬蟲的設計與實現(xiàn)[D];華東理工大學;2013年
5 楊東權(quán);面向人臉檢測的主題網(wǎng)絡爬蟲系統(tǒng)[D];重慶大學;2015年
6 龔秋艷;并行網(wǎng)絡爬蟲設計與實現(xiàn)[D];華東師范大學;2010年
7 么士宇;基于分布式計算的網(wǎng)絡爬蟲技術(shù)研究[D];大連海事大學;2011年
8 陳奮;過濾型網(wǎng)絡爬蟲的研究與設計[D];廈門大學;2007年
9 趙茉莉;網(wǎng)絡爬蟲系統(tǒng)的研究與實現(xiàn)[D];電子科技大學;2013年
10 譚龍遠;基于領域的網(wǎng)絡爬蟲技術(shù)的研究與實現(xiàn)[D];武漢理工大學;2009年
,本文編號:1180969
本文鏈接:http://sikaile.net/kejilunwen/sousuoyinqinglunwen/1180969.html