基于本體的主題爬蟲的設(shè)計(jì)與實(shí)現(xiàn)(工商管理).pdf 免費(fèi)在線閱讀前50頁
本文關(guān)鍵詞:基于本體的主題爬蟲的設(shè)計(jì)與實(shí)現(xiàn),由筆耕文化傳播整理發(fā)布。
文檔介紹:
合肥工業(yè)大學(xué)碩士學(xué)位論文基于本體的主題爬蟲的設(shè)計(jì)與實(shí)現(xiàn)姓名:楊貞申請(qǐng)學(xué)位級(jí)別:碩士專業(yè):管理科學(xué)與工程指導(dǎo)教師:杜習(xí)英20080401基于本體的主題爬蟲的設(shè)計(jì)與實(shí)現(xiàn)摘要計(jì)算機(jī)網(wǎng)絡(luò)極大地提高了人們獲取信息的能力。隨著計(jì)算機(jī)網(wǎng)絡(luò)的迅速發(fā)展,網(wǎng)絡(luò)信息增長(zhǎng)的速度和人們獲取信息的能力之間的矛盾越來越突出。傳統(tǒng)搜索引擎己經(jīng)不能滿足人們對(duì)個(gè)性化信息檢索服務(wù)日益增長(zhǎng)的需要。近年來,面向主題的搜索引擎應(yīng)運(yùn)而生,它能夠提供分類更細(xì)致精確、數(shù)據(jù)更全面深入的因特網(wǎng)搜索服務(wù),并且對(duì)硬件要求低、結(jié)果更新也很及時(shí)。面向主題搜索引擎的核心組成部分是主題爬蟲。主題爬蟲是一種可以自動(dòng)采集網(wǎng)頁的程序,其目標(biāo)是搜索網(wǎng)絡(luò)中屬于預(yù)定主題的那一部分網(wǎng)頁子集。主題爬蟲的爬行算法作為主題搜索引擎技術(shù)的關(guān)鍵,對(duì)其進(jìn)行研究不但可以擴(kuò)大所搜索主題的資源覆蓋范圍,而且還能有效地提高爬行性能和網(wǎng)絡(luò)帶寬的利用率。本文對(duì)主題爬蟲采用的爬行算法進(jìn)行了研究及討論。論文首先介紹了主題搜索引擎的基本功能,接著分析了主題爬蟲的基本結(jié)構(gòu)及其工作原理,然后詳細(xì)討論了主題爬蟲的搜索策略,并重點(diǎn)分析了主題爬蟲在爬行過程中常用的最好優(yōu)先算法及其存在的隧道問題;谏鲜龇治黾坝懻,論文給出了一...
內(nèi)容來自轉(zhuǎn)載請(qǐng)標(biāo)明出處.
本文關(guān)鍵詞:基于本體的主題爬蟲的設(shè)計(jì)與實(shí)現(xiàn),由筆耕文化傳播整理發(fā)布。
,本文編號(hào):145553
本文鏈接:http://sikaile.net/kejilunwen/xinxigongchenglunwen/145553.html