面向博客領(lǐng)域垂直搜索引擎及研究實(shí)現(xiàn).pdf 免費(fèi)在線閱讀前50頁(yè)
本文關(guān)鍵詞:面向博客領(lǐng)域的垂直搜索引擎的研究與實(shí)現(xiàn),,由筆耕文化傳播整理發(fā)布。
文檔介紹:
北京郵電大學(xué)碩士學(xué)位論文面向博客領(lǐng)域的垂直搜索引擎的研究與實(shí)現(xiàn)姓名:王嘉杰申請(qǐng)學(xué)位級(jí)別:碩士專業(yè):軟件工程指導(dǎo)教師:金躍輝;趙方20090501面向博客領(lǐng)域的垂直搜索引擎的研究與實(shí)現(xiàn)摘要隨著網(wǎng)絡(luò)信息資源呈幾何級(jí)數(shù)增長(zhǎng),使用傳統(tǒng)搜索引擎技術(shù)準(zhǔn)確、快速地查找所需信息也變得越來(lái)越困難。面對(duì)每天海量遞增的數(shù)據(jù)量,通用搜索引擎(又稱為水平搜索引擎)很難及時(shí)地更新索引數(shù)據(jù)庫(kù);面對(duì)數(shù)以億計(jì)的網(wǎng)頁(yè)通用搜索引擎很難深入抓取信息。針對(duì)通用搜索引擎存在搜索不夠快速、不夠深入的缺點(diǎn),新一代搜索技術(shù)一垂直搜索引擎應(yīng)運(yùn)而生。垂直搜索是針對(duì)某~個(gè)行業(yè)的專業(yè)搜索引擎,是搜索引擎的細(xì)分和延伸,是相對(duì)通用搜索引擎的信息量大、查詢不準(zhǔn)確、深度不夠等問(wèn)題提出來(lái)的新一代搜索引擎服務(wù)模式。通過(guò)針對(duì)某一特定領(lǐng)域、某一特定人群或某一特定需求提供有一定價(jià)值的信息和相關(guān)服務(wù)。與通用搜索引擎的信息采集技術(shù)不同,垂直搜索引擎的網(wǎng)絡(luò)蜘蛛(又稱為網(wǎng)絡(luò)爬蟲(chóng))僅采集與主題相關(guān)的信息。通過(guò)對(duì)網(wǎng)頁(yè)的主題相關(guān)度進(jìn)行預(yù)測(cè)和判斷,專業(yè)網(wǎng)絡(luò)蜘蛛在爬行時(shí)避開(kāi)了大量主題無(wú)關(guān)的區(qū)域。由于只采集主題相關(guān)的網(wǎng)頁(yè),垂直搜索引擎在查詢的準(zhǔn)確率和效率上都有顯著地提高。本文首先介紹了垂直搜索引擎技術(shù)的研究...
內(nèi)容來(lái)自轉(zhuǎn)載請(qǐng)標(biāo)明出處.
本文關(guān)鍵詞:面向博客領(lǐng)域的垂直搜索引擎的研究與實(shí)現(xiàn),由筆耕文化傳播整理發(fā)布。
本文編號(hào):150946
本文鏈接:http://sikaile.net/kejilunwen/sousuoyinqinglunwen/150946.html