LUCENE實(shí)現(xiàn)基于RSS博客搜索引擎.pdf
本文關(guān)鍵詞:LUCENE實(shí)現(xiàn)的基于RSS的博客搜索引擎,由筆耕文化傳播整理發(fā)布。
文檔介紹:
Y143809 1分類號(hào):——U D c:——工學(xué)碩士學(xué)位論文密級(jí):編號(hào):LUCENE實(shí)現(xiàn)的基于RSS的博客搜索引擎碩士研究生指導(dǎo)教師學(xué)位級(jí)別學(xué)科、專業(yè)所在單位本論文提交日期本論文答辯日期學(xué)位授予單位劉雙林俞經(jīng)善教授工學(xué)碩士計(jì)算機(jī)應(yīng)用技術(shù)計(jì)算機(jī)科學(xué)與技術(shù)學(xué)院2009年1月7日2009年3月8日l喻爾濱I:程人學(xué)哈爾濱下程火學(xué)碩十學(xué)位論文摘要XML是一種可擴(kuò)展的標(biāo)記語言,為跨平臺(tái)、跨領(lǐng)域的應(yīng)用提供了一種通信手段。隨著XML在WEB應(yīng)用上的R益廣泛,RSS已經(jīng)成為目前最廣泛的XML應(yīng)用,被廣泛的應(yīng)用于信息服務(wù)站點(diǎn),如新聞網(wǎng)站、博客站點(diǎn)等。隨著互聯(lián)網(wǎng)的迅速發(fā)展,搜索引擎成為了人們獲取信息的一個(gè)重要途徑。人們?cè)谙M阉饕婺軌蛱峁┤娴男畔①Y源的同時(shí),也對(duì)搜索引擎的服務(wù)提出了更高的要求。與傳統(tǒng)的搜索引擎相比,博客搜索引擎在檢索內(nèi)容、工作原理、檢索方式等方面有著很大的區(qū)別,因此,若用傳統(tǒng)的搜索引擎檢索一些以RSS格式發(fā)布的博客內(nèi)容,就會(huì)存在著檢索效率低、更新速度慢等缺點(diǎn),而RSS博客搜索引擎克服了這些缺點(diǎn)。本文研究了博客搜索引擎的工作原理,主要研究了博客搜索引擎中的博客網(wǎng)絡(luò)爬蟲與用戶興趣模型。網(wǎng)絡(luò)爬蟲是搜索引擎中的一個(gè)重要部分,其爬取質(zhì)量直接影響到搜索引擎的搜索結(jié)果。由于...
內(nèi)容來自轉(zhuǎn)載請(qǐng)標(biāo)明出處.
本文關(guān)鍵詞:LUCENE實(shí)現(xiàn)的基于RSS的博客搜索引擎,由筆耕文化傳播整理發(fā)布。
,本文編號(hào):82523
本文鏈接:http://sikaile.net/kejilunwen/sousuoyinqinglunwen/82523.html