旅游信息垂直搜索系統(tǒng)的設(shè)計與實現(xiàn).pdf
本文關(guān)鍵詞:旅游信息垂直搜索系統(tǒng)的設(shè)計與實現(xiàn),由筆耕文化傳播整理發(fā)布。
文檔介紹:
北京郵電大學(xué)碩士學(xué)位論文旅游信息垂直搜索系統(tǒng)的設(shè)計與實現(xiàn)姓名:張慧申請學(xué)位級別:碩士專業(yè):計算機科學(xué)與技術(shù)指導(dǎo)教師:陳行益20090215北京郵電大學(xué)碩士論文的迅速發(fā)展,網(wǎng)絡(luò)資源日益豐富,傳統(tǒng)的搜索引擎技術(shù)不加區(qū)分的從網(wǎng)絡(luò)上收集網(wǎng)頁,產(chǎn)生了大量用戶不需要的無關(guān)信息,大大影響了用戶的使用,為了更精確更迅速的獲得用戶關(guān)心的相關(guān)領(lǐng)域的信息,垂直搜索引擎技術(shù)應(yīng)運而生。垂直搜索引擎僅僅采集用戶指定的、與某一特定主題相關(guān)的頁面。Nutch是一個剛剛誕生開放源代碼(open-source)的web搜索引擎。它使用Lucene作為索引和檢索的模塊,其工作流程包括網(wǎng)頁搜集,預(yù)處理和檢索模塊,具有與商用搜索引擎相同的工作流程,且其各功能模塊相對獨立,通過改造Nutch的相關(guān)功能模塊,可以迅速搭建一個垂直搜索引擎。本文的工作目標(biāo)是構(gòu)建一個基于垂直搜索引擎技術(shù)的旅游信息搜索網(wǎng)站,搜索引擎部分是一個中文主題搜索引擎,因此,中文處理的問題與主題相關(guān)性的問題是首要解決的重要問題。本文采用Nutch來構(gòu)建基本搜索引擎架構(gòu),并修改了Nutch的兩個重要模塊,網(wǎng)頁搜集模塊和中文分詞模塊,使其能夠適應(yīng)垂直搜索的使用。在此基礎(chǔ)上,本文首先介紹了通用搜索引擎與垂直搜索引擎的不同,討論了通用搜索引擎的...
內(nèi)容來自轉(zhuǎn)載請標(biāo)明出處.
本文關(guān)鍵詞:旅游信息垂直搜索系統(tǒng)的設(shè)計與實現(xiàn),,由筆耕文化傳播整理發(fā)布。
本文編號:49157
本文鏈接:http://sikaile.net/kejilunwen/sousuoyinqinglunwen/49157.html