基于游記的旅游信息垂直搜索引擎的設(shè)計與實現(xiàn)
本文關(guān)鍵詞:基于游記的旅游信息垂直搜索引擎的設(shè)計與實現(xiàn)
更多相關(guān)文章: 垂直搜索引擎 旅游 Lucene 爬蟲
【摘要】:現(xiàn)如今人民物質(zhì)生活水平正在穩(wěn)步提高,越來越多的人開始注重精神層面的提升,旅游已經(jīng)成為人們?nèi)粘P蓍e,放松心情的重要手段。出游前補足功課必不可少,從景點選擇到路線規(guī)劃,從美食特色到當?shù)仫L(fēng)俗,這些都是每一個游客關(guān)心的話題。在浩瀚的網(wǎng)絡(luò)資源中挑選、制定出一個出游計劃往往需要耗費游客大量的時間精力。游記作為人們游玩歸來的總結(jié),其中不僅記錄著出行者當時的心情,更包含著重要的旅游信息,包括景點簡介,個人感受,游玩路線,大致花銷等等。為了減少游客出行前的準備時間,本文將設(shè)計并實現(xiàn)一個基于游記的垂直搜索引擎系統(tǒng),為游客推薦出行路線和精彩游記。本論文的主要工作如下:1)研究了垂直搜索引擎的關(guān)鍵技術(shù)。首先簡要介紹了當今旅游需求的背景及搜索引擎的發(fā)展狀況,根據(jù)搜集方法和服務(wù)方式講解了不同搜索引擎之間的差異。并對垂直搜索引擎的關(guān)鍵技術(shù)進行了研究,主要包括爬蟲工作原理及主題爬蟲算法,中文分詞算法和倒排索引。然后較為詳細的介紹了全文搜索引擎Lucene的使用方法,功能結(jié)構(gòu),索引和檢索策略,評分機制。2)設(shè)計并實現(xiàn)了一款基于游記的旅游信息垂直搜索引擎系統(tǒng)。系統(tǒng)主要包含三個模塊——信息采集模塊,索引模塊,用戶查詢模塊。信息集模塊,使用WebMagic爬蟲框架,從web頁面中提取信息,處理成結(jié)構(gòu)化信息存儲在本地;索引模塊,使用全文檢索工具包Lucene對采集到本地的結(jié)構(gòu)化旅游信息進行索引;用戶查詢模塊,檢索功能使用Lucene檢索策略,根據(jù)用戶查詢對文檔打分并將結(jié)果返回給用戶,頁面展示功能使用SpringMVC框架對查詢結(jié)果進行展示。本文從游客出行準備的實際情況出發(fā),在調(diào)查了游客出行需求的基礎(chǔ)上,設(shè)計并實現(xiàn)了一款基于游記的旅游信息垂直搜索引擎系統(tǒng)。
【關(guān)鍵詞】:垂直搜索引擎 旅游 Lucene 爬蟲
【學(xué)位授予單位】:重慶大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2016
【分類號】:TP391.3
【目錄】:
- 中文摘要3-4
- 英文摘要4-8
- 1 緒論8-12
- 1.1 研究背景和意義8-9
- 1.2 搜索引擎分類9-10
- 1.3 垂直搜索引擎研究現(xiàn)狀10-11
- 1.4 本文組織結(jié)構(gòu)11-12
- 2 垂直搜索引擎關(guān)鍵技術(shù)12-26
- 2.1 垂直搜索引擎工作原理12-13
- 2.2 網(wǎng)絡(luò)爬蟲13-20
- 2.2.1 網(wǎng)絡(luò)爬蟲工作流程13-14
- 2.2.2 網(wǎng)絡(luò)爬蟲搜索策略14-16
- 2.2.3 主題爬蟲16-20
- 2.3 信息檢索20-25
- 2.3.1 信息檢索模型20-22
- 2.3.2 中文分詞22-23
- 2.3.3 倒排索引23-25
- 2.4 本章小結(jié)25-26
- 3 Lucene相關(guān)技術(shù)研究26-34
- 3.1 Lucene簡介26-27
- 3.2 Lucene組織結(jié)構(gòu)27-29
- 3.3 Lucene索引策略29-30
- 3.3.1 索引結(jié)構(gòu)29
- 3.3.2 索引過程29-30
- 3.4 Lucene搜索策略30-33
- 3.4.1 搜索過程30-31
- 3.4.2 Lucene評分機制31-33
- 3.5 本章小結(jié)33-34
- 4 旅游信息垂直搜索引擎的設(shè)計34-42
- 4.1 系統(tǒng)目標和功能需求34-35
- 4.1.1 系統(tǒng)目標34
- 4.1.2 系統(tǒng)功能需求34-35
- 4.2 系統(tǒng)架構(gòu)設(shè)計35-41
- 4.2.1 系統(tǒng)整體結(jié)構(gòu)設(shè)計35-36
- 4.2.2 信息采集模塊設(shè)計36-38
- 4.2.3 索引模塊設(shè)計38-39
- 4.2.4 用戶查詢模塊設(shè)計39-41
- 4.3 本章小結(jié)41-42
- 5 旅游信息垂直搜索引擎的實現(xiàn)42-59
- 5.1 系統(tǒng)開發(fā)環(huán)境42
- 5.2 信息采集模塊實現(xiàn)42-48
- 5.3 索引模塊實現(xiàn)48-52
- 5.4 用戶查詢模塊實現(xiàn)52-58
- 5.5 本章小結(jié)58-59
- 6 總結(jié)和展望59-61
- 致謝61-62
- 參考文獻62-63
【相似文獻】
中國期刊全文數(shù)據(jù)庫 前10條
1 楊堅爭;李朝平;;垂直搜索引擎及其應(yīng)用[J];電子商務(wù);2006年10期
2 羅麗姍;;垂直搜索引擎發(fā)展概述[J];圖書館學(xué)研究;2006年12期
3 嚴宏偉;何俊;;基于房源分析系統(tǒng)的垂直搜索引擎關(guān)鍵技術(shù)的探討[J];中國科技信息;2007年05期
4 胡華梁;何進;鐘元生;;圖書垂直搜索引擎的設(shè)計[J];計算機與現(xiàn)代化;2007年08期
5 鄭凱明;李義杰;;垂直搜索引擎及其應(yīng)用價值[J];信息技術(shù);2008年04期
6 畢建濤;霍云福;;垂直搜索引擎贏利模式探討[J];大連大學(xué)學(xué)報;2008年03期
7 許鑫;黃仲清;;垂直搜索引擎應(yīng)用中的若干策略探討——以12580餐飲垂直搜索為例[J];現(xiàn)代圖書情報技術(shù);2009年02期
8 孔祥春;李義杰;鄭凱明;;垂直搜索引擎應(yīng)用研究[J];計算機系統(tǒng)應(yīng)用;2009年07期
9 楊皖蘇;閆冬;;垂直搜索引擎發(fā)展策略探討[J];商業(yè)時代;2009年23期
10 肖婷;;垂直搜索引擎與旅游行業(yè)探討[J];農(nóng)業(yè)網(wǎng)絡(luò)信息;2009年11期
中國重要會議論文全文數(shù)據(jù)庫 前4條
1 褚蓓蓓;劉丹;;垂直搜索引擎:搜索引擎發(fā)展方向[A];2007年河北省電子學(xué)會、河北省計算機學(xué)會、河北省自動化學(xué)會、河北省人工智能學(xué)會、河北省計算機輔助設(shè)計研究會、河北省軟件行業(yè)協(xié)會聯(lián)合學(xué)術(shù)年會論文集[C];2007年
2 林歡歡;王文杰;史忠植;;移動環(huán)境下垂直搜索引擎[A];第三屆全國信息檢索與內(nèi)容安全學(xué)術(shù)會議論文集[C];2007年
3 王上;于海;王鉦旋;;Deep Web垂直搜索引擎設(shè)計與實現(xiàn)[A];第26屆中國數(shù)據(jù)庫學(xué)術(shù)會議論文集(B輯)[C];2009年
4 毛華揚;劉衛(wèi);;會計信息搜索方法研究[A];第十屆全國會計信息化年會論文集[C];2011年
中國重要報紙全文數(shù)據(jù)庫 前10條
1 北大縱橫管理顧問公司高級顧問戴曉東;“商搜”變法 垂直搜索引擎的春天還遠嗎?[N];中國經(jīng)營報;2006年
2 王艷;垂直搜索引擎市場看好[N];中國旅游報;2000年
3 王靖;賽迪網(wǎng)推出垂直搜索引擎[N];人民日報海外版;2000年
4 楊國民;國內(nèi)生物醫(yī)藥行業(yè) 垂直搜索引擎誕生[N];經(jīng)濟日報;2007年
5 本報記者 王曉雁;垂直搜索引擎著作權(quán)之爭未破題[N];法制日報;2009年
6 電子工業(yè)出版社 董婭 工業(yè)和信息化部電子科學(xué)技術(shù)情報研究所 周峻松;用開源軟件建垂直搜索引擎[N];計算機世界;2010年
7 中新;生意寶推“生意搜”攪局電子商務(wù)搜索市場[N];經(jīng)理日報;2008年
8 源訊 編譯;搜索巨頭的下一步[N];計算機世界;2006年
9 賽迪網(wǎng) 方剛;不只是網(wǎng)站才垂直[N];中國計算機報;2000年
10 ;沱沱網(wǎng)“亮劍”國際消費電子博覽會 專業(yè)服務(wù)帶來B2B差異化變革[N];中國貿(mào)易報;2007年
中國博士學(xué)位論文全文數(shù)據(jù)庫 前5條
1 王曄;垂直搜索引擎若干問題研究[D];復(fù)旦大學(xué);2011年
2 吳羽;面向時間敏感對象的垂直搜索引擎關(guān)鍵技術(shù)研究[D];浙江大學(xué);2011年
3 胡宜敏;農(nóng)業(yè)垂直搜索引擎語義化若干問題的研究與實現(xiàn)[D];中國科學(xué)技術(shù)大學(xué);2012年
4 陳竹敏;面向垂直搜索引擎的主題爬行技術(shù)研究[D];山東大學(xué);2008年
5 王桂紅;農(nóng)產(chǎn)品市場價格web信息分析方法研究[D];沈陽農(nóng)業(yè)大學(xué);2013年
中國碩士學(xué)位論文全文數(shù)據(jù)庫 前10條
1 韓冰;垂直搜索引擎?zhèn)性化推薦研究與應(yīng)用[D];大連理工大學(xué);2009年
2 關(guān)小敏;垂直搜索引擎的研究與實現(xiàn)[D];北京郵電大學(xué);2012年
3 吳燕瑋;基于行業(yè)知識垂直搜索引擎的研究與實現(xiàn)[D];北京郵電大學(xué);2012年
4 柳力麗;旅游垂直搜索引擎的品牌傳播研究[D];西南大學(xué);2015年
5 錢永杰;面向網(wǎng)絡(luò)文學(xué)的垂直搜索引擎的研究與實現(xiàn)[D];曲阜師范大學(xué);2015年
6 袁鳳云;垂直搜索引擎關(guān)鍵技術(shù)研究與實現(xiàn)[D];電子科技大學(xué);2014年
7 任睿麗;面向旅游業(yè)的垂直搜索引擎的設(shè)計與實現(xiàn)[D];電子科技大學(xué);2014年
8 張高偉;基于ElasticSearch的分布式視頻垂直搜索引擎的設(shè)計與實現(xiàn)[D];哈爾濱工業(yè)大學(xué);2014年
9 朱鵬;英文語料庫垂直搜索引擎的研究與實現(xiàn)[D];北京郵電大學(xué);2015年
10 楊小丹;面向教育資源c\索引擎的研究與實現(xiàn)[D];電子科技大學(xué);2015年
,本文編號:753556
本文鏈接:http://sikaile.net/kejilunwen/sousuoyinqinglunwen/753556.html