基于Elasticsearch的地名和POI數(shù)據(jù)檢索系統(tǒng)的設(shè)計與實現(xiàn)
發(fā)布時間:2022-10-10 20:01
在大數(shù)據(jù)時代的背景下,人們對數(shù)據(jù)挖掘、數(shù)據(jù)分析和數(shù)據(jù)檢索愈加重視。地名信息數(shù)據(jù)在移動互聯(lián)網(wǎng)的助推下,具有特殊戰(zhàn)略地位。從國家層面,地名信息是國家地理信息化建設(shè)的重要組成部分;從民生層面,隨著移動互聯(lián)網(wǎng)和全球定位系統(tǒng)持續(xù)升溫,基于位置的服務(wù)技術(shù)在各行各業(yè)廣泛應(yīng)用。如今人們追求更加智能精準的、具有地理范圍限制的結(jié)果。因此,如何有效結(jié)合傳統(tǒng)搜索和地名信息檢索顯得格外重要。地名信息存儲的傳統(tǒng)方式采用關(guān)系型數(shù)據(jù)庫,該方式存在很多弊端,如不支持海量數(shù)據(jù)存儲,表模式缺乏靈活擴展性,提供的檢索方式單一,針對關(guān)鍵字只支持模糊查詢,匹配效率低下,不支持空間位置檢索等,無法滿足人們對地名檢索的需求。新興的NoSQL數(shù)據(jù)庫HBase,具有分布式、高性能、存儲模式靈活、支持海量存儲等優(yōu)點,可以解決地名數(shù)據(jù)的存儲問題,但是HBase提供的檢索服務(wù)單一、只有主鍵索引,本身不提供二級索引,且沒有提供對空間數(shù)據(jù)存儲和管理的直接支持。針對上述問題,本文基于HBase和Elasticsearch等核心技術(shù)設(shè)計實現(xiàn)了基于Web的地名和POI數(shù)據(jù)檢索系統(tǒng)。該系統(tǒng)實現(xiàn)了關(guān)鍵字搜索、興趣點類型搜索、自我推薦、范圍搜索、區(qū)域搜索和組...
【文章頁數(shù)】:90 頁
【學位級別】:碩士
【文章目錄】:
摘要
ABSTRACT
縮略語對照表
第一章 緒論
1.1 研究背景和意義
1.2 國內(nèi)外研究現(xiàn)狀
1.2.1 HBase二級索引的發(fā)展現(xiàn)狀
1.2.2 Elasticsearch應(yīng)用和研究現(xiàn)狀
1.3 論文主要工作
1.4 論文的組織結(jié)構(gòu)
第二章 相關(guān)技術(shù)概述
2.1 開源分布式計算平臺Hadoop
2.1.1 Hadoop框架
2.1.2 分布式存儲系統(tǒng)HDFS
2.1.3 分布式數(shù)據(jù)庫HBase
2.1.4 分布式計算框架MapReduce
2.1.5 HBase協(xié)處理器框架
2.2 索引技術(shù)
2.2.1 全文檢索工具庫Lucene
2.2.2 分布式搜索引擎Elasticsearch
2.2.3 LuceneSpatial原理
2.3 本章小結(jié)
第三章 地名數(shù)據(jù)存儲與檢索系統(tǒng)的設(shè)計
3.1 總體功能與要求
3.2 系統(tǒng)總體架構(gòu)與模塊設(shè)計
3.2.1 系統(tǒng)架構(gòu)
3.2.2 數(shù)據(jù)持久模塊設(shè)計
3.2.3 數(shù)據(jù)索引模塊設(shè)計
3.2.4 數(shù)據(jù)查詢模塊設(shè)計
3.3 系統(tǒng)總體流程
3.3.1 數(shù)據(jù)的存儲流程
3.3.2 數(shù)據(jù)的查詢流程
3.4 本章小結(jié)
第四章 地名數(shù)據(jù)存儲與檢索系統(tǒng)的實現(xiàn)
4.1 數(shù)據(jù)持久模塊的實現(xiàn)
4.1.1 數(shù)據(jù)處理模塊的實現(xiàn)
4.1.2 數(shù)據(jù)存儲模塊的實現(xiàn)
4.2 檢索查詢模塊的實現(xiàn)
4.2.1 服務(wù)器端查詢實現(xiàn)
4.2.2 用戶查詢界面實現(xiàn)
4.3 數(shù)據(jù)索引模塊的實現(xiàn)
4.3.1 Elasticsearch的部署實現(xiàn)
4.3.2 全文檢索mapping定義
4.3.3 基于ES的HBase二級索引方案實現(xiàn)
4.3.4 HBase與ES同步模塊實現(xiàn)
4.3.5 ES索引備份實現(xiàn)
4.3.6 中文分詞插件
4.4 性能優(yōu)化
4.4.1 ES集群性能優(yōu)化
4.5 本章小結(jié)
第五章 系統(tǒng)測試
5.1 測試環(huán)境
5.2 測試數(shù)據(jù)
5.3 測試工具
5.4 功能測試
5.4.1 服務(wù)器端功能測試
5.5 性能測試
5.6 本章小結(jié)
第六章 總結(jié)與展望
6.1 總結(jié)
6.2 展望
參考文獻
致謝
作者簡介
【參考文獻】:
期刊論文
[1]海量自動氣象站分鐘數(shù)據(jù)存儲檢索系統(tǒng)設(shè)計[J]. 王建榮,季剛. 計算機與現(xiàn)代化. 2017(09)
[2]一種基于Solr的HBase海量數(shù)據(jù)二級索引方案[J]. 王文賢,陳興蜀,王海舟,吳小松. 信息網(wǎng)絡(luò)安全. 2017(08)
[3]基于HBase+ ElasticSearch的海量交通數(shù)據(jù)實時存取方案設(shè)計[J]. 董長青,任女爾,張慶余,田玉靖. 大數(shù)據(jù). 2017(01)
[4]基于HBase的海量文件的檢索方案研究[J]. 陳棟波,高躍明. 軟件. 2016(11)
[5]HBase時空查詢算法研究[J]. 張翀,陳曉瑩,史宗麟,葛斌. 小型微型計算機系統(tǒng). 2016(11)
[6]基于Lucene的地名數(shù)據(jù)庫快速檢索系統(tǒng)[J]. 張文元,周世宇,談國新. 計算機應(yīng)用研究. 2017(06)
[7]基于GeoNames和Solr的地名數(shù)據(jù)全文檢索[J]. 魏勇,胡丹露,李響,王豐. 測繪工程. 2016(02)
[8]基于Apache Lucene的地址匹配技術(shù)研究[J]. 盧盛祺,何施晶,韓景倜. 微型機與應(yīng)用. 2015(18)
[9]基于ElasticSearch的數(shù)字圖書館檢索系統(tǒng)[J]. 張建中,黃艷飛,熊擁軍. 計算機與現(xiàn)代化. 2015(06)
[10]運用開源軟件Logstash和ElasticSearch實現(xiàn)DSpace日志實時統(tǒng)計分析[J]. 陳和. 現(xiàn)代圖書情報技術(shù). 2015(05)
碩士論文
[1]基于深度學習的溯源視頻目標檢測與識別[D]. 劉健.東南大學 2016
[2]基于Hadoop的空間矢量數(shù)據(jù)的分布式存儲與查詢研究[D]. 陳俊欣.電子科技大學 2016
[3]基于HDFS的文件管理系統(tǒng)的設(shè)計與實現(xiàn)[D]. 孟密密.東南大學 2016
[4]海事大數(shù)據(jù)查詢服務(wù)平臺的設(shè)計與實現(xiàn)[D]. 沈婷.電子科技大學 2015
[5]一種基于HBase的海量空間遙感數(shù)據(jù)檢索系統(tǒng)[D]. 林久對.浙江大學 2015
[6]基于ElasticSearch的分布式視頻垂直搜索引擎的設(shè)計與實現(xiàn)[D]. 張高偉.哈爾濱工業(yè)大學 2014
[7]基于HBase的空間數(shù)據(jù)分布式存儲和并行查詢算法研究[D]. 丁琛.南京師范大學 2014
[8]大數(shù)據(jù)下空間數(shù)據(jù)索引和kNN查詢技術(shù)的研究[D]. 董亭亭.大連理工大學 2013
[9]基于Lucene的HBase全文檢索功能的設(shè)計與實現(xiàn)[D]. 鄒敏昊.南京大學 2013
[10]基于地理信息的檢索和用戶數(shù)據(jù)挖掘[D]. 任克江.大連理工大學 2013
本文編號:3690262
【文章頁數(shù)】:90 頁
【學位級別】:碩士
【文章目錄】:
摘要
ABSTRACT
縮略語對照表
第一章 緒論
1.1 研究背景和意義
1.2 國內(nèi)外研究現(xiàn)狀
1.2.1 HBase二級索引的發(fā)展現(xiàn)狀
1.2.2 Elasticsearch應(yīng)用和研究現(xiàn)狀
1.3 論文主要工作
1.4 論文的組織結(jié)構(gòu)
第二章 相關(guān)技術(shù)概述
2.1 開源分布式計算平臺Hadoop
2.1.1 Hadoop框架
2.1.2 分布式存儲系統(tǒng)HDFS
2.1.3 分布式數(shù)據(jù)庫HBase
2.1.4 分布式計算框架MapReduce
2.1.5 HBase協(xié)處理器框架
2.2 索引技術(shù)
2.2.1 全文檢索工具庫Lucene
2.2.2 分布式搜索引擎Elasticsearch
2.2.3 LuceneSpatial原理
2.3 本章小結(jié)
第三章 地名數(shù)據(jù)存儲與檢索系統(tǒng)的設(shè)計
3.1 總體功能與要求
3.2 系統(tǒng)總體架構(gòu)與模塊設(shè)計
3.2.1 系統(tǒng)架構(gòu)
3.2.2 數(shù)據(jù)持久模塊設(shè)計
3.2.3 數(shù)據(jù)索引模塊設(shè)計
3.2.4 數(shù)據(jù)查詢模塊設(shè)計
3.3 系統(tǒng)總體流程
3.3.1 數(shù)據(jù)的存儲流程
3.3.2 數(shù)據(jù)的查詢流程
3.4 本章小結(jié)
第四章 地名數(shù)據(jù)存儲與檢索系統(tǒng)的實現(xiàn)
4.1 數(shù)據(jù)持久模塊的實現(xiàn)
4.1.1 數(shù)據(jù)處理模塊的實現(xiàn)
4.1.2 數(shù)據(jù)存儲模塊的實現(xiàn)
4.2 檢索查詢模塊的實現(xiàn)
4.2.1 服務(wù)器端查詢實現(xiàn)
4.2.2 用戶查詢界面實現(xiàn)
4.3 數(shù)據(jù)索引模塊的實現(xiàn)
4.3.1 Elasticsearch的部署實現(xiàn)
4.3.2 全文檢索mapping定義
4.3.3 基于ES的HBase二級索引方案實現(xiàn)
4.3.4 HBase與ES同步模塊實現(xiàn)
4.3.5 ES索引備份實現(xiàn)
4.3.6 中文分詞插件
4.4 性能優(yōu)化
4.4.1 ES集群性能優(yōu)化
4.5 本章小結(jié)
第五章 系統(tǒng)測試
5.1 測試環(huán)境
5.2 測試數(shù)據(jù)
5.3 測試工具
5.4 功能測試
5.4.1 服務(wù)器端功能測試
5.5 性能測試
5.6 本章小結(jié)
第六章 總結(jié)與展望
6.1 總結(jié)
6.2 展望
參考文獻
致謝
作者簡介
【參考文獻】:
期刊論文
[1]海量自動氣象站分鐘數(shù)據(jù)存儲檢索系統(tǒng)設(shè)計[J]. 王建榮,季剛. 計算機與現(xiàn)代化. 2017(09)
[2]一種基于Solr的HBase海量數(shù)據(jù)二級索引方案[J]. 王文賢,陳興蜀,王海舟,吳小松. 信息網(wǎng)絡(luò)安全. 2017(08)
[3]基于HBase+ ElasticSearch的海量交通數(shù)據(jù)實時存取方案設(shè)計[J]. 董長青,任女爾,張慶余,田玉靖. 大數(shù)據(jù). 2017(01)
[4]基于HBase的海量文件的檢索方案研究[J]. 陳棟波,高躍明. 軟件. 2016(11)
[5]HBase時空查詢算法研究[J]. 張翀,陳曉瑩,史宗麟,葛斌. 小型微型計算機系統(tǒng). 2016(11)
[6]基于Lucene的地名數(shù)據(jù)庫快速檢索系統(tǒng)[J]. 張文元,周世宇,談國新. 計算機應(yīng)用研究. 2017(06)
[7]基于GeoNames和Solr的地名數(shù)據(jù)全文檢索[J]. 魏勇,胡丹露,李響,王豐. 測繪工程. 2016(02)
[8]基于Apache Lucene的地址匹配技術(shù)研究[J]. 盧盛祺,何施晶,韓景倜. 微型機與應(yīng)用. 2015(18)
[9]基于ElasticSearch的數(shù)字圖書館檢索系統(tǒng)[J]. 張建中,黃艷飛,熊擁軍. 計算機與現(xiàn)代化. 2015(06)
[10]運用開源軟件Logstash和ElasticSearch實現(xiàn)DSpace日志實時統(tǒng)計分析[J]. 陳和. 現(xiàn)代圖書情報技術(shù). 2015(05)
碩士論文
[1]基于深度學習的溯源視頻目標檢測與識別[D]. 劉健.東南大學 2016
[2]基于Hadoop的空間矢量數(shù)據(jù)的分布式存儲與查詢研究[D]. 陳俊欣.電子科技大學 2016
[3]基于HDFS的文件管理系統(tǒng)的設(shè)計與實現(xiàn)[D]. 孟密密.東南大學 2016
[4]海事大數(shù)據(jù)查詢服務(wù)平臺的設(shè)計與實現(xiàn)[D]. 沈婷.電子科技大學 2015
[5]一種基于HBase的海量空間遙感數(shù)據(jù)檢索系統(tǒng)[D]. 林久對.浙江大學 2015
[6]基于ElasticSearch的分布式視頻垂直搜索引擎的設(shè)計與實現(xiàn)[D]. 張高偉.哈爾濱工業(yè)大學 2014
[7]基于HBase的空間數(shù)據(jù)分布式存儲和并行查詢算法研究[D]. 丁琛.南京師范大學 2014
[8]大數(shù)據(jù)下空間數(shù)據(jù)索引和kNN查詢技術(shù)的研究[D]. 董亭亭.大連理工大學 2013
[9]基于Lucene的HBase全文檢索功能的設(shè)計與實現(xiàn)[D]. 鄒敏昊.南京大學 2013
[10]基于地理信息的檢索和用戶數(shù)據(jù)挖掘[D]. 任克江.大連理工大學 2013
本文編號:3690262
本文鏈接:http://sikaile.net/kejilunwen/sousuoyinqinglunwen/3690262.html
最近更新
教材專著