基于Solr的企業(yè)搜索引擎研究與實(shí)現(xiàn)
本文選題:企業(yè)搜索引擎 切入點(diǎn):Solr 出處:《中國(guó)地質(zhì)大學(xué)(北京)》2017年碩士論文
【摘要】:企業(yè)搜索引擎是指通過(guò)程序或人工的方式,對(duì)企業(yè)中的信息進(jìn)行采集,之后對(duì)采集的信息數(shù)據(jù)進(jìn)行提取、處理和整理,然后向企業(yè)員工提供企業(yè)信息搜索服務(wù)的應(yīng)用系統(tǒng)。如今,企業(yè)發(fā)展的速度越來(lái)越快,企業(yè)中的信息量迅速增加,并且企業(yè)中的信息多種多樣,既有存儲(chǔ)在數(shù)據(jù)庫(kù)中結(jié)構(gòu)化數(shù)據(jù),也有附載在文本、視頻等文件中的非結(jié)構(gòu)化信息。而且這些信息的存儲(chǔ)比較分散,這給企業(yè)信息的查詢帶來(lái)了極大的困難。目前,一些國(guó)外的公司已經(jīng)推出了比較成熟的企業(yè)搜索引擎,但是在國(guó)內(nèi),企業(yè)搜索引擎還處于課題研究階段,并沒(méi)有相關(guān)的產(chǎn)品。因此,迫切需要構(gòu)建一個(gè)企業(yè)搜索引擎,能夠讓企業(yè)員工方便、快速的查找信息。在上述背景下,本文經(jīng)某企業(yè)委托構(gòu)建一個(gè)企業(yè)搜索引擎,幫助企業(yè)員工方便、快速地查詢信息,從而提升企業(yè)員工的辦公效率和辦公質(zhì)量。通過(guò)對(duì)傳統(tǒng)搜索引擎的研究分析,本文認(rèn)為在全文搜索引擎、目錄索引搜索引擎和元搜索引擎中,全文搜索引擎的構(gòu)建思路和提供服務(wù)的方式更符合企業(yè)搜索引擎的需求。Solr是目前比較流行的、用于構(gòu)建全文搜索引擎的先進(jìn)技術(shù),它提供了靈活的、簡(jiǎn)單的接口,讓開(kāi)發(fā)人員能夠方便、快速地構(gòu)建搜索引擎,所以本文將使用Solr作為構(gòu)建企業(yè)搜索引擎的技術(shù)支持,以降低開(kāi)發(fā)成本。在本文的企業(yè)搜索引擎建設(shè)中,數(shù)據(jù)采集、數(shù)據(jù)索引和數(shù)據(jù)搜索三部分是其核心,同時(shí),也是其構(gòu)建的難點(diǎn)所在。在數(shù)據(jù)采集中,本文通過(guò)同時(shí)使用配置數(shù)據(jù)源的方式來(lái)完成結(jié)構(gòu)化數(shù)據(jù)的采集。企業(yè)中還有大量的非結(jié)構(gòu)化數(shù)據(jù)存儲(chǔ)在文檔、視頻等文件中,為了更好的采集這些數(shù)據(jù),本文使用文件管理系統(tǒng)將其轉(zhuǎn)化為結(jié)構(gòu)化數(shù)據(jù),再進(jìn)行數(shù)據(jù)的采集。在數(shù)據(jù)索引中,本文通過(guò)分析企業(yè)信息管理系統(tǒng)中的數(shù)據(jù)結(jié)構(gòu),使用用于標(biāo)識(shí)數(shù)據(jù)更新日期的字段,來(lái)實(shí)現(xiàn)數(shù)據(jù)的增量索引,大大提高了數(shù)據(jù)索引的速度。最后,本文對(duì)企業(yè)搜索引擎提供的搜索服務(wù)進(jìn)行設(shè)計(jì)與實(shí)現(xiàn),具體包括關(guān)鍵詞搜索、范圍搜索以及高級(jí)搜索,并對(duì)基于角色的權(quán)限模型進(jìn)行了擴(kuò)展,引入了部門(mén)和用戶組的概念,加強(qiáng)了企業(yè)數(shù)據(jù)的安全性。
[Abstract]:Enterprise search engine refers to the program or artificial way to collect the information in the enterprise, the information extraction of the data acquisition, processing and finishing, and then application system to the enterprise staff to provide enterprise information search service. Today, enterprise development faster and faster, the amount of information in enterprises increased rapidly. And the enterprise information varied, both structured data in a database, are contained in the text, video and other unstructured information in the file. And these information scattered, it brings great difficulties to the enterprise information query. At present, some foreign companies have launched a mature enterprise search engine, but in China, the enterprise search engine is still in the research stage, and no related products. Therefore, it is urgent to establish a business search engine, can make Employees convenient, quick search of information. Based on the above background, this article through an enterprise commissioned to construct an enterprise search engine, help employees to convenient, fast query information, so as to enhance the enterprise staff's office efficiency and the work quality. Through the research of the traditional search engine analysis, this paper thinks that the search engine in the directory the index search engine and meta search engine, search engine construction and service modes of enterprises more in line with the needs of the search engine.Solr is popular, for the construction of full text search engine advanced technology, it provides a flexible, simple interface, convenient for developers to quickly build a search. This article will use the Solr engine, so as to support the construction of enterprise search engine technology, in order to reduce the cost of development. In this paper the enterprise search engine construction, data acquisition, Data index and search data the three part is the core, at the same time, the difficulty of construction. In the data collection, this paper completed structured data acquisition by simultaneously using the configuration data source. The enterprise and unstructured data storage in a large number of documents, video and other documents, in order to collect these data in this paper, using the file management system will be transformed into structured data, then the data acquisition data. In the index, this paper analyzes the data structure of the enterprise information management system in the field, used for updated identification data, to realize the increment of index data, greatly improving the speed of data index. Finally, to the enterprise the design and implementation of search service in this paper, including keyword search, search and advanced search, and the permission model based on color angle The concept of department and user group is introduced, and the security of enterprise data is strengthened.
【學(xué)位授予單位】:中國(guó)地質(zhì)大學(xué)(北京)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2017
【分類號(hào)】:TP391.3
【相似文獻(xiàn)】
相關(guān)期刊論文 前2條
1 ;高效的企業(yè)級(jí)搜索引擎Solr[J];中國(guó)教育網(wǎng)絡(luò);2010年10期
2 趙凱;王敏;;基于Solr的企業(yè)級(jí)搜索引擎的設(shè)計(jì)[J];電子世界;2013年22期
相關(guān)碩士學(xué)位論文 前8條
1 劉博文;分布式企業(yè)搜索引擎的設(shè)計(jì)與實(shí)現(xiàn)[D];浙江大學(xué);2015年
2 任樂(lè)樂(lè);基于Solr的分布式搜索引擎研究[D];中國(guó)計(jì)量大學(xué);2016年
3 趙亮;基于Solr的企業(yè)搜索引擎研究與實(shí)現(xiàn)[D];中國(guó)地質(zhì)大學(xué)(北京);2017年
4 王小森;基于Solr的搜索引擎的設(shè)計(jì)與實(shí)現(xiàn)[D];北京郵電大學(xué);2011年
5 李雪利;基于Solr的企業(yè)搜索引擎的研究與實(shí)現(xiàn)[D];浙江理工大學(xué);2013年
6 蔡學(xué)鋒;基于Solr的搜索引擎核心技術(shù)研究與應(yīng)用[D];武漢理工大學(xué);2013年
7 李晨鳴;基于solr搜索引擎的問(wèn)吧系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)[D];電子科技大學(xué);2012年
8 張新生;基于solr的分布式搜索引擎研究[D];華中科技大學(xué);2012年
,本文編號(hào):1654869
本文鏈接:http://sikaile.net/kejilunwen/ruanjiangongchenglunwen/1654869.html