檢察專線搜索引擎的設(shè)計(jì)與實(shí)現(xiàn)
發(fā)布時(shí)間:2017-10-25 19:04
本文關(guān)鍵詞:檢察專線搜索引擎的設(shè)計(jì)與實(shí)現(xiàn)
【摘要】:使用搜索引擎來(lái)查找信息已經(jīng)深入每個(gè)互聯(lián)網(wǎng)用戶的心中,估計(jì)絕大多數(shù)的網(wǎng)民在遇到問(wèn)題的時(shí)候都會(huì)打開(kāi)Google或者百度來(lái)尋找答案。隨著搜索引擎產(chǎn)業(yè)的高速發(fā)展,搜索已經(jīng)像瀏覽網(wǎng)頁(yè)、點(diǎn)擊網(wǎng)頁(yè)一樣,成為互聯(lián)網(wǎng)用戶最基礎(chǔ)的行為模式之一。因此,隨著信息量的高速增長(zhǎng),提高搜索引擎技術(shù)的性能,協(xié)助用戶過(guò)濾垃圾信息,快速準(zhǔn)確的獲取信息,在整個(gè)互聯(lián)網(wǎng)領(lǐng)域中有著重要意義。本論文在研究普通搜索的基本原理后,結(jié)合通用的搜索引擎技術(shù),并且自身單位的需求,設(shè)計(jì)并實(shí)現(xiàn)了一個(gè)高效的檢察專線搜索引擎系統(tǒng)。設(shè)計(jì)完成了檢察專線搜索引擎的框架,而且給出了系統(tǒng)主要部分的實(shí)現(xiàn)。根據(jù)以上需求分析,結(jié)合搜索引擎系統(tǒng)的基本架構(gòu),設(shè)計(jì)的專線搜索引擎系統(tǒng)將分為數(shù)據(jù)采集子系統(tǒng)、索引子系統(tǒng)、檢索子系統(tǒng)和檢察專業(yè)詞庫(kù)四個(gè)模塊.檢察專線搜索引擎主要服務(wù)于檢察專線網(wǎng),以搜索各個(gè)檢察院內(nèi)部信息發(fā)布系統(tǒng)為主提供信息檢索查詢服務(wù)。和通用搜索引擎檢索速度快、查全率高和查準(zhǔn)率高的目標(biāo)相比,還需要滿足更多的功能需求,主要研究?jī)?nèi)容如下:1、利用LNMPP技術(shù)構(gòu)架的特點(diǎn),特別為系統(tǒng)優(yōu)化配置提供了良好的高性能高負(fù)載性。2、檢察專線網(wǎng)內(nèi)信息更新頻率較快,對(duì)需要索引數(shù)據(jù)庫(kù)進(jìn)行快捷方便的增量更新,以保證用戶檢索的信息是最新的。3、對(duì)抓取資源信息進(jìn)行法律相關(guān)專業(yè)詞匯的分析和處理,形成適合內(nèi)部使用的檢察專業(yè)詞庫(kù)。4、參照結(jié)合了sphinx,sphider的構(gòu)架,結(jié)合了面向?qū)ο笳Z(yǔ)言設(shè)計(jì)思維,給出了檢察專線搜索系統(tǒng)核心模塊框架,詳細(xì)的闡述了檢察專線搜索引擎的數(shù)據(jù)抓取,數(shù)據(jù)索引,數(shù)據(jù)查詢的設(shè)計(jì),給出了詳細(xì)的設(shè)計(jì)與具體的實(shí)現(xiàn)。5、重點(diǎn)介紹了檢察專線搜索引擎的設(shè)計(jì)思想與框架的設(shè)計(jì),綜合的分析了檢察專線搜索系統(tǒng)的實(shí)現(xiàn)。
【關(guān)鍵詞】:搜索引擎 索引 檢索
【學(xué)位授予單位】:電子科技大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2014
【分類號(hào)】:TP391.3
【目錄】:
- 摘要5-6
- ABSTRACT6-10
- 第一章 緒論10-16
- 1.1 研究課題的學(xué)術(shù)背景10
- 1.2 國(guó)內(nèi)外關(guān)于該論題的研究現(xiàn)狀和發(fā)展趨勢(shì)10-12
- 1.2.1 國(guó)外的研究現(xiàn)狀和發(fā)展趨勢(shì)10-12
- 1.2.2 國(guó)內(nèi)的研究現(xiàn)狀和發(fā)展趨勢(shì)12
- 1.3 檢察機(jī)關(guān)信息化建設(shè)現(xiàn)狀分析12-13
- 1.4 研究本課題的意義13-14
- 1.5 本文主要研究工作14-15
- 1.6 本論文的結(jié)構(gòu)安排15-16
- 第二章 搜索引擎相關(guān)技術(shù)16-23
- 2.1 搜索引擎的工作原理16-18
- 2.2 數(shù)據(jù)索引技術(shù)18-19
- 2.3 SPHINX全文數(shù)據(jù)檢索工具介紹19-20
- 2.4 分詞技術(shù)20-21
- 2.5 流行中文分詞工具21-22
- 2.6 本章小結(jié)22-23
- 第三章 檢察專線搜索引擎的設(shè)計(jì)23-36
- 3.1 檢察專線搜索引擎系統(tǒng)本地調(diào)研23-25
- 3.1.1 人員調(diào)研23-24
- 3.1.2 網(wǎng)絡(luò)環(huán)境調(diào)研24-25
- 3.2 專線搜索引擎的功能需求分析25-26
- 3.2.1 檢察專線搜索引擎的需求分析25
- 3.2.2 檢察專線搜索引擎的可行性分析25-26
- 3.3 檢察專線搜索引擎的整體設(shè)計(jì)26-27
- 3.4 數(shù)據(jù)采集子系統(tǒng)27-29
- 3.5 索引子系統(tǒng)29-30
- 3.6 檢索子系統(tǒng)模塊30-32
- 3.7 檢察專業(yè)搜索詞庫(kù)32-33
- 3.8 檢察專線搜索引擎系統(tǒng)數(shù)據(jù)庫(kù)表設(shè)計(jì)33-35
- 3.9 本章小結(jié)35-36
- 第四章 檢察專線搜索引擎系統(tǒng)的實(shí)現(xiàn)36-59
- 4.1 系統(tǒng)開(kāi)發(fā)環(huán)境概述36
- 4.2 數(shù)據(jù)采集接.子系統(tǒng)的實(shí)現(xiàn)36-42
- 4.2.1 數(shù)據(jù)采集接.子系統(tǒng)主要算法描述36-42
- 4.2.2 核心算法和難點(diǎn)問(wèn)題42
- 4.3 索引子系統(tǒng)的實(shí)現(xiàn)42-45
- 4.3.1 基本功能概述42-43
- 4.3.2 索引器的數(shù)據(jù)結(jié)構(gòu)43-44
- 4.3.3 核心算法和難點(diǎn)44-45
- 4.4 檢索模塊的實(shí)現(xiàn)45-48
- 4.5 檢察專線系統(tǒng)中文分詞的實(shí)現(xiàn)48-50
- 4.6 檢察專線系統(tǒng)詞庫(kù)的實(shí)現(xiàn)50-53
- 4.7 多線程搜索的實(shí)現(xiàn)53-55
- 4.8 用戶界面及其實(shí)現(xiàn)算法55-58
- 4.9 本章小結(jié)58-59
- 第五章 檢察專線搜索引擎的測(cè)試與分析59-67
- 5.1 檢察專線搜索引擎系統(tǒng)性能測(cè)試59-61
- 5.2 單線程網(wǎng)頁(yè)抓取性能測(cè)試61-63
- 5.3 對(duì)內(nèi)網(wǎng)搜索引擎邊際安全測(cè)試63-65
- 5.4 本章小結(jié)65-67
- 第六章 結(jié)論與展望67-68
- 6.1 論文工作總結(jié)67
- 6.2 系統(tǒng)展望67-68
- 致謝68-69
- 參考文獻(xiàn)69-71
【參考文獻(xiàn)】
中國(guó)碩士學(xué)位論文全文數(shù)據(jù)庫(kù) 前1條
1 張偉;垂直搜索引擎設(shè)計(jì)與實(shí)現(xiàn)[D];西安電子科技大學(xué);2008年
,本文編號(hào):1095067
本文鏈接:http://sikaile.net/kejilunwen/sousuoyinqinglunwen/1095067.html
最近更新
教材專著