基于Lucene的手機(jī)查詢軟件的研究與實(shí)現(xiàn)
本文關(guān)鍵詞:基于Lucene的手機(jī)查詢軟件的研究與實(shí)現(xiàn),由筆耕文化傳播整理發(fā)布。
【摘要】:隨著互聯(lián)網(wǎng)的飛速發(fā)展,以手機(jī)為代表的移動(dòng)終端產(chǎn)品也在飛速發(fā)展,手機(jī)的計(jì)算處理能力和自身的存儲(chǔ)容量變得越來越大,支持的業(yè)務(wù)種類和數(shù)據(jù)類型也越來越多,可以說,手機(jī)越來越成為用戶最重要的數(shù)據(jù)存儲(chǔ)方式之一。因此,針對手機(jī)存儲(chǔ)資源的自身特點(diǎn),根據(jù)用戶獲取信息數(shù)據(jù)的特有需求,如何快速地檢索出手機(jī)終端上用戶所需要的數(shù)據(jù)信息,已經(jīng)成為了一個(gè)即實(shí)際又亟需解決的問題。 本文針對手機(jī)存儲(chǔ)查詢查詢存在的不足,設(shè)計(jì)了一套手機(jī)搜索查詢軟件系統(tǒng),采用基于開源Lucene的搜索框架架構(gòu),通過改進(jìn)查詢算法模型和文檔排序評分算法,實(shí)現(xiàn)對于搜索結(jié)果的排序優(yōu)化。 本文完成的主要工作如下: (1)本文深入分析了當(dāng)前手機(jī)存儲(chǔ)查詢領(lǐng)域存在的不足,,通過深入研究搜索引擎的架構(gòu)、組成和工作原理,提出了基于開源Lucene搜索架構(gòu)的全文檢索解決方案; (2)由于傳統(tǒng)的Lucene查詢模型過于僵化,沒有考慮到相關(guān)因素因子的影響,無法很好地適應(yīng)手機(jī)查詢軟件系統(tǒng),本文通過對文檔評分算法加入經(jīng)過層次分析法確定的相應(yīng)影響因子來進(jìn)行改進(jìn),優(yōu)化了查詢算法模型; (3)針對手機(jī)查詢軟件系統(tǒng)索引創(chuàng)建部分和查詢部分應(yīng)當(dāng)分離的要求,采用分離設(shè)計(jì)模式,分別設(shè)計(jì)索引服務(wù)器部分和界面查詢部分;提出了利用增量算法對文檔進(jìn)行合并的策略,有效的改善了系統(tǒng)的空間利用率;針對支持?jǐn)U展文件類型的要求,采用插件模式設(shè)計(jì)了多媒體文本提取插件; (4)基于以上研究和改進(jìn)優(yōu)化工作,采用Android開發(fā)技術(shù),設(shè)計(jì)并實(shí)現(xiàn)了基于開源Lucene的手機(jī)查詢軟件系統(tǒng)。 綜上所述,本文針對手機(jī)存儲(chǔ)查詢技術(shù)進(jìn)行了全面、深入的研究,改進(jìn)了查詢算法模型,優(yōu)化了文檔評分排序算法,采用分離設(shè)計(jì)模式和插件模式進(jìn)行設(shè)計(jì),使用Android開發(fā)技術(shù),在基于開源Lucene搜索架構(gòu)下設(shè)計(jì)實(shí)現(xiàn)了手機(jī)查詢軟件系統(tǒng)。
【關(guān)鍵詞】:搜索引擎 Lucene 全文檢索 手機(jī)資源 Android
【學(xué)位授予單位】:重慶大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2014
【分類號(hào)】:TP311.52
【目錄】:
- 摘要3-4
- ABSTRACT4-6
- 目錄6-8
- 1 緒論8-12
- 1.1 研究背景及意義8-9
- 1.2 國內(nèi)外研究現(xiàn)狀9-10
- 1.3 本文的主要工作10-12
- 2 相關(guān)技術(shù)研究12-26
- 2.1 搜索引擎12-14
- 2.1.1 搜索引擎簡介12
- 2.1.2 搜索引擎分類12-13
- 2.1.3 搜索引擎工作原理13
- 2.1.4 搜索引擎的組成13-14
- 2.1.5 搜索引擎的現(xiàn)狀與發(fā)展14
- 2.2 全文檢索14-18
- 2.2.1 文本分類14-15
- 2.2.2 文本標(biāo)記語言15-16
- 2.2.3 文本預(yù)處理16
- 2.2.4 文本聚類16
- 2.2.5 中文分詞技術(shù)簡介16-18
- 2.3 ANDROID 開發(fā)技術(shù)18-22
- 2.3.1 Android系統(tǒng)結(jié)構(gòu)18
- 2.3.2 Android應(yīng)用程序架構(gòu)18-19
- 2.3.3 Android應(yīng)用組件19-21
- 2.3.4 Android平臺(tái)優(yōu)勢21-22
- 2.4 LUCENE22-26
- 2.4.1 Lucene簡介22-23
- 2.4.2 Lucene的系統(tǒng)組織結(jié)構(gòu)23-26
- 3 手機(jī)查詢軟件的需求分析26-34
- 3.1 系統(tǒng)概述及目標(biāo)26
- 3.2 系統(tǒng)需求26-30
- 3.2.1 系統(tǒng)功能需求26-30
- 3.2.2 系統(tǒng)非功能性需求30
- 3.3 系統(tǒng)分析模型30-34
- 3.3.1 系統(tǒng)的架構(gòu)30-31
- 3.3.2 系統(tǒng)的業(yè)務(wù)流程31-34
- 4 LUCENE 算法模型改進(jìn)34-48
- 4.1 LUCENE 中的算法34-39
- 4.1.1 增量算法的設(shè)計(jì)34-35
- 4.1.2 歸并算法的設(shè)計(jì)35-37
- 4.1.3 查找算法的設(shè)計(jì)37-39
- 4.2 LUCENE 的索引模型39-43
- 4.2.1 Lucene中的索引文件39-40
- 4.2.2 三種索引模型介紹40-43
- 4.2.3 三種索引模型的比較43
- 4.2.4 索引模型的選擇43
- 4.3 建立查詢模型43-48
- 4.3.1 模型的建立43-44
- 4.3.2 文檔評分算法44-45
- 4.3.3 文檔評分算法的改進(jìn)45-46
- 4.3.4 算法改進(jìn)后對比測試46-48
- 5 系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)48-70
- 5.1 全文檢索系統(tǒng)的設(shè)計(jì)48-49
- 5.2 索引服務(wù)器的設(shè)計(jì)與實(shí)現(xiàn)49-64
- 5.3 系統(tǒng)界面部分的設(shè)計(jì)與實(shí)現(xiàn)64-68
- 5.4 多媒體文本提取插件的設(shè)計(jì)與實(shí)現(xiàn)68-70
- 6 結(jié)論與展望70-72
- 6.1 結(jié)論70
- 6.2 展望70-72
- 致謝72-73
- 參考文獻(xiàn)73-74
【參考文獻(xiàn)】
中國期刊全文數(shù)據(jù)庫 前10條
1 曾慶祥;廖建新;安寶貴;朱春梅;于川;;基于Lucene算法的移動(dòng)終端資源搜索引擎研究與設(shè)計(jì)[J];北京工商大學(xué)學(xué)報(bào)(自然科學(xué)版);2008年05期
2 李曉鑫;;桌面搜索引擎設(shè)計(jì)[J];電腦知識(shí)與技術(shù);2011年20期
3 訾玲玲;杜軍平;胡娟;;跨媒體搜索引擎TCSE的研究與實(shí)現(xiàn)[J];復(fù)雜系統(tǒng)與復(fù)雜性科學(xué);2012年01期
4 ;新華社和中移動(dòng)聯(lián)手開通盤古搜索[J];中國傳媒科技;2011年02期
5 閆旭;;百度阿拉丁:下一代搜索引擎的目標(biāo)[J];互聯(lián)網(wǎng)天地;2009年02期
6 馬迎春;全文檢索系統(tǒng)概述[J];情報(bào)科學(xué);2000年12期
7 李廣建,黃];元搜索引擎及其主要技術(shù)[J];情報(bào)科學(xué);2002年02期
8 張啟宇;朱玲;張雅萍;;中文分詞算法研究綜述[J];情報(bào)探索;2008年11期
9 許麗麗;;元搜索引擎Clusty研究[J];情報(bào)探索;2009年03期
10 劉海峰;王元元;;基于向量模型的文本檢索若干問題研究[J];情報(bào)雜志;2006年10期
本文關(guān)鍵詞:基于Lucene的手機(jī)查詢軟件的研究與實(shí)現(xiàn),由筆耕文化傳播整理發(fā)布。
本文編號(hào):280763
本文鏈接:http://sikaile.net/kejilunwen/sousuoyinqinglunwen/280763.html