基于Lucene的云平臺(tái)搜索技術(shù)研究與實(shí)現(xiàn)
本文關(guān)鍵詞:基于Lucene的云平臺(tái)搜索技術(shù)研究與實(shí)現(xiàn)
更多相關(guān)文章: Lucene Hadoop 以圖搜圖 以圖搜視頻
【摘要】:隨著互聯(lián)網(wǎng)對(duì)工作、學(xué)習(xí)、生活的滲透程度的日益加深,各種云應(yīng)用極大地豐富、大數(shù)據(jù)時(shí)代信息量的呈爆炸式增長(zhǎng),互聯(lián)網(wǎng)正在從過去傳統(tǒng)意義上的通信基礎(chǔ)平臺(tái)向泛在、智能的計(jì)算平臺(tái)轉(zhuǎn)化。然而,如果沒有搜索服務(wù),在茫茫資源海洋里,用戶要找到想要的資源,無異于大海撈針。搜索,就是在多且雜亂的資源庫(kù)、信息庫(kù)里,為用戶提供一條快速、有效地找到其想要資源的關(guān)鍵途徑。本課題旨在對(duì)生活中常見的搜索應(yīng)用的種類:文件搜索、圖片搜索和視頻搜索,通過橫向融合于一體,研究和實(shí)現(xiàn)一套簡(jiǎn)單、有效、可用的解決方案。在自定義算法實(shí)現(xiàn)云平臺(tái)的HDFS文件系統(tǒng)文件搜索的基礎(chǔ)上,結(jié)合開源的全文搜索引擎開發(fā)包Lucene,著重研究和實(shí)現(xiàn)了:在云存儲(chǔ)平臺(tái)上,如何快速、有效地找到文件,并摒棄無意義的搜索;在購(gòu)物平臺(tái)上,如何根據(jù)樣圖快速找到相似商品從而方便進(jìn)行比價(jià);在視頻監(jiān)控平臺(tái)上,如何根據(jù)一張異常視頻畫面,快速、準(zhǔn)確地找到該畫面所在的視頻及定位該畫面時(shí)間點(diǎn)。通過使用Load Runner測(cè)試工具對(duì)實(shí)驗(yàn)環(huán)境進(jìn)行測(cè)試,結(jié)果表明,在性能上基本達(dá)到了預(yù)期目標(biāo),搜索速度快、結(jié)果較準(zhǔn)確,實(shí)現(xiàn)效果較好,對(duì)云存儲(chǔ)平臺(tái)、購(gòu)物平臺(tái)、視頻監(jiān)控平臺(tái)實(shí)現(xiàn)搜索功能都有積極的參考意義。
【關(guān)鍵詞】:Lucene Hadoop 以圖搜圖 以圖搜視頻
【學(xué)位授予單位】:華南理工大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2015
【分類號(hào)】:TP393.09
【目錄】:
- 摘要5-6
- ABSTRACT6-9
- 第一章 緒論9-15
- 1.1 研究背景9-10
- 1.2 研究目標(biāo)10
- 1.3 國(guó)內(nèi)外研究進(jìn)展10-13
- 1.3.1 國(guó)外研究現(xiàn)狀10-11
- 1.3.2 國(guó)內(nèi)研究現(xiàn)狀11-13
- 1.4 本文主要工作13-14
- 1.5 論文組織結(jié)構(gòu)14
- 1.6 本章小結(jié)14-15
- 第二章HDFS文件系統(tǒng)搜索技術(shù)研究與應(yīng)用15-33
- 2.1 Hadoop分布式存儲(chǔ)系統(tǒng)15-17
- 2.2 自定義IsFind算法實(shí)現(xiàn)文件搜索17-21
- 2.2.1 自定義Is Find算法技術(shù)研究17-18
- 2.2.2 IsFind實(shí)現(xiàn)文件搜索18-19
- 2.2.3 實(shí)現(xiàn)效果小結(jié)19-21
- 2.3 Lucene搜索開發(fā)包21-32
- 2.3.1 Lucene相關(guān)技術(shù)研究21-26
- 2.3.2 Lucene+IKAnalyzer實(shí)現(xiàn)文件搜索26-31
- 2.3.3 實(shí)現(xiàn)效果小結(jié)31-32
- 2.4 本章小結(jié)32-33
- 第三章 以圖搜圖的搜索技術(shù)研究與應(yīng)用33-44
- 3.1 以圖搜圖的相關(guān)技術(shù)研究33-35
- 3.2 a Hash實(shí)現(xiàn)以圖搜圖35-43
- 3.2.1 aHash算法35-39
- 3.2.2 aHash實(shí)現(xiàn)以圖搜圖39-41
- 3.2.3 實(shí)現(xiàn)效果小結(jié)41-43
- 3.3 本章小結(jié)43-44
- 第四章 以圖搜視頻的搜索技術(shù)研究與應(yīng)用44-55
- 4.1 以圖搜視頻的相關(guān)技術(shù)研究44-47
- 4.2 FFmpeg+aHash實(shí)現(xiàn)以圖搜視頻47-54
- 4.2.1 FFmpeg技術(shù)研究47-50
- 4.2.2 FFmpeg+a Hash實(shí)現(xiàn)以圖搜視頻50-53
- 4.2.3 實(shí)現(xiàn)效果小結(jié)53-54
- 4.3 本章小結(jié)54-55
- 第五章 搜索性能測(cè)試55-64
- 5.1 實(shí)驗(yàn)環(huán)境55-57
- 5.2 測(cè)試工具57-60
- 5.3 測(cè)試結(jié)果60-63
- 5.4 本章小結(jié)63-64
- 第六章 總結(jié)與展望64-65
- 參考文獻(xiàn)65-68
- 攻讀碩士學(xué)位期間取得的研究成果68-69
- 致謝69-70
- 附件70
【參考文獻(xiàn)】
中國(guó)期刊全文數(shù)據(jù)庫(kù) 前5條
1 王晟;趙壁芳;;基于內(nèi)容的圖片搜索引擎研究[J];長(zhǎng)沙大學(xué)學(xué)報(bào);2012年02期
2 牛夏牧;焦玉華;;感知哈希綜述[J];電子學(xué)報(bào);2008年07期
3 談圳;;云計(jì)算虛擬化技術(shù)研究[J];信息技術(shù)與信息化;2012年01期
4 劉亞秋;景維鵬;井云凌;;高可靠云計(jì)算平臺(tái)及其在智慧林業(yè)中的應(yīng)用[J];世界林業(yè)研究;2011年05期
5 王博;陳莉君;;Hadoop遠(yuǎn)程過程調(diào)用機(jī)制的分析和應(yīng)用[J];西安郵電學(xué)院學(xué)報(bào);2012年06期
中國(guó)碩士學(xué)位論文全文數(shù)據(jù)庫(kù) 前4條
1 蔡蕊;一種新的搜索引擎分詞詞典的研究[D];山東大學(xué);2010年
2 黃翼彪;開源中文分詞器的比較研究[D];鄭州大學(xué);2013年
3 易理林;HDFS文件系統(tǒng)中元數(shù)據(jù)的高可用性管理方法研究[D];華南理工大學(xué);2013年
4 鄒敏昊;基于Lucene的HBase全文檢索功能的設(shè)計(jì)與實(shí)現(xiàn)[D];南京大學(xué);2013年
,本文編號(hào):629628
本文鏈接:http://sikaile.net/kejilunwen/sousuoyinqinglunwen/629628.html