基于Hadoop的圖片地理定位研究
發(fā)布時間:2017-11-24 18:09
本文關(guān)鍵詞:基于Hadoop的圖片地理定位研究
更多相關(guān)文章: 圖片地理定位 Hadoop 海量圖片存儲
【摘要】:隨著多媒體技術(shù)和互聯(lián)網(wǎng)的發(fā)展,圖片分享網(wǎng)站逐漸興起。由于用戶的廣泛參與,圖片分享網(wǎng)站中存儲了海量的多媒體信息,其中有大量的圖片、文本標簽和用戶信息,部分圖片還具有GPS坐標,文本標簽也通常含有地理位置描述信息。而與用戶相關(guān)的GPS坐標具有很重要的研究價值,基于地理位置的搜索也逐漸流行,因此具有地理位置的圖片有著廣泛的應(yīng)用前景。 海量的具有地理位置的圖片數(shù)據(jù)能提供有價值的信息,但具有準確地理位置的圖片在網(wǎng)絡(luò)圖片中占得比例很低,人工標注的地理位置又往往不準確,因此需要利用已有的具有準確地理位置的圖片確定其它圖片的地理位置。同時,海量圖片數(shù)據(jù)的處理需求對圖片處理應(yīng)用的數(shù)據(jù)存儲與處理能力提出了更高的要求,依靠傳統(tǒng)的數(shù)據(jù)處理技術(shù)已經(jīng)不能滿足大量數(shù)據(jù)的處理要求。云計算的快速崛起為圖片處理應(yīng)用提供了新的選擇。 本文在分析國內(nèi)外研究背景和現(xiàn)狀的基礎(chǔ)上,研究了基于Hadoop的圖片文件存儲方案,深入了解和分析了Hadoop在處理小文件時存在的問題以及現(xiàn)有的解決方案,通過采用文件合并的方式優(yōu)化了圖片小文件的存儲,并提出了一種改進的圖片存儲方案,設(shè)計了相應(yīng)的存儲訪問接口。本文還分析了基于文本標簽和基于內(nèi)容的圖片地理定位方案,研究了方案中用到的GPS坐標聚類、文本標簽分類、圖片特征提取及相似度計算等關(guān)鍵技術(shù),并提出了一種基于Hadoop的改進的圖片地理定位方案,同時結(jié)合Java編程語言、SQL Server2012數(shù)據(jù)庫技術(shù)和百度地圖API實現(xiàn)了基于Hadoop的圖片地理定位系統(tǒng)。 改進后的圖片文件存儲方案支持文件的合并和追加操作,極大地方便了圖片文件的管理和處理,改進后的圖片地理定位方案利用GPS坐標聚類和文本標簽分類技術(shù)劃分圖片區(qū)域,同時將文本標簽相似度與圖片相似度相結(jié)合,有效地利用了圖片及其文本標簽信息。本文的實驗結(jié)果表明,改進的圖片文件存儲方案具有較好的存儲訪問性能,改進的圖片地理定位方案具有相對較高的準確率,系統(tǒng)運行也達到了預(yù)期的效果。
【學(xué)位授予單位】:廈門大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2014
【分類號】:TP333;TP391.1
【參考文獻】
中國博士學(xué)位論文全文數(shù)據(jù)庫 前2條
1 吳吉義;基于DHT的開放對等云存儲服務(wù)系統(tǒng)研究[D];浙江大學(xué);2011年
2 吳偉文;基于計算機視覺的目標圖像檢索相關(guān)技術(shù)的研究[D];華南理工大學(xué);2012年
中國碩士學(xué)位論文全文數(shù)據(jù)庫 前4條
1 羅志平;基于大規(guī)模社交媒體挖掘的景點識別[D];華南理工大學(xué);2011年
2 唐建鑫;基于Bag of Features的圖像分類和檢索研究[D];西安電子科技大學(xué);2012年
3 童明;基于HDFS的分布式存儲研究與應(yīng)用[D];華中科技大學(xué);2012年
4 張節(jié)彌;增強量化的Bag-of-Features模型及其應(yīng)用[D];浙江大學(xué);2013年
,本文編號:1223135
本文鏈接:http://sikaile.net/kejilunwen/jisuanjikexuelunwen/1223135.html
最近更新
教材專著