面向海量圖像檢索的視覺(jué)編碼方法分析與優(yōu)化
發(fā)布時(shí)間:2017-11-03 13:06
本文關(guān)鍵詞:面向海量圖像檢索的視覺(jué)編碼方法分析與優(yōu)化
更多相關(guān)文章: 海量圖像檢索 重力信息 幾何信息 乘積量化 稀疏編碼
【摘要】:海量圖像檢索技術(shù)是計(jì)算機(jī)視覺(jué)領(lǐng)域研究熱點(diǎn)之一。作為一種重要的多媒體搜索技術(shù),它幫助用戶在海量圖像中快速檢索出相關(guān)圖像。視覺(jué)編碼的主要工作是將海量圖像快速轉(zhuǎn)化成緊湊高效的向量表達(dá),在海量圖像檢索系統(tǒng)中扮演核心角色,它直接決定海量檢索系統(tǒng)的效率以及精度。詞袋模型,VLAD,Fisher向量以及稀疏編碼等現(xiàn)有主流視覺(jué)編碼模型為快速準(zhǔn)確地進(jìn)行海量圖像檢索提供了有力支持。然而上述視覺(jué)編碼算法也存在一些不足,詞袋模型離線訓(xùn)練時(shí)間過(guò)長(zhǎng);VLAD以及Fisher編碼過(guò)程沒(méi)有考慮圖像上下文信息;稀疏編碼特征集聚算法統(tǒng)計(jì)模型較為簡(jiǎn)單,數(shù)學(xué)理論解釋不充分。因此,針對(duì)上述視覺(jué)編碼算法在碼書(shū)訓(xùn)練、編碼、集聚以及最近鄰檢索階段的不足,本文的視覺(jué)編碼技術(shù)分析以及優(yōu)化研究工作具有重要意義。為分析和優(yōu)化現(xiàn)有面向海量圖像檢索的視覺(jué)編碼方法,本文依次對(duì)詞袋模型、VLAD以及稀疏編碼等視覺(jué)編碼模型進(jìn)行理論與實(shí)驗(yàn)分析,并結(jié)合分布式算法、上下文信息、熵編碼理論以及概率統(tǒng)計(jì)模型等對(duì)上述視覺(jué)編碼算法進(jìn)行改進(jìn),提高海量圖像檢索的性能。最后本文在面向海量圖像的視覺(jué)編碼算法研究基礎(chǔ)之上構(gòu)建了一個(gè)基于城市級(jí)位置服務(wù)的移動(dòng)視覺(jué)檢索系統(tǒng)。本文完成的主要研究工作包括:1)針對(duì)詞袋模型訓(xùn)練速度慢,內(nèi)存消耗大的問(wèn)題,提出一種基于分布式聚類的詞匯樹(shù)算法訓(xùn)練視覺(jué)單詞,實(shí)現(xiàn)快速準(zhǔn)確的碼書(shū)訓(xùn)練過(guò)程。同時(shí)提出一種快速的幾何重排序算法,利用特征點(diǎn)空間位置信息實(shí)現(xiàn)對(duì)檢索結(jié)果的快速幾何重排序。2)針對(duì)VLAD編碼忽略特征點(diǎn)幾何信息的問(wèn)題,提出一種融合重力信息的角度編碼以及尺度集聚算法,實(shí)現(xiàn)融合上下文信息的VLAD編碼。針對(duì)乘積量化方法子空間量化誤差不均衡的問(wèn)題,提出基于上下文信息的角度乘積量化方法以及基于熵編碼的變長(zhǎng)子空間乘積量化方法,分別利用角度子空間以及變長(zhǎng)空間維度實(shí)現(xiàn)子空間量化誤差的均衡。3)針對(duì)稀疏編碼最大值集聚特征表征不足以及求和集聚受burstiness現(xiàn)象影響的問(wèn)題,利用概率解釋模型提出一種優(yōu)化的求和集聚算法,實(shí)現(xiàn)最大值集聚以及求和集聚的優(yōu)勢(shì)融合。同時(shí)針對(duì)稀疏編碼圖像檢索框架下特征采樣以及多特征融合問(wèn)題進(jìn)行研究,利用特征采樣方法選擇的理論分析以及多特征求和集聚實(shí)現(xiàn)檢索精度的提升。4)搜集構(gòu)建了一個(gè)GPS以及重力信息標(biāo)注的Beijing Landmark數(shù)據(jù)庫(kù),利用視覺(jué)編碼算法理論研究實(shí)現(xiàn)城市級(jí)位置服務(wù)的移動(dòng)視覺(jué)檢索系統(tǒng)。視覺(jué)編碼研究中的理論和實(shí)驗(yàn)結(jié)果都證明了本文研究工作的準(zhǔn)確性以及有效性,分布式聚類、上下文信息、熵編碼以及概率解釋模型等理論在碼書(shū)訓(xùn)練、特征編碼、特征集聚以及最近鄰檢索階段極大地優(yōu)化了現(xiàn)有視覺(jué)編碼模型,提高了編碼效率及精度,本文最后構(gòu)建的移動(dòng)視覺(jué)檢索系統(tǒng)具有準(zhǔn)確高效的特點(diǎn),已成功應(yīng)用于國(guó)家十二五科技重大專項(xiàng)。
【關(guān)鍵詞】:海量圖像檢索 重力信息 幾何信息 乘積量化 稀疏編碼
【學(xué)位授予單位】:北京理工大學(xué)
【學(xué)位級(jí)別】:博士
【學(xué)位授予年份】:2015
【分類號(hào)】:TP391.41
【目錄】:
- 摘要5-7
- ABSTRACT7-13
- 第1章 緒論13-40
- 1.1 研究背景13-15
- 1.2 海量圖像檢索技術(shù)發(fā)展現(xiàn)狀15-34
- 1.2.1 圖像局部特征提取與描述15-19
- 1.2.2 特征編碼技術(shù)19-29
- 1.2.3 最近鄰搜索技術(shù)29-34
- 1.3 移動(dòng)視覺(jué)檢索技術(shù)34-36
- 1.3.1 純客戶端搜索模式35-36
- 1.3.2 客戶端/服務(wù)器搜索模式36
- 1.4 本文的內(nèi)容與結(jié)構(gòu)36-40
- 1.4.1 本文研究?jī)?nèi)容36-38
- 1.4.2 論文結(jié)構(gòu)38-40
- 第2章 詞袋模型快速碼書(shū)訓(xùn)練及重排序方法研究40-58
- 2.1 詞袋模型算法中的不足40-41
- 2.2 分布式聚類的詞匯樹(shù)算法41-47
- 2.2.1 詞匯樹(shù)算法簡(jiǎn)介41-43
- 2.2.2 分布式系統(tǒng)結(jié)構(gòu)設(shè)計(jì)43-45
- 2.2.3 分布式聚類算法流程45-47
- 2.3 快速幾何后校驗(yàn)算法47-52
- 2.3.1 基于量化路徑的匹配點(diǎn)集篩選48-49
- 2.3.2 快速幾何一致打分49-51
- 2.3.3 特征角度/尺度信息一致性打分51-52
- 2.4 本節(jié)實(shí)驗(yàn)52-57
- 2.4.1 實(shí)驗(yàn)配置52
- 2.4.2 測(cè)試數(shù)據(jù)庫(kù)52-53
- 2.4.3 分布式算法執(zhí)行效率53
- 2.4.4 時(shí)間以及內(nèi)存占用53-56
- 2.4.5 檢索精度56-57
- 2.5 本章小結(jié)57-58
- 第3章 基于上下文信息的VLAD圖像檢索方法58-93
- 3.1 特征點(diǎn)上下文信息58-61
- 3.2 融合重力信息的角度編碼方法61-65
- 3.2.1 重力自適應(yīng)的特征主方向61-63
- 3.2.2 角度量化(Oriented Coding)63-65
- 3.2.3 基于角度信息的特征編碼方法65
- 3.3 基于尺度信息的特征集聚方法65-70
- 3.3.1 候選匹配特征點(diǎn)篩選66-68
- 3.3.2 尺度變化計(jì)算68-69
- 3.3.3 尺度分區(qū)集聚69-70
- 3.4 角度乘積量化(ORIENTED PQ)和變長(zhǎng)子空間乘積量化(VPQ)70-80
- 3.4.1 角度乘積量化(Oriented PQ)71-73
- 3.4.2 變長(zhǎng)子空間乘積量化(Variable Product Quantization)73-80
- 3.5 實(shí)驗(yàn)數(shù)據(jù)和分析80-92
- 3.5.1 測(cè)試數(shù)據(jù)庫(kù)80-81
- 3.5.2 參數(shù)設(shè)定81-82
- 3.5.3 融合重力信息的角度編碼方法82-85
- 3.5.4 尺度集聚算法85-86
- 3.5.5 特征降維86-87
- 3.5.6 角度乘積量化(Oriented PQ)87-89
- 3.5.7 變長(zhǎng)子空間乘積量化(VPQ)89-91
- 3.5.8 其它檢索算法框架相結(jié)合91-92
- 3.6 本章小結(jié)92-93
- 第4章 稀疏編碼框架特征集聚算法概率解釋及應(yīng)用93-114
- 4.1 稀疏編碼算法93-94
- 4.1.1 特征編碼93-94
- 4.1.2 特征集聚94
- 4.2 特征采樣方法及選擇94-97
- 4.2.1 稠密采樣與稀疏采樣94-96
- 4.2.2 特征采樣方法選擇96-97
- 4.3 特征集聚算法概率解釋模型97-101
- 4.3.1 最大值集聚99
- 4.3.2 求和/均值集聚99-100
- 4.3.3 集聚算法影響分析100-101
- 4.4 優(yōu)化求和集聚算法101-104
- 4.4.1 峰值抑制101-103
- 4.4.2 隨機(jī)誤差剔除103-104
- 4.5 多特征融合104-106
- 4.5.1 多特征提取105
- 4.5.2 特征編碼及集聚105-106
- 4.6 參數(shù)選擇與實(shí)驗(yàn)106-113
- 4.6.1 測(cè)試數(shù)據(jù)庫(kù)106-107
- 4.6.2 采樣方法對(duì)檢索精度的影響107-110
- 4.6.3 優(yōu)化的求和集聚算法性能110-111
- 4.6.4 多特征融合性能111-113
- 4.7 本章小結(jié)113-114
- 第5章 移動(dòng)視覺(jué)檢索系統(tǒng)114-125
- 5.1 移動(dòng)視覺(jué)檢索簡(jiǎn)介114-115
- 5.2 傳統(tǒng)移動(dòng)視覺(jué)檢索技術(shù)架構(gòu)115
- 5.3 面向城市級(jí)位置服務(wù)的移動(dòng)視覺(jué)檢索系統(tǒng)115-124
- 5.3.1 服務(wù)器端116-119
- 5.3.2 移動(dòng)客戶端119-121
- 5.3.3 實(shí)驗(yàn)及參數(shù)設(shè)定121-124
- 5.4 本章小結(jié)124-125
- 第6章 總結(jié)和展望125-127
- 6.1 本文總結(jié)125-126
- 6.2 展望126-127
- 參考文獻(xiàn)127-138
- 攻讀博士學(xué)位期間發(fā)表論文與研究成果清單138-140
- 致謝140-142
- 作者簡(jiǎn)介142
【參考文獻(xiàn)】
中國(guó)期刊全文數(shù)據(jù)庫(kù) 前2條
1 張運(yùn)超;陳靖;王涌天;;基于城市級(jí)位置服務(wù)的移動(dòng)增強(qiáng)現(xiàn)實(shí)[J];電子學(xué)報(bào);2014年08期
2 張運(yùn)超;陳靖;王涌天;劉越;;基于移動(dòng)增強(qiáng)現(xiàn)實(shí)的智慧城市導(dǎo)覽[J];計(jì)算機(jī)研究與發(fā)展;2014年02期
,本文編號(hào):1136297
本文鏈接:http://sikaile.net/shoufeilunwen/xxkjbs/1136297.html
最近更新
教材專著