基于區(qū)域評價和關(guān)系建模的圖像檢索研究
發(fā)布時間:2024-07-04 20:09
基于內(nèi)容的圖像檢索(CBIR),俗稱“以圖搜圖”,一直以來都是計算機視覺領(lǐng)域的基礎(chǔ)研究課題,其對相關(guān)研究領(lǐng)域有著深遠的影響,并有著廣泛的商業(yè)應用。隨著網(wǎng)絡上的多媒體數(shù)據(jù)呈現(xiàn)爆炸式地增長以及自動駕駛,增強現(xiàn)實等越來越多實際應用的需求,圖像檢索成為一個基礎(chǔ)且具有實際意義的研究課題。近年來,深度學習方法和理論在人工智能,模式識別的代表性研究方向如物體識別,語音識別,物體檢測等任務取得了巨大成功。圖像檢索領(lǐng)域也毫無例外地將傳統(tǒng)方法與深度卷積神經(jīng)網(wǎng)絡(CNN)特征相結(jié)合,進行編碼和聚合得到緊湊的全局描述符表示。CNN特征具有表示能力強,維度低等優(yōu)點,逐漸在工業(yè)界和學術(shù)界被廣泛應用。本篇論文的研究工作主要在兩類圖像檢索數(shù)據(jù)集展開:標準物體檢索數(shù)據(jù)集和地理位置檢索數(shù)據(jù)集。兩種數(shù)據(jù)集可以進一步劃分為單物體圖像檢索和多物體圖像檢索數(shù)據(jù)集。雖然近年的工作將這些數(shù)據(jù)集的檢索準確度提升到了很高的層次,現(xiàn)今的方法仍存在一些待改進的地方。本文也通過改進現(xiàn)有的方法進一步提升了圖像檢索準確度。本文的研究工作主要包括:(1)有效解決過度計數(shù)問題。自然圖像中的物體或多或少具有重復結(jié)構(gòu),尤其在建筑物上最為常見。之前的一些工...
【文章頁數(shù)】:68 頁
【學位級別】:碩士
【文章目錄】:
摘要
Abstract
第1章 緒論
1.1 課題研究的背景、內(nèi)容及意義
1.2 國內(nèi)外研究現(xiàn)狀
1.2.1 基于深度學習特征的圖像檢索研究現(xiàn)狀
1.2.2 主要存在的問題
1.3 本文的內(nèi)容以及章節(jié)安排
1.3.1 本文的研究內(nèi)容
1.3.2 本文的組織結(jié)構(gòu)
第2章 相關(guān)技術(shù)基礎(chǔ)理論
2.1 基于深度學習特征的圖像檢索
2.1.1 卷積神經(jīng)網(wǎng)絡模型
2.1.2 基于深度特征的圖像檢索
2.2 注意力機制
2.3 視覺關(guān)系建模框架
2.4 網(wǎng)絡訓練
2.4.1 分類損失函數(shù)
2.4.2 度量學習方法
2.5 特征降維
2.6 圖像檢索數(shù)據(jù)集
2.6.1 數(shù)據(jù)集難點
2.6.2 評價指標
2.7 本章小結(jié)
第3章 基于區(qū)域評價的圖像檢索
3.1 深度區(qū)域特征
3.2 網(wǎng)絡結(jié)構(gòu)
3.2.1 金字塔池化
3.2.2 注意力模塊與級聯(lián)注意力模塊
3.3 PCA冪白化
3.4 實驗配置
3.5 實驗結(jié)果
3.5.1 區(qū)域選擇
3.5.2 注意力模塊
3.5.3 PCA冪白化
3.5.4 與當前先進方法比較
3.5.5 標準圖像檢索實驗
3.6 本章小結(jié)
第4章 基于關(guān)系建模的圖像檢索
4.1 圖像檢索假設中關(guān)系信息的缺失
4.2 區(qū)域關(guān)系模塊
4.3 級聯(lián)池化方法
4.4 實驗配置
4.4.1 網(wǎng)絡訓練
4.4.2 網(wǎng)絡測試
4.5 實驗結(jié)果
4.5.1 關(guān)系特征圖與級聯(lián)池化
4.5.2 關(guān)系描述符與外觀描述符
4.5.3 圖像檢索示例
4.5.4 關(guān)系特征分析
4.5.5 與當前先進方法比較
4.5.6 標準圖像檢索實驗
4.5.7 RelationVLAD
4.5.8 實驗結(jié)果對比以及定性分析
4.6 本章小結(jié)
第5章 總結(jié)和展望
參考文獻
致謝
攻讀碩士學位期間的研究成果
本文編號:4000475
【文章頁數(shù)】:68 頁
【學位級別】:碩士
【文章目錄】:
摘要
Abstract
第1章 緒論
1.1 課題研究的背景、內(nèi)容及意義
1.2 國內(nèi)外研究現(xiàn)狀
1.2.1 基于深度學習特征的圖像檢索研究現(xiàn)狀
1.2.2 主要存在的問題
1.3 本文的內(nèi)容以及章節(jié)安排
1.3.1 本文的研究內(nèi)容
1.3.2 本文的組織結(jié)構(gòu)
第2章 相關(guān)技術(shù)基礎(chǔ)理論
2.1 基于深度學習特征的圖像檢索
2.1.1 卷積神經(jīng)網(wǎng)絡模型
2.1.2 基于深度特征的圖像檢索
2.2 注意力機制
2.3 視覺關(guān)系建模框架
2.4 網(wǎng)絡訓練
2.4.1 分類損失函數(shù)
2.4.2 度量學習方法
2.5 特征降維
2.6 圖像檢索數(shù)據(jù)集
2.6.1 數(shù)據(jù)集難點
2.6.2 評價指標
2.7 本章小結(jié)
第3章 基于區(qū)域評價的圖像檢索
3.1 深度區(qū)域特征
3.2 網(wǎng)絡結(jié)構(gòu)
3.2.1 金字塔池化
3.2.2 注意力模塊與級聯(lián)注意力模塊
3.3 PCA冪白化
3.4 實驗配置
3.5 實驗結(jié)果
3.5.1 區(qū)域選擇
3.5.2 注意力模塊
3.5.3 PCA冪白化
3.5.4 與當前先進方法比較
3.5.5 標準圖像檢索實驗
3.6 本章小結(jié)
第4章 基于關(guān)系建模的圖像檢索
4.1 圖像檢索假設中關(guān)系信息的缺失
4.2 區(qū)域關(guān)系模塊
4.3 級聯(lián)池化方法
4.4 實驗配置
4.4.1 網(wǎng)絡訓練
4.4.2 網(wǎng)絡測試
4.5 實驗結(jié)果
4.5.1 關(guān)系特征圖與級聯(lián)池化
4.5.2 關(guān)系描述符與外觀描述符
4.5.3 圖像檢索示例
4.5.4 關(guān)系特征分析
4.5.5 與當前先進方法比較
4.5.6 標準圖像檢索實驗
4.5.7 RelationVLAD
4.5.8 實驗結(jié)果對比以及定性分析
4.6 本章小結(jié)
第5章 總結(jié)和展望
參考文獻
致謝
攻讀碩士學位期間的研究成果
本文編號:4000475
本文鏈接:http://sikaile.net/kejilunwen/shengwushengchang/4000475.html
最近更新
教材專著