基于多尺度信息和注意力的立體匹配算法
發(fā)布時間:2023-07-24 23:56
雙目立體匹配是計算機視覺中一個基礎而重要的研究方向,其任務是基于一對矯正后的圖像來計算出參考圖中每個像素的視差。最近隨著卷積神經(jīng)網(wǎng)絡的發(fā)展,基于深度學習的雙目立體匹配算法取得非常好的效果。然而這些方法在一些重復紋理,稀疏紋理以及遮擋等病態(tài)區(qū)域上仍然不理想。本文在DispNets基礎上結(jié)合雙目立體匹配任務特點,提出了一種基于多尺度信息和注意力的立體匹配算法。我們首先提出了一種基于多尺度上下文信息的雙目立體匹配算法,通過使用空間金字池化層來將多尺度的上下文信息進行融合,并且引入帶洞卷積在不降低分辨率的情況下保持相同的感受野,減少了小尺度物體高級語義信息的丟失。然后我們結(jié)合殘差注意力機制,提出了多尺度注意力機制的匹配算法,網(wǎng)絡能夠為視差預測時自適應地提像素級別的注意力信息,減少冗余信息。最后我們結(jié)合金字塔池化層和注意力機制,提出了多尺度上下文信息和注意力機制的雙目立體匹配算法,作為最終的模型。我們在Flyingthings3D,KITTI2012和KITTI2015三個數(shù)據(jù)集上與一些前沿算法進行了一系列對比實驗。我們提出的基于多尺度上下文信息匹配算法和基于注意力機制的匹配算法在三個數(shù)據(jù)集的測...
【文章頁數(shù)】:43 頁
【學位級別】:碩士
【文章目錄】:
摘要
Abstract
1 緒論
1.1 研究背景和意義
1.2 國內(nèi)外研究現(xiàn)狀
1.2.1 非端到端的深度立體匹配算法
1.2.2 端到端的深度立體匹配算法
1.3 研究內(nèi)容和貢獻
1.4 論文章節(jié)安排
2 雙目立體視覺原理和Disp Nets模型
2.1 立體視覺基本原理
2.1.1 單目視覺
2.1.2 雙目視覺
2.1.3 對極幾何原理
2.1.4 視差和深度關系
2.2 DispNets模型
3 本文算法
3.1 基于多尺度上下文信息的方法
3.1.1 空間金字塔池化層
3.1.2 帶洞卷積
3.1.3 基于多尺度上下文信息的方法
3.2 多尺度注意力模型
3.2.1 注意力機制
3.2.2 殘差注意力
3.2.3 多尺度注意力機制模型
3.3 基于多尺度上下文信息和注意力機制的立體匹配算法
4 實驗結(jié)果分析
4.1 雙目數(shù)據(jù)
4.2 實驗細節(jié)
4.2.1 實驗數(shù)據(jù)預處理
4.2.2 模型訓練
4.3 模型定性和定量評價
4.3.1 測評指標
4.3.2 DispnetS,DispnetSPP和 DispnetSA模型分析
4.3.3 DispnetSPPA模型
4.3.4 雙目立體匹配算法比較
結(jié)論
參考文獻
攻讀碩士學位期間發(fā)表學術(shù)論文情況
致謝
本文編號:3836764
【文章頁數(shù)】:43 頁
【學位級別】:碩士
【文章目錄】:
摘要
Abstract
1 緒論
1.1 研究背景和意義
1.2 國內(nèi)外研究現(xiàn)狀
1.2.1 非端到端的深度立體匹配算法
1.2.2 端到端的深度立體匹配算法
1.3 研究內(nèi)容和貢獻
1.4 論文章節(jié)安排
2 雙目立體視覺原理和Disp Nets模型
2.1 立體視覺基本原理
2.1.1 單目視覺
2.1.2 雙目視覺
2.1.3 對極幾何原理
2.1.4 視差和深度關系
2.2 DispNets模型
3 本文算法
3.1 基于多尺度上下文信息的方法
3.1.1 空間金字塔池化層
3.1.2 帶洞卷積
3.1.3 基于多尺度上下文信息的方法
3.2 多尺度注意力模型
3.2.1 注意力機制
3.2.2 殘差注意力
3.2.3 多尺度注意力機制模型
3.3 基于多尺度上下文信息和注意力機制的立體匹配算法
4 實驗結(jié)果分析
4.1 雙目數(shù)據(jù)
4.2 實驗細節(jié)
4.2.1 實驗數(shù)據(jù)預處理
4.2.2 模型訓練
4.3 模型定性和定量評價
4.3.1 測評指標
4.3.2 DispnetS,DispnetSPP和 DispnetSA模型分析
4.3.3 DispnetSPPA模型
4.3.4 雙目立體匹配算法比較
結(jié)論
參考文獻
攻讀碩士學位期間發(fā)表學術(shù)論文情況
致謝
本文編號:3836764
本文鏈接:http://sikaile.net/kejilunwen/shengwushengchang/3836764.html
最近更新
教材專著