基于深度學習的單目圖像深度估計研究
發(fā)布時間:2022-08-01 12:20
深度信息是智能系統(tǒng)實現(xiàn)場景理解的基礎,單目圖像深度估計作為一個比較基礎的視覺任務,可以為許多高級任務提供深度信息,在自動駕駛、增強現(xiàn)實、虛擬現(xiàn)實等任務中有著巨大的應用前景,可以說是一個相當重要的研究課題。雖然現(xiàn)在已經(jīng)出現(xiàn)了一些可以用于獲取深度信息的設備,比如深度相機、激光雷達,但是在室外場景下它們不能獲得令人滿意的深度值。相比于雙目和多目深度估計方法,單目深度估計方法獲取數(shù)據(jù)簡單、成本低廉,可以得到一張全分辨率的深度圖,為深度信息的獲取提供了一條全新的研究思路。正是因為單目圖像深度估計方法具有重要的研究價值,本文基于深度學習方法對室外場景下的單目圖像深度估計進行了研究,主要研究內(nèi)容如下:1、針對室外場景下的單目深度估計任務,在第三章中提出了一種基于編解碼結(jié)構(gòu)和分階段優(yōu)化策略設計的單目深度估計算法。這個模型由兩部分組成,第一部分選擇使用當前最先進的單目深度估計體系中的編解碼結(jié)構(gòu),第二部分使用CSPN作為后處理模塊,可以對第一部分產(chǎn)生的不夠細粒度的深度圖進行優(yōu)化。雖然使用分階段策略,但是最終的模型整體上還是一個端到端結(jié)構(gòu),訓練與測試過程并不復雜。在面向室外場景的公開數(shù)據(jù)集KITTI上對模型...
【文章頁數(shù)】:65 頁
【學位級別】:碩士
【文章目錄】:
摘要
ABSTRACT
第一章 緒論
1.1 論文研究背景及意義
1.2 主要研究現(xiàn)狀
1.2.1 早期的單目圖像深度估計
1.2.2 基于深度學習方法的單目圖像深度估計
1.2.3 面臨的問題和挑戰(zhàn)
1.3 論文主要研究內(nèi)容與創(chuàng)新點
1.4 論文章節(jié)安排
第二章 預備知識
2.1 卷積神經(jīng)網(wǎng)絡
2.1.1 卷積層
2.1.2 池化層
2.1.3 全連接層
2.1.4 激活函數(shù)
2.2 卷積空間傳播網(wǎng)絡
2.2.1 各向異性擴散濾波
2.2.2 CSPN工作方式
2.3 本章小結(jié)
第三章 基于編解碼結(jié)構(gòu)和后處理的單目深度估計模型
3.1 引言
3.2 網(wǎng)絡模型結(jié)構(gòu)及原理
3.2.1 殘差編碼模塊
3.2.2 上采樣模塊
3.2.3 編解碼結(jié)構(gòu)模型的實現(xiàn)細節(jié)
3.2.4 CSPN優(yōu)化模塊
3.3 損失函數(shù)
3.4 實驗結(jié)果及分析
3.4.1 實現(xiàn)細節(jié)
3.4.2 評價指標
3.4.3 使用不同損失函數(shù)對實驗效果的影響
3.4.4 真實深度值采樣點的個數(shù)對實驗效果的影響
3.4.5 與其他方法的對比實驗
3.5 本章小結(jié)
第四章 基于特征對齊與后處理的單目深度估計模型
4.1 引言
4.2 網(wǎng)絡模型結(jié)構(gòu)及原理
4.2.1 特征對齊模塊
4.2.2 特征融合模塊
4.2.3 后處理模塊
4.3 實驗結(jié)果
4.3.1 實現(xiàn)細節(jié)
4.3.2 幀序列中包含不同的幀數(shù)對實驗結(jié)果的影響
4.3.3 與其他算法的對比實驗
4.3.4 特征對齊模塊的有效性
4.4 本章小結(jié)
第五章 輕量化處理后的單目深度估計模型
5.1 引言
5.2 輕量化FA-CSPN模型設計
5.2.1 可分離卷積
5.2.2 對FA-CSPN模型進行輕量化處理
5.3 圖像集合損失函數(shù)
5.4 實驗
5.4.1 輕量化處理前后的模型對比
5.4.2 使用不同損失函數(shù)對實驗結(jié)果的影響
5.4.3 使用不同的正則化系數(shù)對實驗結(jié)果的影響
5.4.4 與其他方法進行比較的實驗結(jié)果
5.5 本章小結(jié)
第六章 總結(jié)與展望
6.1 總結(jié)
6.2 展望
參考文獻
致謝
攻讀學位期間發(fā)表的學術(shù)論文目錄
【參考文獻】:
期刊論文
[1]基于FFT和全連接層特征提取的軸承故障診斷(英文)[J]. 王萌,曾艷,劉金童,劉小杰,彭飛. 機床與液壓. 2020(24)
[2]改進深度可分離卷積的SSD車型識別[J]. 郭融,王芳,劉偉. 重慶大學學報. 2021(06)
[3]基于深度學習的目標檢測技術(shù)的研究綜述[J]. 羅元,王薄宇,陳旭. 半導體光電. 2020(01)
[4]基于深度學習的圖像識別技術(shù)研究綜述[J]. 張琦,張榮梅,陳彬. 河北省科學院學報. 2019(03)
[5]基于深度學習的圖像語義分割技術(shù)研究綜述[J]. 鄺輝宇,吳俊君. 計算機工程與應用. 2019(19)
[6]基于改進卷積神經(jīng)網(wǎng)絡的多視角人臉表情識別[J]. 錢勇生,邵潔,季欣欣,李曉瑞,莫晨,程其玉. 計算機工程與應用. 2018(24)
[7]基于監(jiān)督學習的單幅圖像深度估計綜述[J]. 畢天騰,劉越,翁冬冬,王涌天. 計算機輔助設計與圖形學學報. 2018(08)
[8]2維至3維圖像/視頻轉(zhuǎn)換的深度圖提取方法綜述[J]. 李可宏,姜靈敏,龔永義. 中國圖象圖形學報. 2014(10)
[9]基于物體幾何性質(zhì)的單幅圖像三維重建[J]. 石仁愛,趙志剛,呂慧顯,趙毅. 青島大學學報(自然科學版). 2013(01)
[10]基于計算機視覺的深度估計方法[J]. 江靜,張雪松. 光電技術(shù)應用. 2011(01)
碩士論文
[1]圖像的視覺顯著性分析與應用研究[D]. 楊勝輝.海南大學 2016
本文編號:3667436
【文章頁數(shù)】:65 頁
【學位級別】:碩士
【文章目錄】:
摘要
ABSTRACT
第一章 緒論
1.1 論文研究背景及意義
1.2 主要研究現(xiàn)狀
1.2.1 早期的單目圖像深度估計
1.2.2 基于深度學習方法的單目圖像深度估計
1.2.3 面臨的問題和挑戰(zhàn)
1.3 論文主要研究內(nèi)容與創(chuàng)新點
1.4 論文章節(jié)安排
第二章 預備知識
2.1 卷積神經(jīng)網(wǎng)絡
2.1.1 卷積層
2.1.2 池化層
2.1.3 全連接層
2.1.4 激活函數(shù)
2.2 卷積空間傳播網(wǎng)絡
2.2.1 各向異性擴散濾波
2.2.2 CSPN工作方式
2.3 本章小結(jié)
第三章 基于編解碼結(jié)構(gòu)和后處理的單目深度估計模型
3.1 引言
3.2 網(wǎng)絡模型結(jié)構(gòu)及原理
3.2.1 殘差編碼模塊
3.2.2 上采樣模塊
3.2.3 編解碼結(jié)構(gòu)模型的實現(xiàn)細節(jié)
3.2.4 CSPN優(yōu)化模塊
3.3 損失函數(shù)
3.4 實驗結(jié)果及分析
3.4.1 實現(xiàn)細節(jié)
3.4.2 評價指標
3.4.3 使用不同損失函數(shù)對實驗效果的影響
3.4.4 真實深度值采樣點的個數(shù)對實驗效果的影響
3.4.5 與其他方法的對比實驗
3.5 本章小結(jié)
第四章 基于特征對齊與后處理的單目深度估計模型
4.1 引言
4.2 網(wǎng)絡模型結(jié)構(gòu)及原理
4.2.1 特征對齊模塊
4.2.2 特征融合模塊
4.2.3 后處理模塊
4.3 實驗結(jié)果
4.3.1 實現(xiàn)細節(jié)
4.3.2 幀序列中包含不同的幀數(shù)對實驗結(jié)果的影響
4.3.3 與其他算法的對比實驗
4.3.4 特征對齊模塊的有效性
4.4 本章小結(jié)
第五章 輕量化處理后的單目深度估計模型
5.1 引言
5.2 輕量化FA-CSPN模型設計
5.2.1 可分離卷積
5.2.2 對FA-CSPN模型進行輕量化處理
5.3 圖像集合損失函數(shù)
5.4 實驗
5.4.1 輕量化處理前后的模型對比
5.4.2 使用不同損失函數(shù)對實驗結(jié)果的影響
5.4.3 使用不同的正則化系數(shù)對實驗結(jié)果的影響
5.4.4 與其他方法進行比較的實驗結(jié)果
5.5 本章小結(jié)
第六章 總結(jié)與展望
6.1 總結(jié)
6.2 展望
參考文獻
致謝
攻讀學位期間發(fā)表的學術(shù)論文目錄
【參考文獻】:
期刊論文
[1]基于FFT和全連接層特征提取的軸承故障診斷(英文)[J]. 王萌,曾艷,劉金童,劉小杰,彭飛. 機床與液壓. 2020(24)
[2]改進深度可分離卷積的SSD車型識別[J]. 郭融,王芳,劉偉. 重慶大學學報. 2021(06)
[3]基于深度學習的目標檢測技術(shù)的研究綜述[J]. 羅元,王薄宇,陳旭. 半導體光電. 2020(01)
[4]基于深度學習的圖像識別技術(shù)研究綜述[J]. 張琦,張榮梅,陳彬. 河北省科學院學報. 2019(03)
[5]基于深度學習的圖像語義分割技術(shù)研究綜述[J]. 鄺輝宇,吳俊君. 計算機工程與應用. 2019(19)
[6]基于改進卷積神經(jīng)網(wǎng)絡的多視角人臉表情識別[J]. 錢勇生,邵潔,季欣欣,李曉瑞,莫晨,程其玉. 計算機工程與應用. 2018(24)
[7]基于監(jiān)督學習的單幅圖像深度估計綜述[J]. 畢天騰,劉越,翁冬冬,王涌天. 計算機輔助設計與圖形學學報. 2018(08)
[8]2維至3維圖像/視頻轉(zhuǎn)換的深度圖提取方法綜述[J]. 李可宏,姜靈敏,龔永義. 中國圖象圖形學報. 2014(10)
[9]基于物體幾何性質(zhì)的單幅圖像三維重建[J]. 石仁愛,趙志剛,呂慧顯,趙毅. 青島大學學報(自然科學版). 2013(01)
[10]基于計算機視覺的深度估計方法[J]. 江靜,張雪松. 光電技術(shù)應用. 2011(01)
碩士論文
[1]圖像的視覺顯著性分析與應用研究[D]. 楊勝輝.海南大學 2016
本文編號:3667436
本文鏈接:http://sikaile.net/kejilunwen/shengwushengchang/3667436.html
最近更新
教材專著