基于視覺語義的深度估計(jì)、實(shí)例分割與重建
發(fā)布時(shí)間:2021-02-08 23:50
機(jī)器人視覺系統(tǒng)是模擬人類視覺的復(fù)雜系統(tǒng),其中的深度估計(jì)和實(shí)例分割更是頗具挑戰(zhàn)的視覺任務(wù)。本文結(jié)合近幾年先進(jìn)的計(jì)算機(jī)視覺與深度學(xué)習(xí)的成果,圍繞深度估計(jì)、深度圖像修復(fù)、實(shí)例分割和重建等任務(wù)展開討論,提出自己的創(chuàng)新方法。本文首先提出了一種用于雙目深度估計(jì)的孿生分支網(wǎng)絡(luò),其完全相同的孿生分支和3D卷積隱藏層的連接確保了卷積網(wǎng)絡(luò)能夠?qū)W習(xí)雙目視差信息,而雙目視差信息正是提高深度估計(jì)方法魯棒性的關(guān)鍵,緊接著本文提出一種深度圖像超分和細(xì)化網(wǎng)絡(luò)對(duì)小分辨率的孿生分支網(wǎng)絡(luò)輸出的結(jié)果進(jìn)行超分辨率重建,得到高分辨率高精度深度估計(jì)結(jié)果,并設(shè)計(jì)了實(shí)驗(yàn)與其他方法進(jìn)行對(duì)比證明本文方法的有效性;然后,鑒于近幾年深度相機(jī)在室內(nèi)機(jī)器人視覺系統(tǒng)的流行,本文提出了一種基于全卷積網(wǎng)絡(luò)的深度圖像修復(fù)方法,用于修復(fù)帶有大面積缺失的由深度相機(jī)拍攝的深度圖像,并設(shè)計(jì)了實(shí)驗(yàn)與傳統(tǒng)的方法進(jìn)行了比較;接著本文提出了一種用于非移動(dòng)式機(jī)器人的工件實(shí)例分割方法,并設(shè)計(jì)實(shí)驗(yàn)展示了幾種經(jīng)典機(jī)器學(xué)習(xí)算法做核心算法時(shí)工件分類的準(zhǔn)確度,然后提出一種通用實(shí)例分割與深度估計(jì)相結(jié)合的多任務(wù)學(xué)習(xí)網(wǎng)絡(luò)進(jìn)行通用實(shí)例分割和深度估計(jì),展示出多任務(wù)學(xué)習(xí)使各個(gè)子任務(wù)學(xué)到的信息更加...
【文章來源】:中國科學(xué)院大學(xué)(中國科學(xué)院深圳先進(jìn)技術(shù)研究院)廣東省
【文章頁數(shù)】:61 頁
【學(xué)位級(jí)別】:碩士
【文章目錄】:
摘要
abstract
第1章 緒論
1.1 研究背景和意義
1.2 國內(nèi)外研究現(xiàn)狀
1.3 本文的主要內(nèi)容及貢獻(xiàn)
第2章 深度學(xué)習(xí)基礎(chǔ)
2.1 深度學(xué)習(xí)簡介
2.2 卷積神經(jīng)網(wǎng)絡(luò)常用組件及操作
2.2.1 卷積層
2.2.2 全連接層
2.2.3 反卷積層
2.3 深度學(xué)習(xí)常用術(shù)語解釋
第3章 深度估計(jì)
3.1 深度估計(jì)簡介
3.2 基于深度學(xué)習(xí)的雙目孿生深度估計(jì)
3.3 基于全卷積網(wǎng)絡(luò)的深度圖超分辨率及細(xì)化
3.4 損失函數(shù)
3.5 實(shí)驗(yàn)及實(shí)驗(yàn)結(jié)果
3.5.1 數(shù)據(jù)集擴(kuò)充
3.5.2 實(shí)驗(yàn)
3.5.3 實(shí)驗(yàn)結(jié)果及評(píng)估
3.6 小節(jié)及展望
第4章 基于全卷積網(wǎng)絡(luò)的深度圖像修復(fù)研究
4.1 深度圖像修復(fù)研究現(xiàn)狀
4.2 基于全卷積網(wǎng)絡(luò)的深度圖像修復(fù)
4.3 實(shí)驗(yàn)與損失函數(shù)
4.4 實(shí)驗(yàn)結(jié)果
4.5 小節(jié)及展望
第5章 實(shí)例分割與多任務(wù)學(xué)習(xí)
5.1 基于深度圖像的工件實(shí)例分割
5.1.1 深度圖像背景差的分層二值化
5.1.2 工件確定位置和確定姿態(tài)
5.1.3 機(jī)器學(xué)習(xí)分類
5.1.4 機(jī)器學(xué)習(xí)分割
5.1.5 實(shí)驗(yàn)及實(shí)驗(yàn)結(jié)果
5.2 基于深度學(xué)習(xí)的通用實(shí)例分割經(jīng)典方法:Mask R-CNN簡介
5.2.1 ResNet-FPN架構(gòu)
5.2.2 Faster R-CNN網(wǎng)絡(luò)
5.2.3 Mask R-CNN網(wǎng)絡(luò)結(jié)構(gòu)
5.2.4 Mask R-CNN損失函數(shù)
5.3 深度估計(jì)與實(shí)例分割的多任務(wù)學(xué)習(xí)
5.3.1 同時(shí)深度估計(jì)與實(shí)例分割的多任務(wù)學(xué)習(xí)網(wǎng)絡(luò)結(jié)構(gòu)
5.3.2 實(shí)驗(yàn)與損失函數(shù)
5.4 小節(jié)
第6章 工作空間場景重建
6.1 國內(nèi)外相關(guān)方法
6.2 工作空間場景重建
6.2.1 基于雙目深度估計(jì)的工作空間場景重建
6.2.2 基于深度圖像修復(fù)的工作空間場景重建
6.2.3 基于多任務(wù)學(xué)習(xí)的工作空間場景重建
6.3 場景重建結(jié)果
第7章 結(jié)束語
7.1 本文工作總結(jié)
7.2 下一步研究方向
參考文獻(xiàn)
致謝
作者簡歷及攻讀學(xué)位期間發(fā)表的學(xué)術(shù)論文與研究成果
【參考文獻(xiàn)】:
期刊論文
[1]利用激光掃描和數(shù)碼相機(jī)進(jìn)行古建筑三維重建研究[J]. 鄧非,張祖勛,張劍清. 測繪科學(xué). 2007(02)
[2]一種基于多面體模型的從明暗恢復(fù)物體形狀方法[J]. 張軍,彭國華,秦洪元,曹文倫. 計(jì)算機(jī)工程與應(yīng)用. 2004(20)
碩士論文
[1]基于光度立體圖像的3D模型重建算法研究[D]. 張軍.西北工業(yè)大學(xué) 2004
本文編號(hào):3024694
【文章來源】:中國科學(xué)院大學(xué)(中國科學(xué)院深圳先進(jìn)技術(shù)研究院)廣東省
【文章頁數(shù)】:61 頁
【學(xué)位級(jí)別】:碩士
【文章目錄】:
摘要
abstract
第1章 緒論
1.1 研究背景和意義
1.2 國內(nèi)外研究現(xiàn)狀
1.3 本文的主要內(nèi)容及貢獻(xiàn)
第2章 深度學(xué)習(xí)基礎(chǔ)
2.1 深度學(xué)習(xí)簡介
2.2 卷積神經(jīng)網(wǎng)絡(luò)常用組件及操作
2.2.1 卷積層
2.2.2 全連接層
2.2.3 反卷積層
2.3 深度學(xué)習(xí)常用術(shù)語解釋
第3章 深度估計(jì)
3.1 深度估計(jì)簡介
3.2 基于深度學(xué)習(xí)的雙目孿生深度估計(jì)
3.3 基于全卷積網(wǎng)絡(luò)的深度圖超分辨率及細(xì)化
3.4 損失函數(shù)
3.5 實(shí)驗(yàn)及實(shí)驗(yàn)結(jié)果
3.5.1 數(shù)據(jù)集擴(kuò)充
3.5.2 實(shí)驗(yàn)
3.5.3 實(shí)驗(yàn)結(jié)果及評(píng)估
3.6 小節(jié)及展望
第4章 基于全卷積網(wǎng)絡(luò)的深度圖像修復(fù)研究
4.1 深度圖像修復(fù)研究現(xiàn)狀
4.2 基于全卷積網(wǎng)絡(luò)的深度圖像修復(fù)
4.3 實(shí)驗(yàn)與損失函數(shù)
4.4 實(shí)驗(yàn)結(jié)果
4.5 小節(jié)及展望
第5章 實(shí)例分割與多任務(wù)學(xué)習(xí)
5.1 基于深度圖像的工件實(shí)例分割
5.1.1 深度圖像背景差的分層二值化
5.1.2 工件確定位置和確定姿態(tài)
5.1.3 機(jī)器學(xué)習(xí)分類
5.1.4 機(jī)器學(xué)習(xí)分割
5.1.5 實(shí)驗(yàn)及實(shí)驗(yàn)結(jié)果
5.2 基于深度學(xué)習(xí)的通用實(shí)例分割經(jīng)典方法:Mask R-CNN簡介
5.2.1 ResNet-FPN架構(gòu)
5.2.2 Faster R-CNN網(wǎng)絡(luò)
5.2.3 Mask R-CNN網(wǎng)絡(luò)結(jié)構(gòu)
5.2.4 Mask R-CNN損失函數(shù)
5.3 深度估計(jì)與實(shí)例分割的多任務(wù)學(xué)習(xí)
5.3.1 同時(shí)深度估計(jì)與實(shí)例分割的多任務(wù)學(xué)習(xí)網(wǎng)絡(luò)結(jié)構(gòu)
5.3.2 實(shí)驗(yàn)與損失函數(shù)
5.4 小節(jié)
第6章 工作空間場景重建
6.1 國內(nèi)外相關(guān)方法
6.2 工作空間場景重建
6.2.1 基于雙目深度估計(jì)的工作空間場景重建
6.2.2 基于深度圖像修復(fù)的工作空間場景重建
6.2.3 基于多任務(wù)學(xué)習(xí)的工作空間場景重建
6.3 場景重建結(jié)果
第7章 結(jié)束語
7.1 本文工作總結(jié)
7.2 下一步研究方向
參考文獻(xiàn)
致謝
作者簡歷及攻讀學(xué)位期間發(fā)表的學(xué)術(shù)論文與研究成果
【參考文獻(xiàn)】:
期刊論文
[1]利用激光掃描和數(shù)碼相機(jī)進(jìn)行古建筑三維重建研究[J]. 鄧非,張祖勛,張劍清. 測繪科學(xué). 2007(02)
[2]一種基于多面體模型的從明暗恢復(fù)物體形狀方法[J]. 張軍,彭國華,秦洪元,曹文倫. 計(jì)算機(jī)工程與應(yīng)用. 2004(20)
碩士論文
[1]基于光度立體圖像的3D模型重建算法研究[D]. 張軍.西北工業(yè)大學(xué) 2004
本文編號(hào):3024694
本文鏈接:http://sikaile.net/kejilunwen/zidonghuakongzhilunwen/3024694.html
最近更新
教材專著