基于卷積神經(jīng)網(wǎng)絡(luò)和雙目視差的無(wú)監(jiān)督深度預(yù)測(cè)
發(fā)布時(shí)間:2022-01-25 23:19
深度預(yù)測(cè)作為計(jì)算機(jī)視覺(jué)領(lǐng)域的重要方向之一,使計(jì)算機(jī)可以通過(guò)二維圖像估計(jì)出場(chǎng)景的深度信息。同時(shí),卷積神經(jīng)網(wǎng)絡(luò)憑借其強(qiáng)大的圖像特征提取和函數(shù)擬合能力,在場(chǎng)景的深度預(yù)測(cè)方向應(yīng)用后取得了良好的效果。但是,許多基于卷積神經(jīng)網(wǎng)絡(luò)的深度預(yù)測(cè)方法需要大量的真實(shí)深度信息作為訓(xùn)練數(shù)據(jù),而真實(shí)深度信息的獲取受設(shè)備和環(huán)境的影響,需要投入大量的人力物力。針對(duì)上述問(wèn)題,本文提出了基于卷積神經(jīng)網(wǎng)絡(luò)和雙目視差的無(wú)監(jiān)督深度預(yù)測(cè)方法。本文具體工作如下:第一,針對(duì)目前深度預(yù)測(cè)方法需要大量真實(shí)深度數(shù)據(jù)進(jìn)行訓(xùn)練的問(wèn)題,本文提出的無(wú)監(jiān)督深度預(yù)測(cè)方法,利用卷積神經(jīng)網(wǎng)絡(luò)擬合一個(gè)非線性函數(shù)估計(jì)場(chǎng)景深度信息,再結(jié)合左右圖像之間存在的視差,實(shí)現(xiàn)無(wú)監(jiān)督的預(yù)測(cè)場(chǎng)景深度信息。由于左右圖像之間的視差不僅與深度信息之間存在非線性關(guān)系,還與左右相機(jī)之間位置的變換存在緊密的聯(lián)系,因此本文方法還可以進(jìn)一步的估計(jì)左右相機(jī)之間的相對(duì)運(yùn)動(dòng)。本文提出的無(wú)監(jiān)督深度預(yù)測(cè)方法,在不需要任何真實(shí)深度信息的情況下,只以左右圖像作為輸入,就可以通過(guò)端到端的訓(xùn)練,估計(jì)出場(chǎng)景的深度信息和左右相機(jī)之間的旋轉(zhuǎn)平移關(guān)系。第二,對(duì)于本文深度預(yù)測(cè)方法所使用的神經(jīng)網(wǎng)絡(luò),為了提高該神經(jīng)網(wǎng)絡(luò)預(yù)...
【文章來(lái)源】:北京工業(yè)大學(xué)北京市 211工程院校
【文章頁(yè)數(shù)】:57 頁(yè)
【學(xué)位級(jí)別】:碩士
【文章目錄】:
摘要
Abstract
第1章 緒論
1.1 研究背景與意義
1.2 國(guó)內(nèi)外研究現(xiàn)狀
1.2.1 傳統(tǒng)深度預(yù)測(cè)方法
1.2.2 基于機(jī)器學(xué)習(xí)的深度預(yù)測(cè)方法
1.3 本文的主要研究?jī)?nèi)容
1.4 本文的組織結(jié)構(gòu)
1.5 本章小結(jié)
第2章 相關(guān)技術(shù)介紹
2.1 相機(jī)模型及其坐標(biāo)變換
2.1.1 像素坐標(biāo)系與像平面坐標(biāo)系之間的轉(zhuǎn)換
2.1.2 像平面坐標(biāo)系與相機(jī)坐標(biāo)系之間的轉(zhuǎn)換
2.1.3 相機(jī)坐標(biāo)系與世界坐標(biāo)系之間的轉(zhuǎn)換
2.1.4 世界坐標(biāo)系與像素坐標(biāo)系之間的轉(zhuǎn)換
2.2 旋轉(zhuǎn)矩陣與四元數(shù)
2.2.1 旋轉(zhuǎn)矩陣性質(zhì)
2.2.2 四元數(shù)與旋轉(zhuǎn)矩陣
2.3 卷積神經(jīng)網(wǎng)絡(luò)
2.3.1 卷積
2.3.2 反卷積
2.3.3 激活函數(shù)
2.3.4 批規(guī)范化
2.3.5 池化
2.4 KITTI數(shù)據(jù)集
2.4.1 數(shù)據(jù)集采集方式
2.4.2 數(shù)據(jù)集內(nèi)容
2.5 本章小結(jié)
第3章 基于雙目視差的無(wú)監(jiān)督深度預(yù)測(cè)方法
3.1 本文方法概述
3.2 投影位置的計(jì)算
3.2.1 左圖像像素坐標(biāo)系變換到左相機(jī)坐標(biāo)系
3.2.2 左相機(jī)坐標(biāo)系變換到右相機(jī)坐標(biāo)系
3.2.3 右相機(jī)坐標(biāo)系變換到右圖像像素坐標(biāo)系
3.3 生成形變的右圖像
3.4 損失函數(shù)的構(gòu)建
3.5 誤差的反向傳播
3.5.1 損失函數(shù)梯度的計(jì)算
3.5.2 四元數(shù)梯度的計(jì)算
3.5.3 平移分量梯度的計(jì)算
3.5.4 深度值梯度的計(jì)算
3.6 本章小結(jié)
第4章 無(wú)監(jiān)督深度預(yù)測(cè)網(wǎng)絡(luò)
4.1 網(wǎng)絡(luò)層參數(shù)
4.2 特殊的網(wǎng)絡(luò)結(jié)構(gòu)
4.2.1 特征圖的通道合并
4.2.2 全卷積網(wǎng)絡(luò)
4.2.3 跳躍結(jié)構(gòu)
4.3 反卷積層的構(gòu)建
4.4 本章小節(jié)
第5章 實(shí)驗(yàn)結(jié)果及分析
5.1 實(shí)驗(yàn)環(huán)境
5.2 實(shí)驗(yàn)數(shù)據(jù)處理
5.3 參數(shù)設(shè)置
5.3.1 網(wǎng)絡(luò)訓(xùn)練參數(shù)設(shè)置
5.3.2 自定義層參數(shù)設(shè)置
5.4 實(shí)驗(yàn)結(jié)果對(duì)比
5.5 實(shí)驗(yàn)結(jié)果分析
5.6 本章小結(jié)
結(jié)論
參考文獻(xiàn)
攻讀碩士學(xué)位期間所發(fā)表的學(xué)術(shù)論文
致謝
【參考文獻(xiàn)】:
期刊論文
[1]圖像分割方法綜述研究[J]. 周莉莉,姜楓. 計(jì)算機(jī)應(yīng)用研究. 2017(07)
碩士論文
[1]基于深度學(xué)習(xí)的單目圖像深度估計(jì)[D]. 李耀宇.哈爾濱理工大學(xué) 2017
本文編號(hào):3609367
【文章來(lái)源】:北京工業(yè)大學(xué)北京市 211工程院校
【文章頁(yè)數(shù)】:57 頁(yè)
【學(xué)位級(jí)別】:碩士
【文章目錄】:
摘要
Abstract
第1章 緒論
1.1 研究背景與意義
1.2 國(guó)內(nèi)外研究現(xiàn)狀
1.2.1 傳統(tǒng)深度預(yù)測(cè)方法
1.2.2 基于機(jī)器學(xué)習(xí)的深度預(yù)測(cè)方法
1.3 本文的主要研究?jī)?nèi)容
1.4 本文的組織結(jié)構(gòu)
1.5 本章小結(jié)
第2章 相關(guān)技術(shù)介紹
2.1 相機(jī)模型及其坐標(biāo)變換
2.1.1 像素坐標(biāo)系與像平面坐標(biāo)系之間的轉(zhuǎn)換
2.1.2 像平面坐標(biāo)系與相機(jī)坐標(biāo)系之間的轉(zhuǎn)換
2.1.3 相機(jī)坐標(biāo)系與世界坐標(biāo)系之間的轉(zhuǎn)換
2.1.4 世界坐標(biāo)系與像素坐標(biāo)系之間的轉(zhuǎn)換
2.2 旋轉(zhuǎn)矩陣與四元數(shù)
2.2.1 旋轉(zhuǎn)矩陣性質(zhì)
2.2.2 四元數(shù)與旋轉(zhuǎn)矩陣
2.3 卷積神經(jīng)網(wǎng)絡(luò)
2.3.1 卷積
2.3.2 反卷積
2.3.3 激活函數(shù)
2.3.4 批規(guī)范化
2.3.5 池化
2.4 KITTI數(shù)據(jù)集
2.4.1 數(shù)據(jù)集采集方式
2.4.2 數(shù)據(jù)集內(nèi)容
2.5 本章小結(jié)
第3章 基于雙目視差的無(wú)監(jiān)督深度預(yù)測(cè)方法
3.1 本文方法概述
3.2 投影位置的計(jì)算
3.2.1 左圖像像素坐標(biāo)系變換到左相機(jī)坐標(biāo)系
3.2.2 左相機(jī)坐標(biāo)系變換到右相機(jī)坐標(biāo)系
3.2.3 右相機(jī)坐標(biāo)系變換到右圖像像素坐標(biāo)系
3.3 生成形變的右圖像
3.4 損失函數(shù)的構(gòu)建
3.5 誤差的反向傳播
3.5.1 損失函數(shù)梯度的計(jì)算
3.5.2 四元數(shù)梯度的計(jì)算
3.5.3 平移分量梯度的計(jì)算
3.5.4 深度值梯度的計(jì)算
3.6 本章小結(jié)
第4章 無(wú)監(jiān)督深度預(yù)測(cè)網(wǎng)絡(luò)
4.1 網(wǎng)絡(luò)層參數(shù)
4.2 特殊的網(wǎng)絡(luò)結(jié)構(gòu)
4.2.1 特征圖的通道合并
4.2.2 全卷積網(wǎng)絡(luò)
4.2.3 跳躍結(jié)構(gòu)
4.3 反卷積層的構(gòu)建
4.4 本章小節(jié)
第5章 實(shí)驗(yàn)結(jié)果及分析
5.1 實(shí)驗(yàn)環(huán)境
5.2 實(shí)驗(yàn)數(shù)據(jù)處理
5.3 參數(shù)設(shè)置
5.3.1 網(wǎng)絡(luò)訓(xùn)練參數(shù)設(shè)置
5.3.2 自定義層參數(shù)設(shè)置
5.4 實(shí)驗(yàn)結(jié)果對(duì)比
5.5 實(shí)驗(yàn)結(jié)果分析
5.6 本章小結(jié)
結(jié)論
參考文獻(xiàn)
攻讀碩士學(xué)位期間所發(fā)表的學(xué)術(shù)論文
致謝
【參考文獻(xiàn)】:
期刊論文
[1]圖像分割方法綜述研究[J]. 周莉莉,姜楓. 計(jì)算機(jī)應(yīng)用研究. 2017(07)
碩士論文
[1]基于深度學(xué)習(xí)的單目圖像深度估計(jì)[D]. 李耀宇.哈爾濱理工大學(xué) 2017
本文編號(hào):3609367
本文鏈接:http://sikaile.net/kejilunwen/zidonghuakongzhilunwen/3609367.html
最近更新
教材專著