基于結構化深度學習的單目圖像深度估計
本文選題:深度估計 + 卷積神經(jīng)網(wǎng)絡 ; 參考:《機器人》2017年06期
【摘要】:為從單目圖像中提取到豐富的3D結構特征,并用以推測場景的深度信息,針對單目圖像深度估計任務提出了一種結構化深度學習模型,該模型將一種新的多尺度卷積神經(jīng)網(wǎng)絡與連續(xù)條件隨機場統(tǒng)一于一個深度學習框架中.卷積神經(jīng)網(wǎng)絡可以從圖像中學習到相關特征表達,而連續(xù)條件隨機場可以根據(jù)圖像像素的位置、顏色信息對卷積神經(jīng)網(wǎng)絡輸出進行優(yōu)化,將二者參數(shù)以聯(lián)合優(yōu)化的方式進行學習可以提升模型的泛化性能.通過在NYU Depth數(shù)據(jù)集上的實驗驗證了模型的有效性與優(yōu)越性,該模型預測結果的平均相對誤差為0.187,均方根誤差為0.074,對數(shù)空間平均誤差為0.671.
[Abstract]:In order to extract rich 3D structure features from monocular images and to speculate the depth information of the scene, a structured depth learning model is proposed for the monocular image depth estimation task. The model unifies a new multi-scale convolution neural network and a continuous conditional random field into a deep learning framework. The convolution neural network can learn the expression of related features from the image, while the continuous conditional random field can optimize the output of the convolutional neural network according to the pixel location and color information of the image. The generalization performance of the model can be improved by learning the two parameters in a joint optimization way. The validity and superiority of the model are verified by experiments on NYU depth dataset. The average relative error, root mean square error and logarithmic space average error of the model are 0.187, 0.074 and 0.671 respectively.
【作者單位】: 哈爾濱理工大學自動化學院;中國科學院自動化研究所;
【基金】:國家自然科學基金(61572500)
【分類號】:TP18;TP391.41
【相似文獻】
相關期刊論文 前10條
1 趙信宇;朱曉蕊;余錦全;;單幅圖像深度信息的提取[J];制造業(yè)自動化;2010年03期
2 李樂;張茂軍;熊志輝;徐瑋;;基于內(nèi)容理解的單幅靜態(tài)街景圖像深度估計[J];機器人;2011年02期
3 廖均梅;龍建忠;張小琴;;基于頻域特征的圖像深度信息提取方法[J];自動化與儀器儀表;2012年06期
4 張蓓蕾;劉洪瑋;;基于馬爾可夫隨機場的單目圖像深度估計[J];微型電腦應用;2010年11期
5 牛連丁;趙志杰;金雪松;孫華東;王海濤;;基于支持向量機的圖像深度提取方法[J];哈爾濱商業(yè)大學學報(自然科學版);2012年05期
6 王平;安平;王奎;張兆楊;;基于區(qū)域融合的單視點圖像深度信息提取[J];電視技術;2011年19期
7 袁紅星;吳少群;朱仁祥;胡勁松;安鵬;;利用深度傳感器大數(shù)據(jù)的單目圖像深度估計[J];計算機輔助設計與圖形學學報;2013年12期
8 張蓓蕾;孫韶媛;武江偉;谷小婧;;基于DRF-MAP模型的單目圖像深度估計的改進算法[J];紅外技術;2009年12期
9 鄧小玲;倪江群;代芬;李震;;基于LLOM的單目圖像深度圖估計算法[J];計算機應用研究;2012年11期
10 李國平;劉華冠;李長春;張?zhí)旌?;基于機器視覺的物料袋圖像深度信息的提取[J];濟南大學學報(自然科學版);2010年02期
相關會議論文 前2條
1 王東波;陳小荷;年洪東;;基于條件隨機場的有標記聯(lián)合結構自動識別[A];第四屆全國學生計算語言學研討會會議論文集[C];2008年
2 張奇;翁富良;黃萱菁;吳立德;;英文口語中非流利區(qū)域的檢測[A];內(nèi)容計算的研究與應用前沿——第九屆全國計算語言學學術會議論文集[C];2007年
相關碩士學位論文 前10條
1 Grigorev Aleksei;基于深度學習的單目圖像深度估計[D];哈爾濱工業(yè)大學;2016年
2 張蓓蕾;基于馬爾可夫場理論的單目圖像深度估計研究[D];東華大學;2010年
3 陳婷婷;基于紋理特征概率模型的圖像深度信息提取方法[D];哈爾濱商業(yè)大學;2015年
4 趙九洋;圖像中行人檢測關鍵技術研究[D];南京大學;2015年
5 寧振;基于層疊條件隨機場的情感分析[D];南昌大學;2015年
6 楊獻祥;面向中文微博的產(chǎn)品名實體識別與規(guī)范化算法設計與實現(xiàn)[D];北京理工大學;2015年
7 肖s,
本文編號:2110737
本文鏈接:http://sikaile.net/kejilunwen/ruanjiangongchenglunwen/2110737.html