在計(jì)算機(jī)視覺領(lǐng)域中,深度估計(jì)與三維重建是重要的研究方向,其關(guān)鍵是從圖像中恢復(fù)出目標(biāo)到攝像機(jī)的距離。本文主要研究灰度圖像中目標(biāo)距離的恢復(fù)問題,并從可見光灰度圖像與紅外灰度圖像兩個(gè)方面展開研究。首先,對(duì)于可見光圖像,利用有監(jiān)督學(xué)習(xí)的方法進(jìn)行單目圖像深度估計(jì)。引入一種新穎的上采樣層,實(shí)現(xiàn)了該上采樣層的插入操作細(xì)節(jié)。本文采取全卷積神經(jīng)網(wǎng)絡(luò)的架構(gòu)構(gòu)造模型,其包含編碼器網(wǎng)絡(luò)與解碼器網(wǎng)絡(luò)兩部分:使用殘差神經(jīng)網(wǎng)絡(luò)作為編碼器網(wǎng)絡(luò)提取圖像的特征,再使用上采樣層構(gòu)造解碼器網(wǎng)絡(luò)逐步將該特征的尺寸增大,從而輸出預(yù)測(cè)的深度圖。在此基礎(chǔ)上,本文提出U型全卷積殘差網(wǎng)絡(luò)和全卷積擴(kuò)張殘差網(wǎng)絡(luò)兩種模型,并將模型用于在灰度單通道圖像上恢復(fù)目標(biāo)的距離信息。本文的U型全卷積殘差網(wǎng)絡(luò)使用跳躍連接將模型中靠近輸入端的特征與靠近輸出端的特征進(jìn)行級(jí)聯(lián),這種跳躍式的連接既能融合上下文特征、保留更多的邊緣信息,又加強(qiáng)了信息的傳遞、加快網(wǎng)絡(luò)收斂;而全卷積擴(kuò)張殘差網(wǎng)絡(luò)則引入擴(kuò)張殘差網(wǎng)絡(luò)作為編碼器網(wǎng)絡(luò)來提取圖像特征,在不增加權(quán)重參數(shù)個(gè)數(shù)而且不損失特征尺寸的情況下,依然保持后續(xù)網(wǎng)絡(luò)層中神經(jīng)元的感受野大小,從而提取包含更多空間信息的特征傳遞給后續(xù)的上...
【文章頁數(shù)】:91 頁
【學(xué)位級(jí)別】:碩士
【部分圖文】:

圖2.1輸入通道數(shù)為1的卷積操作圖
積核個(gè)數(shù)為1、步幅為1的卷積過程,高亮部分表示計(jì)算第一個(gè)輸出所使用的輸入與卷積核對(duì)應(yīng)的部分。圖2.1輸入通道數(shù)為1的卷積操作圖對(duì)于多通道的輸入,假設(shè)卷積核高為kh、寬為kw。當(dāng)輸入通道數(shù)大于1時(shí),將會(huì)為每個(gè)輸入通道分配一個(gè)單獨(dú)的kh×kw卷積核。然后在每個(gè)通....

圖2.2輸入通道數(shù)為2的卷積操作圖
卷積核做卷積,然后按通道維度逐元素相加得到最終結(jié)果。圖2.2展示了輸入通道數(shù)是2,卷積核尺寸為2×2、卷積核個(gè)數(shù)為1、步幅為1的一個(gè)例子。圖2.2輸入通道數(shù)為2的卷積操作圖輸出張量各個(gè)維度的大小由如下公式計(jì)算:1inupdownhoutHppfHs....

圖2.3最大化池化層和平均池化層示意圖
10了核尺寸為2×2、步幅為2的池化層:圖2.3最大化池化層和平均池化層示意圖輸出張量各個(gè)維度的大小由如下公式計(jì)算:1inoutHfHs=+(2-7)1inoutWfWs=+(2-8)其中,f為池化層的大小,s為步幅(一....

圖2.4Sigmoid函數(shù)曲線圖
圖2.4Sigmoid函數(shù)曲線圖于輸入x的導(dǎo)數(shù)為:1f()1xxe=+22df()1111()(1)(1)1(1xxxxxxeedxeee+===++++11(1)()....
本文編號(hào):
3968387
本文鏈接:http://sikaile.net/kejilunwen/shengwushengchang/3968387.html