基于深度卷積神經(jīng)網(wǎng)絡的三維運動目標重構關鍵技術研究
發(fā)布時間:2022-10-10 10:49
與其他人類感知相比,視覺是最可靠的信息來源,而人類通過視覺接收的信息占人類獲取信息總和的四分之三以上,所以視覺信息對于人類十分關鍵。圖像去模糊與三維重建具有廣泛的應用領域,近年來已經(jīng)成為國內外圖像界與三維界研究的熱點問題之一。針對于圖像去模糊問題,本文建立了一種去噪先驗驅動的圖像去模糊深度網(wǎng)絡,以結合利用基于優(yōu)化和基于判別學習圖像去模糊方法的各自優(yōu)點。首先,建立了一種基于去噪的圖像去模糊方法,其迭代過程可以高效進行,然后將迭代過程展開到前饋神經(jīng)網(wǎng)絡中,該神經(jīng)網(wǎng)絡的網(wǎng)絡層模擬了本文建立的基于去噪的圖像去模糊算法的流程。此外,建立了一種可以利用多尺度冗余的高效CNN降噪器,并將其插入到深度網(wǎng)絡中,通過端到端訓練,可以聯(lián)合優(yōu)化CNN降噪器和其他網(wǎng)絡參數(shù)。實驗結果表明,所建立的方法在圖像去模糊的性能表現(xiàn)上非常有競爭力。針對三維重建問題,受長期短期記憶網(wǎng)絡的成功以及使用卷積神經(jīng)網(wǎng)絡的單視圖三維重建最新進展的啟發(fā),本文建立了一種基于形狀先驗的架構,稱之為三維遞歸重建神經(jīng)網(wǎng)絡;谛螤钕闰灥姆椒ǹ梢允褂酶俚膱D像,并且對物體反射函數(shù)具有更少的假設。該架構以標準的LSTM和GRU為基礎,并由三個部分組...
【文章頁數(shù)】:68 頁
【學位級別】:碩士
【文章目錄】:
摘要
Abstract
第1章 緒論
1.1 課題研究背景及意義
1.2 圖像復原研究現(xiàn)狀及分析
1.2.1 基于模型的圖像復原方法
1.2.2 基于學習的圖像復原方法
1.2.3 基于去噪的圖像去模糊方法
1.3 三維重建研究現(xiàn)狀及分析
1.4 本文的研究內容及章節(jié)安排
第2章 相關理論與技術
2.1 圖像模糊過程
2.2 圖像序列產生過程
2.2.1 針孔相機模型
2.2.2 圖像投影
2.2.3 反投影
2.2.4 空間平面與單應變換
2.3 卷積神經(jīng)網(wǎng)絡
2.3.1 卷積層
2.3.2 池化層
2.3.3 全連接層
2.3.4 訓練神經(jīng)網(wǎng)絡
2.4 本章小結
第3章 基于CNN降噪器先驗的圖像去模糊
3.1 基于去噪的圖像去模糊算法
3.1.1 算法設計
3.1.2 算法收斂性分析
3.2 CNN設計和訓練的關鍵技術
3.2.1 ReLU
3.2.2 膨脹卷積擴大感受野
3.2.3 加速訓練過程的設計方法
3.3 降噪器先驗驅動的去模糊深度神經(jīng)網(wǎng)絡
3.3.1 去模糊算法的深度網(wǎng)絡結構
3.3.2 CNN降噪器的網(wǎng)絡結構設計
3.4 實驗結果與分析
3.4.1 網(wǎng)絡訓練與參數(shù)設置
3.4.2 基于CNN降噪器先驗的去模糊實驗
3.5 本章小結
第4章 基于深度CNN的三維體素重建
4.1 遞歸神經(jīng)網(wǎng)絡
4.1.1 長短期記憶單元
4.1.2 門遞歸單元
4.2 三維遞歸重建神經(jīng)網(wǎng)絡架構
4.2.1 編碼器:二維卷積神經(jīng)網(wǎng)絡
4.2.2 遞歸:三維卷積長短期記憶網(wǎng)絡
4.2.3 解碼器:三維反卷積神經(jīng)網(wǎng)絡
4.3 實驗結果與分析
4.3.1 設置
4.3.2 網(wǎng)絡結構對比
4.3.3 單視圖與多視圖重建評估
4.4 本章小結
第5章 總結
參考文獻
攻讀碩士學位期間發(fā)表的論文
致謝
本文編號:3689484
【文章頁數(shù)】:68 頁
【學位級別】:碩士
【文章目錄】:
摘要
Abstract
第1章 緒論
1.1 課題研究背景及意義
1.2 圖像復原研究現(xiàn)狀及分析
1.2.1 基于模型的圖像復原方法
1.2.2 基于學習的圖像復原方法
1.2.3 基于去噪的圖像去模糊方法
1.3 三維重建研究現(xiàn)狀及分析
1.4 本文的研究內容及章節(jié)安排
第2章 相關理論與技術
2.1 圖像模糊過程
2.2 圖像序列產生過程
2.2.1 針孔相機模型
2.2.2 圖像投影
2.2.3 反投影
2.2.4 空間平面與單應變換
2.3 卷積神經(jīng)網(wǎng)絡
2.3.1 卷積層
2.3.2 池化層
2.3.3 全連接層
2.3.4 訓練神經(jīng)網(wǎng)絡
2.4 本章小結
第3章 基于CNN降噪器先驗的圖像去模糊
3.1 基于去噪的圖像去模糊算法
3.1.1 算法設計
3.1.2 算法收斂性分析
3.2 CNN設計和訓練的關鍵技術
3.2.1 ReLU
3.2.2 膨脹卷積擴大感受野
3.2.3 加速訓練過程的設計方法
3.3 降噪器先驗驅動的去模糊深度神經(jīng)網(wǎng)絡
3.3.1 去模糊算法的深度網(wǎng)絡結構
3.3.2 CNN降噪器的網(wǎng)絡結構設計
3.4 實驗結果與分析
3.4.1 網(wǎng)絡訓練與參數(shù)設置
3.4.2 基于CNN降噪器先驗的去模糊實驗
3.5 本章小結
第4章 基于深度CNN的三維體素重建
4.1 遞歸神經(jīng)網(wǎng)絡
4.1.1 長短期記憶單元
4.1.2 門遞歸單元
4.2 三維遞歸重建神經(jīng)網(wǎng)絡架構
4.2.1 編碼器:二維卷積神經(jīng)網(wǎng)絡
4.2.2 遞歸:三維卷積長短期記憶網(wǎng)絡
4.2.3 解碼器:三維反卷積神經(jīng)網(wǎng)絡
4.3 實驗結果與分析
4.3.1 設置
4.3.2 網(wǎng)絡結構對比
4.3.3 單視圖與多視圖重建評估
4.4 本章小結
第5章 總結
參考文獻
攻讀碩士學位期間發(fā)表的論文
致謝
本文編號:3689484
本文鏈接:http://sikaile.net/kejilunwen/shengwushengchang/3689484.html
最近更新
教材專著