基于深度學習的單目視覺三維點云重建技術研究
發(fā)布時間:2021-10-05 10:51
通過CAD等三維制作軟件在虛擬三維空間中構建三維數據模型是常用的三維建模方法。然而在面對數量巨大,復雜度很高的建模任務時,重構所花費的時間、人力成本是十分巨大的;陔p目、三目視覺的自動建模方法雖然較好的解決了復雜建模技術人力和時間成本花費巨大的問題,但這些方法對于設備的依賴性過高。本文研究并提出了一種基于深度學習的單目視覺三維點云重構技術,可以有效的降低人工建模的成本,同樣又避免了使用深度相機所需的設備成本及環(huán)境的局限性。本文首先提出了一種基于殘差網絡的三維點云重構網絡3D-ReConstnet。該網絡使用了殘差卷積神經網絡來提取圖片的特征,避免了深度神經網絡容易出現梯度爆炸或梯度消失的問題,同時避免了深度神經網絡難以訓練的問題。之后,本文使用Chamfer距離(Chamfer distance)和EM距離(Earth Mover’s distance)作為損失函數來優(yōu)化生成模型的效果,能夠正確評估點云分布,避免了評估不正確的問題。同時,兩種評估函數的雙約束也可能解決重建模型過于分散或過于集中的問題。在ShapeNet和Pix3D兩個CAD三維模型數據集上的實驗結果證明了提出的深度三...
【文章來源】:東北電力大學吉林省
【文章頁數】:53 頁
【學位級別】:碩士
【部分圖文】:
圖2-1卷積核的卷積過程??如圖2-1所示,卷積核上的祌經元僅與圖像的部分區(qū)域進行連接,每次都可以提取一??個局部區(qū)域內的特征信息
差。與一??般的CNN網絡模型直接學習輸入輸出的映射相比,殘差網絡要更加容易學習、收斂速度??也更快,并且因為殘差網絡可以有效的訓練更深層的神經網絡,該方案最終得到的結果也??會更加精確。??conv?I?=?I?趾u?I ̄H?conv?I?=?I?■?臟?I? ̄ ̄H?Ra-u??(a)??.〇〇N\-??atGh?ReLU????CON\J??at〇h?ReLU?——??CONV??atcU?—?(????ReLU??Norm?Norm?Notu?V?J??(b)??圖2-2兩種殘差塊結構??殘差網絡中包含了兩種結構的基本塊。如圖2-2(a)所示,當輸入數據的維度和經過殘??差塊進行計算后的輸出維度相同時,網絡使用映射塊(Identity?Block),即直接將自身的信息??傳遞給殘差塊的計算結果,并與該計算結果相加。如圖2-2(b)所示,當輸入維度和輸出維??度不一致時,兩者的通道數不同,不能直接進行計算,快捷連接上會使用卷積塊(c〇nvB1〇ck)??來保證輸出信息的通道數與殘差塊計算結果的通道數保持一致,之后再將兩者相加。??如圖2-3所示,以一個殘差塊為例,x表示輸入的數據,表示經過殘差塊學習后的??輸出,通過快捷連接網絡可以將原始輸入信息直接傳遞到后層。傳統的卷積神經網絡??(Convolutional?Neura】?Networks,?CNN)或全連接神經網絡(Fully?Convolutional?Networks,??FCN)在信息傳遞的過程中不可避免的會存在信息丟失的問題,殘差網絡通過直接將輸入數??據傳遞給網絡層輸出結果的方法可以保證信息傳遞的完整性。殘差網絡中一個殘差塊的最??終輸出的
?第2章三維點云重構相關技術介紹???.V??i???Weight?Layer??F(x)?-j?X??…丨??identity??!?mapping??weight?Layer??j??i??:+????r?fx)?+?x??士??圖2-3殘差塊結構??此外,在深層神經網絡中使用殘差網絡結構還可以有效緩解梯度爆炸和梯度消失的問??題。相比較于直接增加網絡層數的框架,殘差網絡(Residual?network,?ResNet)中有很多跨層??連接結構,這樣的結構在反向傳播的過程中有著很大的優(yōu)勢。反向傳播算法是神經網絡中??一項用于更新M絡參數的常用的技術。根據鏈式求導法則,網絡會按照負梯度方向對參數??進行調整更新梯度信息,其本質就是計算損失與其權重的偏導,當學習率為《時,每次下??降的梯度為:??dLoss??Aw?=?-a??(2-2)??dw??根據鏈式求導法則可知,當隱藏層非常多的時候,第i層的梯度更新如公式2-3所示,??其中,為第i個隱藏層的輸出結果。??A?dLoss?dLoss?dfn?df.,?df.??dfn?dfn_,?df,?dw,??從上述公式可以發(fā)現,當中間兩層的偏導數大于1時,隨著網絡層數的增多,最終的??求出的梯度更新將以指數形式增加,最終導致梯度爆炸。當該值小于1時,計算的梯度更??新信息將會以指數形式衰減,最終導致梯度消失。??而針對殘差網絡而言,當第L個殘差塊的輸出結果為&時,則第L+/個殘差塊和第??L+2個殘差塊的結果為:??xui=xl?+?f(xl^wl)?(2-4)??xi.+2?=?xui?+?F(xL+i^
【參考文獻】:
期刊論文
[1]基于稀疏激光點云數據和單幀圖像融合的三維重構算法[J]. 賀秉安,曾興,李子奇,萬生鵬. 計測技術. 2017(03)
[2]基于自適應權值濾波的深度圖像超分辨率重建[J]. 楊宇翔,曾毓,何志偉,高明煜. 中國圖象圖形學報. 2014(08)
[3]基于激光與可見光同步數據的室外場景三維重建[J]. 張愛武,胡少興,孫衛(wèi)東,李風亭. 電子學報. 2005(05)
碩士論文
[1]腦血管點云三維重建及其血流動力學分析[D]. 劉志強.哈爾濱工業(yè)大學 2018
[2]深度圖像超分辨率重建算法研究[D]. 涂義福.合肥工業(yè)大學 2016
[3]基于TOF深度圖的超分辨率重建算法[D]. 董文菁.合肥工業(yè)大學 2015
本文編號:3419586
【文章來源】:東北電力大學吉林省
【文章頁數】:53 頁
【學位級別】:碩士
【部分圖文】:
圖2-1卷積核的卷積過程??如圖2-1所示,卷積核上的祌經元僅與圖像的部分區(qū)域進行連接,每次都可以提取一??個局部區(qū)域內的特征信息
差。與一??般的CNN網絡模型直接學習輸入輸出的映射相比,殘差網絡要更加容易學習、收斂速度??也更快,并且因為殘差網絡可以有效的訓練更深層的神經網絡,該方案最終得到的結果也??會更加精確。??conv?I?=?I?趾u?I ̄H?conv?I?=?I?■?臟?I? ̄ ̄H?Ra-u??(a)??.〇〇N\-??atGh?ReLU????CON\J??at〇h?ReLU?——??CONV??atcU?—?(????ReLU??Norm?Norm?Notu?V?J??(b)??圖2-2兩種殘差塊結構??殘差網絡中包含了兩種結構的基本塊。如圖2-2(a)所示,當輸入數據的維度和經過殘??差塊進行計算后的輸出維度相同時,網絡使用映射塊(Identity?Block),即直接將自身的信息??傳遞給殘差塊的計算結果,并與該計算結果相加。如圖2-2(b)所示,當輸入維度和輸出維??度不一致時,兩者的通道數不同,不能直接進行計算,快捷連接上會使用卷積塊(c〇nvB1〇ck)??來保證輸出信息的通道數與殘差塊計算結果的通道數保持一致,之后再將兩者相加。??如圖2-3所示,以一個殘差塊為例,x表示輸入的數據,表示經過殘差塊學習后的??輸出,通過快捷連接網絡可以將原始輸入信息直接傳遞到后層。傳統的卷積神經網絡??(Convolutional?Neura】?Networks,?CNN)或全連接神經網絡(Fully?Convolutional?Networks,??FCN)在信息傳遞的過程中不可避免的會存在信息丟失的問題,殘差網絡通過直接將輸入數??據傳遞給網絡層輸出結果的方法可以保證信息傳遞的完整性。殘差網絡中一個殘差塊的最??終輸出的
?第2章三維點云重構相關技術介紹???.V??i???Weight?Layer??F(x)?-j?X??…丨??identity??!?mapping??weight?Layer??j??i??:+????r?fx)?+?x??士??圖2-3殘差塊結構??此外,在深層神經網絡中使用殘差網絡結構還可以有效緩解梯度爆炸和梯度消失的問??題。相比較于直接增加網絡層數的框架,殘差網絡(Residual?network,?ResNet)中有很多跨層??連接結構,這樣的結構在反向傳播的過程中有著很大的優(yōu)勢。反向傳播算法是神經網絡中??一項用于更新M絡參數的常用的技術。根據鏈式求導法則,網絡會按照負梯度方向對參數??進行調整更新梯度信息,其本質就是計算損失與其權重的偏導,當學習率為《時,每次下??降的梯度為:??dLoss??Aw?=?-a??(2-2)??dw??根據鏈式求導法則可知,當隱藏層非常多的時候,第i層的梯度更新如公式2-3所示,??其中,為第i個隱藏層的輸出結果。??A?dLoss?dLoss?dfn?df.,?df.??dfn?dfn_,?df,?dw,??從上述公式可以發(fā)現,當中間兩層的偏導數大于1時,隨著網絡層數的增多,最終的??求出的梯度更新將以指數形式增加,最終導致梯度爆炸。當該值小于1時,計算的梯度更??新信息將會以指數形式衰減,最終導致梯度消失。??而針對殘差網絡而言,當第L個殘差塊的輸出結果為&時,則第L+/個殘差塊和第??L+2個殘差塊的結果為:??xui=xl?+?f(xl^wl)?(2-4)??xi.+2?=?xui?+?F(xL+i^
【參考文獻】:
期刊論文
[1]基于稀疏激光點云數據和單幀圖像融合的三維重構算法[J]. 賀秉安,曾興,李子奇,萬生鵬. 計測技術. 2017(03)
[2]基于自適應權值濾波的深度圖像超分辨率重建[J]. 楊宇翔,曾毓,何志偉,高明煜. 中國圖象圖形學報. 2014(08)
[3]基于激光與可見光同步數據的室外場景三維重建[J]. 張愛武,胡少興,孫衛(wèi)東,李風亭. 電子學報. 2005(05)
碩士論文
[1]腦血管點云三維重建及其血流動力學分析[D]. 劉志強.哈爾濱工業(yè)大學 2018
[2]深度圖像超分辨率重建算法研究[D]. 涂義福.合肥工業(yè)大學 2016
[3]基于TOF深度圖的超分辨率重建算法[D]. 董文菁.合肥工業(yè)大學 2015
本文編號:3419586
本文鏈接:http://sikaile.net/shoufeilunwen/xixikjs/3419586.html