基于增強自編碼器的室內(nèi)物體目標檢測與姿態(tài)估計
發(fā)布時間:2022-07-09 19:14
理解室內(nèi)場景下物體的類別、位置及姿態(tài)是機器人抓取、虛擬現(xiàn)實和增強現(xiàn)實中的人機交互任務的關(guān)鍵先決條件。目前很多算法都是基于場景并不復雜、物體之間遮擋很少甚至沒有遮擋、只能處理場景中的單個目標等,不過真實的姿態(tài)估計場景中,多為物體擺放雜亂無章、物體間存在被遮擋或自遮擋等復雜場景,所以復雜場景對于姿態(tài)估計算法的魯棒性和泛化性仍然是具有挑戰(zhàn)性的研究問題。本文圍繞此問題從以下幾個方面進行研究:1.對于室內(nèi)物體間存在許多遮擋問題,本文改進堆棧式去噪自編碼器,提出一種基于增強自編碼器的室內(nèi)遮擋目標圖像重建方法。算法首先對輸入的圖像增加隨機噪聲(如高斯噪聲、隨機Mask遮擋等);然后將增加過噪聲的圖像輸入給增強自編碼器,經(jīng)過編碼、解碼后,輸出一個與原始圖像相同維度的向量;最后將向量轉(zhuǎn)換成與原始輸入圖像尺寸相同的圖像,且此圖像是不含遮擋的圖像。從重建LINEMOD數(shù)據(jù)集的圖像前后效果對比,表明增強自編碼器在遮擋目標重建上是可行的方法,可以很容易與其他網(wǎng)絡融合。2.對于很多算法無法處理復雜場景下多目標檢測問題,首先改進原始LINEMOD單目標數(shù)據(jù)集為多目標數(shù)據(jù)集,然后使用本文改進后的Faster R-CN...
【文章頁數(shù)】:93 頁
【學位級別】:碩士
【部分圖文】:
計算機視覺的研究成果從圖1-1可以看出:圖(a)是通過單目相機獲取的駕駛員頭部圖像錯誤!未找到引用源
主要章節(jié)關(guān)系圖
ILSVRC歷年Top-5錯誤率,從ResNet開始已超過人類視覺的水平另外,深度學習更多是有監(jiān)督學習,依賴于大量的數(shù)據(jù),而對于圖像數(shù)據(jù)在
【參考文獻】:
期刊論文
[1]自編碼神經(jīng)網(wǎng)絡理論及應用綜述[J]. 袁非牛,章琳,史勁亭,夏雪,李鋼. 計算機學報. 2019(01)
[2]基于自編碼算法的深度學習綜述[J]. 崔廣新,李殿奎. 計算機系統(tǒng)應用. 2018(09)
[3]深度卷積神經(jīng)網(wǎng)絡在計算機視覺中的應用研究綜述[J]. 盧宏濤,張秦川. 數(shù)據(jù)采集與處理. 2016(01)
本文編號:3657665
【文章頁數(shù)】:93 頁
【學位級別】:碩士
【部分圖文】:
計算機視覺的研究成果從圖1-1可以看出:圖(a)是通過單目相機獲取的駕駛員頭部圖像錯誤!未找到引用源
主要章節(jié)關(guān)系圖
ILSVRC歷年Top-5錯誤率,從ResNet開始已超過人類視覺的水平另外,深度學習更多是有監(jiān)督學習,依賴于大量的數(shù)據(jù),而對于圖像數(shù)據(jù)在
【參考文獻】:
期刊論文
[1]自編碼神經(jīng)網(wǎng)絡理論及應用綜述[J]. 袁非牛,章琳,史勁亭,夏雪,李鋼. 計算機學報. 2019(01)
[2]基于自編碼算法的深度學習綜述[J]. 崔廣新,李殿奎. 計算機系統(tǒng)應用. 2018(09)
[3]深度卷積神經(jīng)網(wǎng)絡在計算機視覺中的應用研究綜述[J]. 盧宏濤,張秦川. 數(shù)據(jù)采集與處理. 2016(01)
本文編號:3657665
本文鏈接:http://sikaile.net/kejilunwen/shengwushengchang/3657665.html
最近更新
教材專著