基于深度學(xué)習(xí)的單目圖像三維人體姿態(tài)估計(jì)算法研究
發(fā)布時間:2022-11-11 17:15
單目圖像的三維人體姿態(tài)估計(jì)是計(jì)算機(jī)視覺中一項(xiàng)基本但富有挑戰(zhàn)的任務(wù),其目的是檢測單目圖像中的人體姿態(tài)并將其投影到三維空間中。隨著科學(xué)技術(shù)的快速發(fā)展,三維視覺已成為人工智能研究和應(yīng)用的熱門領(lǐng)域,越來越多的專家學(xué)者投入到該領(lǐng)域的探索中。三維人體姿態(tài)估計(jì)精度一方面受圖像外部遮擋、自遮擋和光線等因素影響,另一方面人體結(jié)構(gòu)的特殊性也會給該問題的解決帶來諸多困難。并且,如何將二維空間提升到三維空間本身是一個復(fù)雜的病態(tài)問題,深度數(shù)據(jù)缺失會導(dǎo)致一個二維坐標(biāo)與多個三維坐標(biāo)問題對應(yīng)。目前已有的算法通常會對三維人體姿態(tài)進(jìn)行整體回歸,無法有效估計(jì)部分難度較高的關(guān)節(jié)點(diǎn)。針對三維人體姿態(tài)估計(jì)的難題,本文研究的重點(diǎn)是,在深度學(xué)習(xí)框架下利用人體拓?fù)浣Y(jié)構(gòu)信息來提高三維人體姿態(tài)估計(jì)效果,主要工作如下:(1)為了利用網(wǎng)絡(luò)深層特征中包含的人體結(jié)構(gòu)信息,本文提出了一個人體結(jié)構(gòu)感知網(wǎng)絡(luò)模型來進(jìn)行三維人體姿態(tài)估計(jì),通過由粗到精級聯(lián)加深全連接網(wǎng)絡(luò)深度的方式,擴(kuò)大模型參數(shù)空間從而提高網(wǎng)絡(luò)的非線性擬合能力。本文先利用“沙漏網(wǎng)絡(luò)”檢測、提取單目圖像中人體的二維關(guān)節(jié)點(diǎn)坐標(biāo),其次通過“基本網(wǎng)絡(luò)”將二維關(guān)節(jié)點(diǎn)坐標(biāo)提升到三維空間中,再根據(jù)人體拓?fù)浣Y(jié)...
【文章頁數(shù)】:74 頁
【學(xué)位級別】:碩士
【文章目錄】:
摘要
Abstract
第1章 緒論
1.1 研究背景及意義
1.2 研究難點(diǎn)
1.3 國內(nèi)外研究現(xiàn)狀
1.3.1 兩級單目圖像三維人體姿態(tài)估計(jì)
1.3.2 端到端三維人體姿態(tài)估計(jì)
1.4 研究內(nèi)容與章節(jié)安排
第2章 相關(guān)工作介紹
2.1 人體姿態(tài)的定義
2.2 基于堆疊沙漏網(wǎng)絡(luò)的二維人體姿態(tài)估計(jì)
2.2.1 二維姿態(tài)的熱力圖表示
2.2.2 堆疊沙漏網(wǎng)絡(luò)模型
2.3 投影模型及坐標(biāo)系轉(zhuǎn)換
2.3.1 弱透視投影
2.3.2 坐標(biāo)系轉(zhuǎn)換
2.4 二維人體姿態(tài)到三維人體姿態(tài)估計(jì)算法
2.4.1 基于相機(jī)參數(shù)優(yōu)化的三維人體姿態(tài)估計(jì)算法
2.4.2 基于深度學(xué)習(xí)的三維人體姿態(tài)估計(jì)
2.5 相關(guān)的公開數(shù)據(jù)集
2.5.1 二維人體姿態(tài)數(shù)據(jù)集
2.5.2 三維人體姿態(tài)數(shù)據(jù)集
2.6 本章小結(jié)
第3章 基于人體結(jié)構(gòu)感知網(wǎng)絡(luò)的三維人體姿態(tài)估計(jì)
3.1 二維人體姿態(tài)估計(jì)
3.2 人體結(jié)構(gòu)感知網(wǎng)絡(luò)模型
3.2.1 二維姿態(tài)和三維姿態(tài)數(shù)據(jù)預(yù)處理
3.2.2 基本子網(wǎng)絡(luò)
3.2.3 單通道優(yōu)化子網(wǎng)絡(luò)
3.2.4 雙通道優(yōu)化子網(wǎng)絡(luò)
3.3 實(shí)驗(yàn)與分析
3.3.1 評價(jià)指標(biāo)及實(shí)驗(yàn)設(shè)置
3.3.2 可視化定性分析
3.3.3 定量分析
3.4 本章小結(jié)
第4章 基于層次上下文相關(guān)優(yōu)化網(wǎng)絡(luò)的三維人體姿態(tài)估計(jì)
4.1 人體骨架模型的分層結(jié)構(gòu)
4.2 基于隨機(jī)增強(qiáng)模塊的基本子網(wǎng)絡(luò)
4.3 基于人體分層結(jié)構(gòu)的層次上下文相關(guān)優(yōu)化子網(wǎng)絡(luò)
4.4 注意力模塊
4.5 實(shí)驗(yàn)與分析
4.5.1 評價(jià)指標(biāo)與實(shí)驗(yàn)設(shè)置
4.5.2 Human3.6M上的定量評估
4.5.3 消融實(shí)驗(yàn)
4.5.4 Human Eva上的定量評估
4.5.5 可視化結(jié)果
4.6 本章小結(jié)
第5章 總結(jié)與展望
5.1 工作總結(jié)
5.2 工作展望
參考文獻(xiàn)
指導(dǎo)教師對研究生學(xué)位論文的學(xué)術(shù)評語
學(xué)位論文答辯委員會決議書
致謝
攻讀碩士學(xué)位期間的研究成果
【參考文獻(xiàn)】:
期刊論文
[1]舉重運(yùn)動的人體三維模型重建及仿真[J]. 劉國翌,陳睿,鄧宇,李華. 系統(tǒng)仿真學(xué)報(bào). 2006(02)
[2]基于視頻的三維人體運(yùn)動跟蹤[J]. 劉國翌,陳睿,鄧宇,李華. 計(jì)算機(jī)輔助設(shè)計(jì)與圖形學(xué)學(xué)報(bào). 2006(01)
博士論文
[1]基于單目視頻無標(biāo)記點(diǎn)的三維人體姿態(tài)估計(jì)的研究[D]. 劉晨光.哈爾濱工業(yè)大學(xué) 2011
本文編號:3705427
【文章頁數(shù)】:74 頁
【學(xué)位級別】:碩士
【文章目錄】:
摘要
Abstract
第1章 緒論
1.1 研究背景及意義
1.2 研究難點(diǎn)
1.3 國內(nèi)外研究現(xiàn)狀
1.3.1 兩級單目圖像三維人體姿態(tài)估計(jì)
1.3.2 端到端三維人體姿態(tài)估計(jì)
1.4 研究內(nèi)容與章節(jié)安排
第2章 相關(guān)工作介紹
2.1 人體姿態(tài)的定義
2.2 基于堆疊沙漏網(wǎng)絡(luò)的二維人體姿態(tài)估計(jì)
2.2.1 二維姿態(tài)的熱力圖表示
2.2.2 堆疊沙漏網(wǎng)絡(luò)模型
2.3 投影模型及坐標(biāo)系轉(zhuǎn)換
2.3.1 弱透視投影
2.3.2 坐標(biāo)系轉(zhuǎn)換
2.4 二維人體姿態(tài)到三維人體姿態(tài)估計(jì)算法
2.4.1 基于相機(jī)參數(shù)優(yōu)化的三維人體姿態(tài)估計(jì)算法
2.4.2 基于深度學(xué)習(xí)的三維人體姿態(tài)估計(jì)
2.5 相關(guān)的公開數(shù)據(jù)集
2.5.1 二維人體姿態(tài)數(shù)據(jù)集
2.5.2 三維人體姿態(tài)數(shù)據(jù)集
2.6 本章小結(jié)
第3章 基于人體結(jié)構(gòu)感知網(wǎng)絡(luò)的三維人體姿態(tài)估計(jì)
3.1 二維人體姿態(tài)估計(jì)
3.2 人體結(jié)構(gòu)感知網(wǎng)絡(luò)模型
3.2.1 二維姿態(tài)和三維姿態(tài)數(shù)據(jù)預(yù)處理
3.2.2 基本子網(wǎng)絡(luò)
3.2.3 單通道優(yōu)化子網(wǎng)絡(luò)
3.2.4 雙通道優(yōu)化子網(wǎng)絡(luò)
3.3 實(shí)驗(yàn)與分析
3.3.1 評價(jià)指標(biāo)及實(shí)驗(yàn)設(shè)置
3.3.2 可視化定性分析
3.3.3 定量分析
3.4 本章小結(jié)
第4章 基于層次上下文相關(guān)優(yōu)化網(wǎng)絡(luò)的三維人體姿態(tài)估計(jì)
4.1 人體骨架模型的分層結(jié)構(gòu)
4.2 基于隨機(jī)增強(qiáng)模塊的基本子網(wǎng)絡(luò)
4.3 基于人體分層結(jié)構(gòu)的層次上下文相關(guān)優(yōu)化子網(wǎng)絡(luò)
4.4 注意力模塊
4.5 實(shí)驗(yàn)與分析
4.5.1 評價(jià)指標(biāo)與實(shí)驗(yàn)設(shè)置
4.5.2 Human3.6M上的定量評估
4.5.3 消融實(shí)驗(yàn)
4.5.4 Human Eva上的定量評估
4.5.5 可視化結(jié)果
4.6 本章小結(jié)
第5章 總結(jié)與展望
5.1 工作總結(jié)
5.2 工作展望
參考文獻(xiàn)
指導(dǎo)教師對研究生學(xué)位論文的學(xué)術(shù)評語
學(xué)位論文答辯委員會決議書
致謝
攻讀碩士學(xué)位期間的研究成果
【參考文獻(xiàn)】:
期刊論文
[1]舉重運(yùn)動的人體三維模型重建及仿真[J]. 劉國翌,陳睿,鄧宇,李華. 系統(tǒng)仿真學(xué)報(bào). 2006(02)
[2]基于視頻的三維人體運(yùn)動跟蹤[J]. 劉國翌,陳睿,鄧宇,李華. 計(jì)算機(jī)輔助設(shè)計(jì)與圖形學(xué)學(xué)報(bào). 2006(01)
博士論文
[1]基于單目視頻無標(biāo)記點(diǎn)的三維人體姿態(tài)估計(jì)的研究[D]. 劉晨光.哈爾濱工業(yè)大學(xué) 2011
本文編號:3705427
本文鏈接:http://sikaile.net/kejilunwen/zidonghuakongzhilunwen/3705427.html
最近更新
教材專著