基于深度學(xué)習(xí)的人體姿態(tài)估計(jì)關(guān)鍵技術(shù)研發(fā)
發(fā)布時(shí)間:2021-05-24 15:30
人體姿態(tài)估計(jì)是計(jì)算機(jī)視覺(jué)中的一個(gè)重要研究領(lǐng)域,在人們對(duì)體驗(yàn)感、新鮮感、安全感不斷追求的當(dāng)前,人體姿態(tài)估計(jì)及其應(yīng)用具有極大的商業(yè)效益和人文意義。本研究課題著眼于由Mask R-CNN圖像分割算法而延伸的經(jīng)典姿態(tài)估計(jì)算法,針對(duì)算法實(shí)際應(yīng)用存在的問(wèn)題進(jìn)行相應(yīng)改進(jìn),從而提高骨骼關(guān)節(jié)點(diǎn)檢測(cè)與識(shí)別的準(zhǔn)確性和魯棒性。為了達(dá)到研究目的,本文針對(duì)數(shù)據(jù)庫(kù)和實(shí)際應(yīng)用中圖像,通過(guò)深度學(xué)習(xí)技術(shù),定位并辨識(shí)圖像中人眼、手肘、盆骨、腳踝等各個(gè)關(guān)節(jié)點(diǎn),并輔以對(duì)應(yīng)連接,從而以人體關(guān)節(jié)點(diǎn)骨架的形式表征人體狀態(tài)。本文主要工作如下:(1)改進(jìn)了基于全卷積網(wǎng)絡(luò)的姿態(tài)估計(jì)方法。對(duì)于Mask R-CNN算法中得到的感興趣區(qū)域特征圖,首先將其輸入到卷積層中得到特征圖(記為特征圖一);然后利用基于注意力殘差模塊和數(shù)據(jù)旁路的支路算法(記為支路一)、基于混合空洞卷積的FCN支路算法(記為支路二)進(jìn)行更深的特征提取和融合;再將兩支路的結(jié)果疊加后輸入至小型FCN中進(jìn)行姿態(tài)估計(jì)。其中,為了最大化支路模塊網(wǎng)絡(luò)中所有層之間的信息流,在支路一的輸入處,將兩個(gè)注意力殘差模塊進(jìn)行前后級(jí)聯(lián)并進(jìn)行像素級(jí)別的疊加,配合數(shù)據(jù)旁路連通網(wǎng)路中的前后層,使得網(wǎng)絡(luò)中每一...
【文章來(lái)源】:南京郵電大學(xué)江蘇省
【文章頁(yè)數(shù)】:65 頁(yè)
【學(xué)位級(jí)別】:碩士
【文章目錄】:
摘要
abstract
第一章 緒論
1.1 研究背景及意義
1.1.1 研究背景
1.1.2 研究意義
1.2 國(guó)內(nèi)外研究現(xiàn)狀
1.2.1 基于模型的人體姿態(tài)估計(jì)
1.2.2 非模型的人體姿態(tài)估計(jì)
1.3 本文的主要工作與安排
第二章 相關(guān)背景知識(shí)介紹
2.1 卷積神經(jīng)網(wǎng)絡(luò)理論基礎(chǔ)
2.2 評(píng)價(jià)指標(biāo)
2.2.1 MS COCO數(shù)據(jù)集介紹
2.2.2 評(píng)價(jià)指標(biāo)
2.3 人體姿態(tài)估計(jì)中的特征提取
2.3.1 特征提取理論基礎(chǔ)
2.3.2 特征提取網(wǎng)絡(luò)設(shè)計(jì)
2.4 面臨的主要問(wèn)題和挑戰(zhàn)
2.5 本章小結(jié)
第三章 基于改進(jìn)關(guān)節(jié)點(diǎn)分支的人體姿態(tài)估計(jì)
3.1 基于Mask R-CNN人體姿態(tài)估計(jì)算法的整體框架
3.2 基于全卷積網(wǎng)絡(luò)的人體姿態(tài)估計(jì)
3.2.1 全卷積網(wǎng)絡(luò)結(jié)構(gòu)
3.2.2 全卷積網(wǎng)絡(luò)的優(yōu)點(diǎn)和不足
3.3 基于改進(jìn)全卷積網(wǎng)絡(luò)的人體姿態(tài)估計(jì)
3.3.1 網(wǎng)絡(luò)框架
3.3.2 注意力殘差模塊
3.3.3 跳躍連接特征融合
3.3.4 混合空洞卷積
3.4 實(shí)驗(yàn)結(jié)果及分析
3.4.1 環(huán)境搭載和訓(xùn)練細(xì)節(jié)
3.4.2 性能對(duì)比和分析
3.4.3 人體姿態(tài)估計(jì)結(jié)果示例
3.5 本章小結(jié)
第四章 基于改進(jìn)區(qū)域生成網(wǎng)絡(luò)的人體姿態(tài)估計(jì)
4.1 基于區(qū)域生成網(wǎng)絡(luò)的人體姿態(tài)估計(jì)
4.1.1 區(qū)域生成網(wǎng)絡(luò)
4.1.2 區(qū)域生成網(wǎng)絡(luò)的不足
4.2 基于改進(jìn)的區(qū)域生成網(wǎng)絡(luò)的人體姿態(tài)估計(jì)
4.2.1 網(wǎng)絡(luò)框架
4.2.2 預(yù)測(cè)錨框模塊
4.2.3 特征自適應(yīng)模塊
4.2.4 多任務(wù)損失函數(shù)
4.3 實(shí)驗(yàn)結(jié)果及分析
4.3.1 環(huán)境搭載和訓(xùn)練細(xì)節(jié)
4.3.2 人體姿態(tài)估計(jì)對(duì)比分析
4.4 本章小結(jié)
第五章 總結(jié)與展望
5.1 總結(jié)
5.2 展望
參考文獻(xiàn)
附錄1 攻讀碩士學(xué)位期間申請(qǐng)的專利
致謝
【參考文獻(xiàn)】:
期刊論文
[1]可穿戴式人體姿態(tài)檢測(cè)系統(tǒng)設(shè)計(jì)[J]. 胡小華,李向攀,祁洋陽(yáng),冷昊,韓建海,郭冰菁. 電子技術(shù)應(yīng)用. 2017(09)
[2]基于深度學(xué)習(xí)的大數(shù)據(jù)空氣污染預(yù)報(bào)[J]. 尹文君,張大偉,嚴(yán)京海,張超,李云婷,芮曉光. 中國(guó)環(huán)境管理. 2015(06)
碩士論文
[1]基于深度學(xué)習(xí)的多姿態(tài)人臉識(shí)別算法研究[D]. 肖芳.電子科技大學(xué) 2019
[2]基于人體姿態(tài)估計(jì)算法的輔助運(yùn)動(dòng)訓(xùn)練系統(tǒng)的研究[D]. 張東梅.北京郵電大學(xué) 2016
本文編號(hào):3204423
【文章來(lái)源】:南京郵電大學(xué)江蘇省
【文章頁(yè)數(shù)】:65 頁(yè)
【學(xué)位級(jí)別】:碩士
【文章目錄】:
摘要
abstract
第一章 緒論
1.1 研究背景及意義
1.1.1 研究背景
1.1.2 研究意義
1.2 國(guó)內(nèi)外研究現(xiàn)狀
1.2.1 基于模型的人體姿態(tài)估計(jì)
1.2.2 非模型的人體姿態(tài)估計(jì)
1.3 本文的主要工作與安排
第二章 相關(guān)背景知識(shí)介紹
2.1 卷積神經(jīng)網(wǎng)絡(luò)理論基礎(chǔ)
2.2 評(píng)價(jià)指標(biāo)
2.2.1 MS COCO數(shù)據(jù)集介紹
2.2.2 評(píng)價(jià)指標(biāo)
2.3 人體姿態(tài)估計(jì)中的特征提取
2.3.1 特征提取理論基礎(chǔ)
2.3.2 特征提取網(wǎng)絡(luò)設(shè)計(jì)
2.4 面臨的主要問(wèn)題和挑戰(zhàn)
2.5 本章小結(jié)
第三章 基于改進(jìn)關(guān)節(jié)點(diǎn)分支的人體姿態(tài)估計(jì)
3.1 基于Mask R-CNN人體姿態(tài)估計(jì)算法的整體框架
3.2 基于全卷積網(wǎng)絡(luò)的人體姿態(tài)估計(jì)
3.2.1 全卷積網(wǎng)絡(luò)結(jié)構(gòu)
3.2.2 全卷積網(wǎng)絡(luò)的優(yōu)點(diǎn)和不足
3.3 基于改進(jìn)全卷積網(wǎng)絡(luò)的人體姿態(tài)估計(jì)
3.3.1 網(wǎng)絡(luò)框架
3.3.2 注意力殘差模塊
3.3.3 跳躍連接特征融合
3.3.4 混合空洞卷積
3.4 實(shí)驗(yàn)結(jié)果及分析
3.4.1 環(huán)境搭載和訓(xùn)練細(xì)節(jié)
3.4.2 性能對(duì)比和分析
3.4.3 人體姿態(tài)估計(jì)結(jié)果示例
3.5 本章小結(jié)
第四章 基于改進(jìn)區(qū)域生成網(wǎng)絡(luò)的人體姿態(tài)估計(jì)
4.1 基于區(qū)域生成網(wǎng)絡(luò)的人體姿態(tài)估計(jì)
4.1.1 區(qū)域生成網(wǎng)絡(luò)
4.1.2 區(qū)域生成網(wǎng)絡(luò)的不足
4.2 基于改進(jìn)的區(qū)域生成網(wǎng)絡(luò)的人體姿態(tài)估計(jì)
4.2.1 網(wǎng)絡(luò)框架
4.2.2 預(yù)測(cè)錨框模塊
4.2.3 特征自適應(yīng)模塊
4.2.4 多任務(wù)損失函數(shù)
4.3 實(shí)驗(yàn)結(jié)果及分析
4.3.1 環(huán)境搭載和訓(xùn)練細(xì)節(jié)
4.3.2 人體姿態(tài)估計(jì)對(duì)比分析
4.4 本章小結(jié)
第五章 總結(jié)與展望
5.1 總結(jié)
5.2 展望
參考文獻(xiàn)
附錄1 攻讀碩士學(xué)位期間申請(qǐng)的專利
致謝
【參考文獻(xiàn)】:
期刊論文
[1]可穿戴式人體姿態(tài)檢測(cè)系統(tǒng)設(shè)計(jì)[J]. 胡小華,李向攀,祁洋陽(yáng),冷昊,韓建海,郭冰菁. 電子技術(shù)應(yīng)用. 2017(09)
[2]基于深度學(xué)習(xí)的大數(shù)據(jù)空氣污染預(yù)報(bào)[J]. 尹文君,張大偉,嚴(yán)京海,張超,李云婷,芮曉光. 中國(guó)環(huán)境管理. 2015(06)
碩士論文
[1]基于深度學(xué)習(xí)的多姿態(tài)人臉識(shí)別算法研究[D]. 肖芳.電子科技大學(xué) 2019
[2]基于人體姿態(tài)估計(jì)算法的輔助運(yùn)動(dòng)訓(xùn)練系統(tǒng)的研究[D]. 張東梅.北京郵電大學(xué) 2016
本文編號(hào):3204423
本文鏈接:http://sikaile.net/kejilunwen/shengwushengchang/3204423.html
最近更新
教材專著