基于卷積神經(jīng)網(wǎng)絡(luò)的人體姿態(tài)估計方法研究
【學(xué)位單位】:電子科技大學(xué)
【學(xué)位級別】:博士
【學(xué)位年份】:2020
【中圖分類】:TP391.41;TP183
【部分圖文】:
章節(jié)組織結(jié)構(gòu)
早期的分類任務(wù)或者回歸任務(wù)都是在特征提取器的后端接上全連接層,通過全連接層降低特征的維度。然而,全連接層過多的參數(shù)會增加網(wǎng)絡(luò)的計算開銷,造成過擬合。為了減少網(wǎng)絡(luò)的參數(shù)量與計算量,避免過擬合,研究者嘗試使用全局池化層替代全連接層,獲得了與全連接層相同的效果[13]。對于某些密集預(yù)測(Dense Prediction,DP)任務(wù)比如語義分割[14]、姿態(tài)估計[15]等,則一般在靠近輸出的網(wǎng)絡(luò)層使用卷積層。原因在于這一類任務(wù)需要使用全卷積網(wǎng)絡(luò)以保留位置信息,產(chǎn)生分割圖或者熱力圖。下面分別對卷積神經(jīng)網(wǎng)絡(luò)的各個組成部分進行詳細介紹:
在基于坐標(biāo)回歸的方法中,DeepPose[3]奠定了基于坐標(biāo)回歸的方法的基礎(chǔ),提出了很多實用的數(shù)據(jù)預(yù)處理及網(wǎng)絡(luò)訓(xùn)練方法。后續(xù)的研究主要從應(yīng)用場景(處理視頻還是靜止的圖像[79])、數(shù)據(jù)擴增[79]、多源輸入[80]、反饋輸入[81]、多任務(wù)[82]以及人體姿態(tài)的表示[83]這幾個方面展開。Toshev等人開創(chuàng)了將卷積神經(jīng)網(wǎng)絡(luò)應(yīng)用于人體姿態(tài)估計的先例。如圖2-2所示,Toshev等人基于AlexNet提出了一種稱之為DeepPose的級聯(lián)架構(gòu)回歸人體各個關(guān)節(jié)點的坐標(biāo)。為了避免卷積神經(jīng)網(wǎng)絡(luò)產(chǎn)生過擬合,作者使用數(shù)據(jù)集中提供的人體邊界框?qū)﹃P(guān)節(jié)點坐標(biāo)進行歸一化,并將歸一化之后的坐標(biāo)作為網(wǎng)絡(luò)的學(xué)習(xí)目標(biāo)。對關(guān)節(jié)點坐標(biāo)進行歸一化這一操作非常重要,這決定了網(wǎng)絡(luò)能否收斂,這一操作被后續(xù)基于坐標(biāo)回歸的方法沿用。圖2-2中可以看出,DeepPose架構(gòu)有多個階段,初始階段的網(wǎng)絡(luò)負(fù)責(zé)學(xué)習(xí)人體關(guān)節(jié)點的粗糙位置,后續(xù)階段網(wǎng)絡(luò)的輸入是前一階段網(wǎng)絡(luò)所輸出粗糙位置,這一部分的網(wǎng)絡(luò)負(fù)責(zé)學(xué)習(xí)粗糙位置相對于真實位置的偏移量。Pfister等人[79]使用卷積神經(jīng)網(wǎng)絡(luò)對視頻中人體的上半身進行姿態(tài)估計。在該方法中作者將多個視頻幀作為網(wǎng)絡(luò)的輸入,為了緩解過擬合現(xiàn)象(網(wǎng)絡(luò)可能會過擬合人的背景區(qū)域),作者從數(shù)據(jù)集中隨機采樣2000個視頻幀,利用視頻幀計算出均值圖像,然后將所輸入的視頻幀減去均值圖像后作為網(wǎng)絡(luò)的輸入。該研究還提出了人體姿態(tài)估計中許多常用的數(shù)據(jù)擴增方法,在訓(xùn)練時對輸入進行隨機裁剪、隨機水平翻轉(zhuǎn)、顏色抖動等數(shù)據(jù)擴增操作。Li等人[82]提出了一種多任務(wù)的網(wǎng)絡(luò)架構(gòu)將人體部件檢測和人體關(guān)節(jié)點定位同時嵌入到網(wǎng)絡(luò)中,利用人體部件檢測任務(wù)去輔助關(guān)節(jié)點回歸任務(wù)。Fan等人[80]進一步提出雙源多任務(wù)的人體姿態(tài)估計方法,將候選關(guān)節(jié)點區(qū)域的局部圖像和人體圖像同時作為網(wǎng)絡(luò)的輸入,使網(wǎng)絡(luò)同時學(xué)習(xí)檢測關(guān)節(jié)和回歸關(guān)節(jié)點的坐標(biāo)。由于人的視覺系統(tǒng)中包含有反饋連接,為了利用反饋連接改善基于坐標(biāo)回歸的人體姿態(tài)估計,Carriean等人[81]提出了迭代誤差反饋(Iterative Error Feedback,IEF)的思想。
【相似文獻】
相關(guān)期刊論文 前10條
1 彭帥;黃宏博;陳偉駿;胡志穎;袁銘陽;;基于卷積神經(jīng)網(wǎng)絡(luò)的人體姿態(tài)估計算法綜述[J];北京信息科技大學(xué)學(xué)報(自然科學(xué)版);2020年03期
2 肖賢鵬;劉理想;胡莉;張華;;基于深度圖像的實時多人體姿態(tài)估計[J];傳感器與微系統(tǒng);2020年06期
3 薛濤;;基于混合部件模型改進的人體姿態(tài)估計[J];信息與電腦(理論版);2020年10期
4 岳程宇;閆勝業(yè);;2D人體姿態(tài)估計綜述[J];現(xiàn)代信息科技;2020年12期
5 韓貴金;沈建冬;;二維人體姿態(tài)估計研究進展[J];西安郵電大學(xué)學(xué)報;2017年04期
6 蔡鵬;孔德慧;尹寶才;霍奕;;基于肢體調(diào)整的人體姿態(tài)估計[J];系統(tǒng)仿真學(xué)報;2015年10期
7 喻東山,徐捷,孫旦暉,曾彥英,高小寧,蔣曉軍;利培酮對人體姿態(tài)平衡的效應(yīng)[J];中國行為醫(yī)學(xué)科學(xué);2005年03期
8 東方伊人;四種常見的人體姿態(tài)[J];現(xiàn)代技能開發(fā);1996年02期
9 蘇延超;艾海舟;勞世竑;;圖像和視頻中基于部件檢測器的人體姿態(tài)估計[J];電子與信息學(xué)報;2011年06期
10 何燁林;張軍;;用于人體姿態(tài)估計傳感的菲涅爾透鏡設(shè)計[J];應(yīng)用光學(xué);2020年03期
相關(guān)博士學(xué)位論文 前10條
1 張鋒;基于卷積神經(jīng)網(wǎng)絡(luò)的人體姿態(tài)估計方法研究[D];電子科技大學(xué);2020年
2 張雯暉;人體姿態(tài)估計與姿態(tài)距離度量學(xué)習(xí)方法研究[D];北京工業(yè)大學(xué);2019年
3 趙林;面向復(fù)雜監(jiān)控環(huán)境的人體運動分析方法[D];西安電子科技大學(xué);2017年
4 馬淼;視頻中人體姿態(tài)估計、跟蹤與行為識別研究[D];山東大學(xué);2017年
5 孫可;人體姿態(tài)估計的深度網(wǎng)絡(luò)結(jié)構(gòu)研究[D];中國科學(xué)技術(shù)大學(xué);2020年
6 李弟平;基于視頻的人體姿態(tài)檢測與運動識別方法[D];中南大學(xué);2012年
7 陳聰;基于人體姿態(tài)序列提取和分析的行為識別[D];華南理工大學(xué);2012年
8 李佳;多視角三維人體運動捕捉的研究[D];北京交通大學(xué);2013年
9 歐陽毅;單目視頻中人體運動建模及姿態(tài)估計研究[D];浙江大學(xué);2012年
10 張殿勇;基于人體模型構(gòu)建的無標(biāo)識運動捕捉關(guān)鍵技術(shù)研究[D];北京交通大學(xué);2014年
相關(guān)碩士學(xué)位論文 前10條
1 申小鳳;基于卷積神經(jīng)網(wǎng)絡(luò)的人體姿態(tài)估計研究[D];西華大學(xué);2020年
2 張賽;基于對抗學(xué)習(xí)的人體姿態(tài)估計研究[D];中國礦業(yè)大學(xué);2020年
3 王柳程;人體姿態(tài)點識別算法研究[D];江西理工大學(xué);2020年
4 馬瑞軍;基于深度學(xué)習(xí)的多人人體姿態(tài)估計[D];天津職業(yè)技術(shù)師范大學(xué);2019年
5 胡剛;基于圖結(jié)構(gòu)模型的人體姿態(tài)估計研究[D];武漢理工大學(xué);2014年
6 孟凡輝;靜態(tài)圖片人體姿態(tài)估計研究[D];合肥工業(yè)大學(xué);2012年
7 葉浩;基于關(guān)系網(wǎng)絡(luò)的二維人體姿態(tài)回歸算法研究[D];大連海事大學(xué);2020年
8 韓利夫;基于深度學(xué)習(xí)的人體姿態(tài)估計算法研究[D];電子科技大學(xué);2020年
9 朱靖;基于卷積神經(jīng)網(wǎng)絡(luò)的二維人體姿態(tài)估計研究[D];杭州電子科技大學(xué);2019年
10 周亞輝;基于跨階段深度網(wǎng)絡(luò)的人體姿態(tài)分析[D];合肥工業(yè)大學(xué);2019年
本文編號:2890315
本文鏈接:http://sikaile.net/shoufeilunwen/xxkjbs/2890315.html