基于卷積神經(jīng)網(wǎng)絡(luò)的人體姿態(tài)估計研究
發(fā)布時間:2023-05-13 19:27
人體姿態(tài)估計已成為人機交互等智能應(yīng)用解決方案的熱點問題,但是在面對小尺度人體實例時,以往的深度學(xué)習(xí)網(wǎng)絡(luò)得到的結(jié)果不是非常理想,無法準(zhǔn)確地估計出圖片或視頻中所有人的姿態(tài)。因此,為了解決人體姿態(tài)估計中尺度變化的問題,特別是精確定位小尺度人體實例的關(guān)鍵點,本文提出了一種改進(jìn)的高分辨率網(wǎng)絡(luò)(Improved High-Resolution Network,Improved HRNet)。本文主要改進(jìn)工作如下:(1)在特征提取模塊中,本文在并行子網(wǎng)絡(luò)向前傳遞的過程中添加了雙重注意力機制,目的是在不改變通道數(shù)的前提下,賦予傳播信息權(quán)重,分配權(quán)重大的信息為有用信息,減少無關(guān)信息帶來的干擾。(2)在關(guān)鍵點分組模塊中,引入關(guān)聯(lián)嵌入的方法,使得網(wǎng)絡(luò)能夠同時輸出實例檢測和關(guān)鍵點分組,減少了以往的兩階段任務(wù)(即先檢測所有關(guān)鍵點,再進(jìn)行分組)會丟失網(wǎng)絡(luò)中深層語義信息的現(xiàn)象。本文使用了一種基于雙線性插值法的熱圖聚合策略,用于實現(xiàn)上采樣操作,將預(yù)測熱圖的分辨率提高到與主干網(wǎng)絡(luò)輸入特征圖相同的分辨率,然后通過把所有不同尺度的特征圖取平均值,實現(xiàn)最終的預(yù)測。(3)在訓(xùn)練網(wǎng)絡(luò)過程中,本文使用多分辨率監(jiān)督學(xué)習(xí),即在不同分辨...
【文章頁數(shù)】:59 頁
【學(xué)位級別】:碩士
【文章目錄】:
摘要
ABSTRACT
1 引言
1.1 研究背景與研究意義
1.2 研究現(xiàn)狀與研究難點
1.3 研究內(nèi)容與章節(jié)安排
2 相關(guān)工作
2.1 人體姿態(tài)估計
2.2 卷積神經(jīng)網(wǎng)絡(luò)
2.3 殘差神經(jīng)網(wǎng)絡(luò)
2.4 本章小結(jié)
3 基于改進(jìn)高分辨率網(wǎng)絡(luò)的人體姿態(tài)估計
3.1 高分辨網(wǎng)絡(luò)
3.2 雙重注意力機制
3.3 關(guān)鍵點分組
3.4 反卷積模塊
3.5 多分辨率監(jiān)督
3.6 熱圖聚合
3.7 本章小結(jié)
4 實驗與分析
4.1 實驗設(shè)置
4.2 數(shù)據(jù)集
4.3 關(guān)鍵點檢測
4.4 消融實驗
4.5 實驗分析
4.6 本章小結(jié)
5 結(jié)論與展望
5.1 結(jié)論
5.2 展望
參考文獻(xiàn)
致謝
攻讀碩士學(xué)位期間發(fā)表的學(xué)術(shù)論文目錄
本文編號:3816367
【文章頁數(shù)】:59 頁
【學(xué)位級別】:碩士
【文章目錄】:
摘要
ABSTRACT
1 引言
1.1 研究背景與研究意義
1.2 研究現(xiàn)狀與研究難點
1.3 研究內(nèi)容與章節(jié)安排
2 相關(guān)工作
2.1 人體姿態(tài)估計
2.2 卷積神經(jīng)網(wǎng)絡(luò)
2.3 殘差神經(jīng)網(wǎng)絡(luò)
2.4 本章小結(jié)
3 基于改進(jìn)高分辨率網(wǎng)絡(luò)的人體姿態(tài)估計
3.1 高分辨網(wǎng)絡(luò)
3.2 雙重注意力機制
3.3 關(guān)鍵點分組
3.4 反卷積模塊
3.5 多分辨率監(jiān)督
3.6 熱圖聚合
3.7 本章小結(jié)
4 實驗與分析
4.1 實驗設(shè)置
4.2 數(shù)據(jù)集
4.3 關(guān)鍵點檢測
4.4 消融實驗
4.5 實驗分析
4.6 本章小結(jié)
5 結(jié)論與展望
5.1 結(jié)論
5.2 展望
參考文獻(xiàn)
致謝
攻讀碩士學(xué)位期間發(fā)表的學(xué)術(shù)論文目錄
本文編號:3816367
本文鏈接:http://sikaile.net/kejilunwen/zidonghuakongzhilunwen/3816367.html
最近更新
教材專著