基于卷積神經(jīng)網(wǎng)絡的人體姿態(tài)估計研究
發(fā)布時間:2023-05-13 19:27
人體姿態(tài)估計已成為人機交互等智能應用解決方案的熱點問題,但是在面對小尺度人體實例時,以往的深度學習網(wǎng)絡得到的結果不是非常理想,無法準確地估計出圖片或視頻中所有人的姿態(tài)。因此,為了解決人體姿態(tài)估計中尺度變化的問題,特別是精確定位小尺度人體實例的關鍵點,本文提出了一種改進的高分辨率網(wǎng)絡(Improved High-Resolution Network,Improved HRNet)。本文主要改進工作如下:(1)在特征提取模塊中,本文在并行子網(wǎng)絡向前傳遞的過程中添加了雙重注意力機制,目的是在不改變通道數(shù)的前提下,賦予傳播信息權重,分配權重大的信息為有用信息,減少無關信息帶來的干擾。(2)在關鍵點分組模塊中,引入關聯(lián)嵌入的方法,使得網(wǎng)絡能夠同時輸出實例檢測和關鍵點分組,減少了以往的兩階段任務(即先檢測所有關鍵點,再進行分組)會丟失網(wǎng)絡中深層語義信息的現(xiàn)象。本文使用了一種基于雙線性插值法的熱圖聚合策略,用于實現(xiàn)上采樣操作,將預測熱圖的分辨率提高到與主干網(wǎng)絡輸入特征圖相同的分辨率,然后通過把所有不同尺度的特征圖取平均值,實現(xiàn)最終的預測。(3)在訓練網(wǎng)絡過程中,本文使用多分辨率監(jiān)督學習,即在不同分辨...
【文章頁數(shù)】:59 頁
【學位級別】:碩士
【文章目錄】:
摘要
ABSTRACT
1 引言
1.1 研究背景與研究意義
1.2 研究現(xiàn)狀與研究難點
1.3 研究內容與章節(jié)安排
2 相關工作
2.1 人體姿態(tài)估計
2.2 卷積神經(jīng)網(wǎng)絡
2.3 殘差神經(jīng)網(wǎng)絡
2.4 本章小結
3 基于改進高分辨率網(wǎng)絡的人體姿態(tài)估計
3.1 高分辨網(wǎng)絡
3.2 雙重注意力機制
3.3 關鍵點分組
3.4 反卷積模塊
3.5 多分辨率監(jiān)督
3.6 熱圖聚合
3.7 本章小結
4 實驗與分析
4.1 實驗設置
4.2 數(shù)據(jù)集
4.3 關鍵點檢測
4.4 消融實驗
4.5 實驗分析
4.6 本章小結
5 結論與展望
5.1 結論
5.2 展望
參考文獻
致謝
攻讀碩士學位期間發(fā)表的學術論文目錄
本文編號:3816367
【文章頁數(shù)】:59 頁
【學位級別】:碩士
【文章目錄】:
摘要
ABSTRACT
1 引言
1.1 研究背景與研究意義
1.2 研究現(xiàn)狀與研究難點
1.3 研究內容與章節(jié)安排
2 相關工作
2.1 人體姿態(tài)估計
2.2 卷積神經(jīng)網(wǎng)絡
2.3 殘差神經(jīng)網(wǎng)絡
2.4 本章小結
3 基于改進高分辨率網(wǎng)絡的人體姿態(tài)估計
3.1 高分辨網(wǎng)絡
3.2 雙重注意力機制
3.3 關鍵點分組
3.4 反卷積模塊
3.5 多分辨率監(jiān)督
3.6 熱圖聚合
3.7 本章小結
4 實驗與分析
4.1 實驗設置
4.2 數(shù)據(jù)集
4.3 關鍵點檢測
4.4 消融實驗
4.5 實驗分析
4.6 本章小結
5 結論與展望
5.1 結論
5.2 展望
參考文獻
致謝
攻讀碩士學位期間發(fā)表的學術論文目錄
本文編號:3816367
本文鏈接:http://sikaile.net/kejilunwen/zidonghuakongzhilunwen/3816367.html
最近更新
教材專著