基于卷積神經(jīng)網(wǎng)絡(luò)的人體姿態(tài)估計系統(tǒng)研究與實現(xiàn)
發(fā)布時間:2021-10-23 09:34
人體姿態(tài)估計是實現(xiàn)動作識別和人機交互的關(guān)鍵技術(shù),在多人場景中需要同時檢測出各人體的各關(guān)鍵點位置信息,靈活的卷積神經(jīng)網(wǎng)絡(luò)架構(gòu)顯著提高了這一檢測任務(wù)的準(zhǔn)確度。本文針對網(wǎng)絡(luò)架構(gòu)中大卷積核和多尺度融合兩關(guān)鍵因素,提出了一種融合多尺度特征的多階段級聯(lián)的卷積神經(jīng)網(wǎng)絡(luò)架構(gòu),第一階段在小塊區(qū)域中可以粗略估計人體部位的位置和部位之間的關(guān)聯(lián)度,后續(xù)階段可以在更大區(qū)域中進一步精細化姿態(tài)估計的結(jié)果。為此論文主要完成了以下工作:(1)針對多人姿態(tài)估計場景,提出了一種多尺度特征融合的多階段級聯(lián)的卷積神經(jīng)網(wǎng)絡(luò)架構(gòu),以熱度圖回歸坐標(biāo)的方式構(gòu)建了真實關(guān)鍵點檢測置信圖;以PAF方法構(gòu)建了真實關(guān)鍵點關(guān)聯(lián)置信圖,并完成該網(wǎng)絡(luò)模型的訓(xùn)練。(2)基于訓(xùn)練完成的模型,對數(shù)據(jù)增強后的圖片預(yù)測其關(guān)鍵點檢測置信圖和關(guān)聯(lián)置信圖,可視化該預(yù)測結(jié)果后測試模型的學(xué)習(xí)效果,并在COCO2017驗證集上評估模型的準(zhǔn)確度。實驗中采用4種不同尺度的圖片,利用關(guān)鍵點檢測器和關(guān)聯(lián)器分別得到圖片中人體的關(guān)鍵點檢測置信圖和關(guān)聯(lián)置信圖,可視化部位的置信度和部位之間的關(guān)聯(lián)度,觀察到同一人體在不同圖片中的響應(yīng)值不同,因此在測試中應(yīng)增加數(shù)據(jù)的多樣性提高模型的檢測效果。...
【文章來源】:西安電子科技大學(xué)陜西省 211工程院校 教育部直屬院校
【文章頁數(shù)】:77 頁
【學(xué)位級別】:碩士
【部分圖文】:
FasterR-CNN的網(wǎng)絡(luò)結(jié)構(gòu)
第二章 人體姿態(tài)估計方法概述(2)SSD相比兩階段的目標(biāo)檢測算法,SSD 完全移除候選框生成和后續(xù)像素或特征重采樣階段,使所有計算在單一網(wǎng)絡(luò)框架下完成。SSD 主要提出多尺度特征,并在每一特征圖上根據(jù)aspectratio設(shè)計一系列的defaultboxes,使得網(wǎng)絡(luò)能同時預(yù)測相對于defaultboxes 的偏移量和目標(biāo)是否出現(xiàn)在邊框中的得分。SSD 利用多層特征圖的輸出來分類和回歸,因需要在多層特征圖上產(chǎn)生 prior box,利用 prior box 和真實邊框按照 IOU值選出正負樣本,并用選出的正樣本和真實邊框設(shè)計邊框偏移量,這一過程會產(chǎn)生大量的負樣本,造成訓(xùn)練樣本比例不平衡,導(dǎo)致模型精度偏低。SSD 網(wǎng)絡(luò)的結(jié)構(gòu)如圖 2.2所示。
圖2.3 CPM 的網(wǎng)絡(luò)結(jié)構(gòu)(2)Stacked HourglassStackedHourglass 是目前專門針對人體姿態(tài)估計任務(wù)設(shè)計的一種新穎的卷積網(wǎng)絡(luò)架構(gòu),其中 Hourglass 是一個結(jié)構(gòu)對稱的單元網(wǎng)絡(luò)模塊,擁有從底層語義信息到高層語義信息,再由高層語義信息到底層語義信息的過程,能夠捕獲多尺度的語義信息,同時建模人體部位的空間關(guān)系。Stacked Hourglass 網(wǎng)絡(luò)架構(gòu)是疊加多個 Hourglass 模塊,每個 Hourglass 模塊使用中間監(jiān)督方法提高網(wǎng)絡(luò)學(xué)習(xí)能力,并通過熱度圖回歸坐標(biāo)。Hourglass 網(wǎng)絡(luò)的結(jié)構(gòu)如圖 2.4 所示。
【參考文獻】:
期刊論文
[1]二維人體姿態(tài)估計研究進展[J]. 韓貴金,沈建冬. 西安郵電大學(xué)學(xué)報. 2017(04)
本文編號:3452947
【文章來源】:西安電子科技大學(xué)陜西省 211工程院校 教育部直屬院校
【文章頁數(shù)】:77 頁
【學(xué)位級別】:碩士
【部分圖文】:
FasterR-CNN的網(wǎng)絡(luò)結(jié)構(gòu)
第二章 人體姿態(tài)估計方法概述(2)SSD相比兩階段的目標(biāo)檢測算法,SSD 完全移除候選框生成和后續(xù)像素或特征重采樣階段,使所有計算在單一網(wǎng)絡(luò)框架下完成。SSD 主要提出多尺度特征,并在每一特征圖上根據(jù)aspectratio設(shè)計一系列的defaultboxes,使得網(wǎng)絡(luò)能同時預(yù)測相對于defaultboxes 的偏移量和目標(biāo)是否出現(xiàn)在邊框中的得分。SSD 利用多層特征圖的輸出來分類和回歸,因需要在多層特征圖上產(chǎn)生 prior box,利用 prior box 和真實邊框按照 IOU值選出正負樣本,并用選出的正樣本和真實邊框設(shè)計邊框偏移量,這一過程會產(chǎn)生大量的負樣本,造成訓(xùn)練樣本比例不平衡,導(dǎo)致模型精度偏低。SSD 網(wǎng)絡(luò)的結(jié)構(gòu)如圖 2.2所示。
圖2.3 CPM 的網(wǎng)絡(luò)結(jié)構(gòu)(2)Stacked HourglassStackedHourglass 是目前專門針對人體姿態(tài)估計任務(wù)設(shè)計的一種新穎的卷積網(wǎng)絡(luò)架構(gòu),其中 Hourglass 是一個結(jié)構(gòu)對稱的單元網(wǎng)絡(luò)模塊,擁有從底層語義信息到高層語義信息,再由高層語義信息到底層語義信息的過程,能夠捕獲多尺度的語義信息,同時建模人體部位的空間關(guān)系。Stacked Hourglass 網(wǎng)絡(luò)架構(gòu)是疊加多個 Hourglass 模塊,每個 Hourglass 模塊使用中間監(jiān)督方法提高網(wǎng)絡(luò)學(xué)習(xí)能力,并通過熱度圖回歸坐標(biāo)。Hourglass 網(wǎng)絡(luò)的結(jié)構(gòu)如圖 2.4 所示。
【參考文獻】:
期刊論文
[1]二維人體姿態(tài)估計研究進展[J]. 韓貴金,沈建冬. 西安郵電大學(xué)學(xué)報. 2017(04)
本文編號:3452947
本文鏈接:http://sikaile.net/kejilunwen/shengwushengchang/3452947.html
最近更新
教材專著