基于深度學(xué)習(xí)的人體特征點(diǎn)定位算法研究
發(fā)布時(shí)間:2021-12-23 01:08
人體特征點(diǎn)定位算法是計(jì)算機(jī)視覺領(lǐng)域中一個(gè)非常重要的分支,在人機(jī)交互、影音娛樂、美顏相機(jī)中具有廣泛應(yīng)用場景。本文研究的人體特征點(diǎn)包括人臉特征點(diǎn)和人體關(guān)節(jié)點(diǎn)。為了讓人體特征點(diǎn)在計(jì)算資源有限的設(shè)備上準(zhǔn)確快速的定位,本文提出了兩種基于深度學(xué)習(xí)的人體特征點(diǎn)定位算法。首先在人臉特征點(diǎn)定位算法中,本文提出基于Inception結(jié)構(gòu)的卷積神經(jīng)網(wǎng)絡(luò)代替多級(jí)聯(lián)神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu),有效降低了運(yùn)算量;為了提升網(wǎng)絡(luò)的準(zhǔn)確率,使用多分支結(jié)構(gòu)增加網(wǎng)絡(luò)寬度,并引入了殘差結(jié)構(gòu),進(jìn)而實(shí)現(xiàn)人臉特征點(diǎn)的快速準(zhǔn)確定位。其次在人體姿態(tài)估計(jì)算法中,本文將深度可分離卷積與沙漏型網(wǎng)絡(luò)結(jié)構(gòu)相結(jié)合,這種組合方式能夠極大降低網(wǎng)絡(luò)的參數(shù)量,從而提升人體姿態(tài)估計(jì)的速度。為了減少空間信息的損失,本文使用熱力圖作為神經(jīng)網(wǎng)絡(luò)的輸出,這種結(jié)構(gòu)能夠有效提升定位的精度。為提高人臉特征點(diǎn)的定位速度,本文提出一種基于Inception結(jié)構(gòu)的特征點(diǎn)定位方法。該方法取消了傳統(tǒng)的多級(jí)聯(lián)結(jié)構(gòu),采用一個(gè)更寬更深的神經(jīng)網(wǎng)絡(luò)實(shí)現(xiàn)人臉特征點(diǎn)的定位,從而大大提升神經(jīng)網(wǎng)絡(luò)的運(yùn)算速度。為了彌補(bǔ)單個(gè)神經(jīng)網(wǎng)絡(luò)帶來的誤差問題,本文設(shè)計(jì)出一種基于Inception結(jié)構(gòu)的模塊。該模塊首先使用多個(gè)卷...
【文章來源】:南京信息工程大學(xué)江蘇省
【文章頁數(shù)】:55 頁
【學(xué)位級(jí)別】:碩士
【部分圖文】:
人臉特征點(diǎn)分布圖
代表性的特征點(diǎn)如圖 2-2 所(0)、脖子(1)、左肩(2)胸部(8)、臀部(9)、左臀4)、右腳(15)。本文將相鄰的特征點(diǎn)相連接視為剛體。特征點(diǎn)和骨骼結(jié)何關(guān)節(jié)。一種算法,當(dāng)輸入一張人體體關(guān)節(jié)點(diǎn)的位置。人體, i), … (xK, yK, )]T來表示,特征點(diǎn); i表示第 i 個(gè)關(guān)節(jié)點(diǎn)點(diǎn)標(biāo)記了但被遮擋了, i= 2輸入,若數(shù)據(jù)集中有特征點(diǎn)未
在目標(biāo)跟蹤、圖片分類、物體識(shí)別和圖像分割等領(lǐng)域取得了較大突破。近些年,基于卷積神經(jīng)網(wǎng)絡(luò)的特征點(diǎn)算法因其優(yōu)異的性能逐漸成為特征點(diǎn)定位算法中的主流。為了提高特征點(diǎn)定位算法的精度,基于級(jí)聯(lián)結(jié)構(gòu)的卷積神經(jīng)網(wǎng)絡(luò)得到了廣泛的應(yīng)用。下面介紹了基于級(jí)聯(lián)結(jié)構(gòu)的通用網(wǎng)絡(luò)框架,以及目前流行的人臉特征點(diǎn)和人體姿態(tài)估計(jì)的神經(jīng)網(wǎng)絡(luò)框架。2.3.1 基于級(jí)聯(lián)結(jié)構(gòu)的網(wǎng)絡(luò)框架級(jí)聯(lián)結(jié)構(gòu)的主要思想是將回歸任務(wù)中的相同或不同的計(jì)算過程串聯(lián)在一起,逐漸地逼近目標(biāo)真實(shí)值[5];诩(jí)聯(lián)結(jié)構(gòu)的卷積神經(jīng)網(wǎng)絡(luò)是將級(jí)聯(lián)結(jié)構(gòu)與卷積神經(jīng)網(wǎng)絡(luò)進(jìn)行整合,該方法首先使用一張較低分辨率的圖片送入卷積神經(jīng)網(wǎng)絡(luò)中,快速的定位出人體特征點(diǎn)的初始位置;然后在初始位置選取圖片的局部信息,使用更高分辨率的局部信息送入下一個(gè)階段的網(wǎng)絡(luò),得到微調(diào)的特征點(diǎn)位置;通過多個(gè)階段的網(wǎng)絡(luò)回歸最終確定人體特征點(diǎn)的坐標(biāo)位置。
【參考文獻(xiàn)】:
博士論文
[1]視頻中人體姿態(tài)估計(jì)、跟蹤與行為識(shí)別研究[D]. 馬淼.山東大學(xué) 2017
[2]基于空間和物體的視覺注意計(jì)算方法及實(shí)驗(yàn)研究[D]. 竇燕.燕山大學(xué) 2010
碩士論文
[1]人臉特征點(diǎn)定位方法的研究[D]. 盧青.中國科學(xué)技術(shù)大學(xué) 2018
[2]MobileNet壓縮模型的研究與優(yōu)化[D]. 陳方.華中師范大學(xué) 2018
[3]基于卷積神經(jīng)網(wǎng)絡(luò)的人體姿態(tài)估計(jì)[D]. 張玉立.哈爾濱工程大學(xué) 2018
本文編號(hào):3547470
【文章來源】:南京信息工程大學(xué)江蘇省
【文章頁數(shù)】:55 頁
【學(xué)位級(jí)別】:碩士
【部分圖文】:
人臉特征點(diǎn)分布圖
代表性的特征點(diǎn)如圖 2-2 所(0)、脖子(1)、左肩(2)胸部(8)、臀部(9)、左臀4)、右腳(15)。本文將相鄰的特征點(diǎn)相連接視為剛體。特征點(diǎn)和骨骼結(jié)何關(guān)節(jié)。一種算法,當(dāng)輸入一張人體體關(guān)節(jié)點(diǎn)的位置。人體, i), … (xK, yK, )]T來表示,特征點(diǎn); i表示第 i 個(gè)關(guān)節(jié)點(diǎn)點(diǎn)標(biāo)記了但被遮擋了, i= 2輸入,若數(shù)據(jù)集中有特征點(diǎn)未
在目標(biāo)跟蹤、圖片分類、物體識(shí)別和圖像分割等領(lǐng)域取得了較大突破。近些年,基于卷積神經(jīng)網(wǎng)絡(luò)的特征點(diǎn)算法因其優(yōu)異的性能逐漸成為特征點(diǎn)定位算法中的主流。為了提高特征點(diǎn)定位算法的精度,基于級(jí)聯(lián)結(jié)構(gòu)的卷積神經(jīng)網(wǎng)絡(luò)得到了廣泛的應(yīng)用。下面介紹了基于級(jí)聯(lián)結(jié)構(gòu)的通用網(wǎng)絡(luò)框架,以及目前流行的人臉特征點(diǎn)和人體姿態(tài)估計(jì)的神經(jīng)網(wǎng)絡(luò)框架。2.3.1 基于級(jí)聯(lián)結(jié)構(gòu)的網(wǎng)絡(luò)框架級(jí)聯(lián)結(jié)構(gòu)的主要思想是將回歸任務(wù)中的相同或不同的計(jì)算過程串聯(lián)在一起,逐漸地逼近目標(biāo)真實(shí)值[5];诩(jí)聯(lián)結(jié)構(gòu)的卷積神經(jīng)網(wǎng)絡(luò)是將級(jí)聯(lián)結(jié)構(gòu)與卷積神經(jīng)網(wǎng)絡(luò)進(jìn)行整合,該方法首先使用一張較低分辨率的圖片送入卷積神經(jīng)網(wǎng)絡(luò)中,快速的定位出人體特征點(diǎn)的初始位置;然后在初始位置選取圖片的局部信息,使用更高分辨率的局部信息送入下一個(gè)階段的網(wǎng)絡(luò),得到微調(diào)的特征點(diǎn)位置;通過多個(gè)階段的網(wǎng)絡(luò)回歸最終確定人體特征點(diǎn)的坐標(biāo)位置。
【參考文獻(xiàn)】:
博士論文
[1]視頻中人體姿態(tài)估計(jì)、跟蹤與行為識(shí)別研究[D]. 馬淼.山東大學(xué) 2017
[2]基于空間和物體的視覺注意計(jì)算方法及實(shí)驗(yàn)研究[D]. 竇燕.燕山大學(xué) 2010
碩士論文
[1]人臉特征點(diǎn)定位方法的研究[D]. 盧青.中國科學(xué)技術(shù)大學(xué) 2018
[2]MobileNet壓縮模型的研究與優(yōu)化[D]. 陳方.華中師范大學(xué) 2018
[3]基于卷積神經(jīng)網(wǎng)絡(luò)的人體姿態(tài)估計(jì)[D]. 張玉立.哈爾濱工程大學(xué) 2018
本文編號(hào):3547470
本文鏈接:http://sikaile.net/kejilunwen/shengwushengchang/3547470.html
最近更新
教材專著