基于人體關(guān)鍵點檢測的動作識別算法研究
發(fā)布時間:2021-01-30 18:48
人體動作識別在智能時代有著廣泛的應(yīng)用,而人體關(guān)鍵點檢測是動作識別領(lǐng)域中的熱門課題。然而基于人體關(guān)鍵點的動作識別領(lǐng)域仍存在一些待解決的問題。其一,通過二維圖像難以獲取準(zhǔn)確的人體關(guān)鍵點信息,因此本文提出了一種基于目標(biāo)分割網(wǎng)絡(luò)的人體關(guān)鍵點檢測方法,以提高人體關(guān)鍵點的檢測精度;其二,傳統(tǒng)方法難以尋找人體關(guān)鍵點和動作類別之間的映射關(guān)系,因此本文通過設(shè)計一個全連接神經(jīng)網(wǎng)絡(luò)以提取該映射關(guān)系,以實現(xiàn)準(zhǔn)確的動作分類。具體的研究內(nèi)容總結(jié)如下:(1)針對主流方法中存在檢測精度與實時性之間的矛盾,本文提出了基于改進Mask RCNN的人體關(guān)鍵點檢測方法。使用Mask RCNN網(wǎng)絡(luò)結(jié)構(gòu)中的掩模分支為關(guān)鍵點生成高質(zhì)量的預(yù)測掩模結(jié)果,從而準(zhǔn)確地定位人體關(guān)鍵點位置。實驗結(jié)果表明,該方法解決了自頂向下方法在多人場景中存在的漏檢問題,也避免了自底向上方法帶來的關(guān)鍵點匹配錯誤問題。(2)對人體關(guān)鍵點檢測算法進行了三方面的優(yōu)化改進:其一,針對網(wǎng)絡(luò)生成的人物目標(biāo)感興趣區(qū)域位置與真實值偏差大的問題,本文提出使用K-means聚類方法來改進錨點候選框尺寸的初始化方式,使生成的感興趣區(qū)域尺寸能夠更好地覆蓋人物目標(biāo);其二,針對人物密集...
【文章來源】:杭州電子科技大學(xué)浙江省
【文章頁數(shù)】:82 頁
【學(xué)位級別】:碩士
【部分圖文】:
OpenPose算法流程示意圖[32]
杭州電子科技大學(xué)碩士學(xué)位論文14圖2.4關(guān)鍵點匹配錯誤現(xiàn)象示意圖2.2主流數(shù)據(jù)集簡介2.2.1人物目標(biāo)檢測數(shù)據(jù)集目前學(xué)術(shù)界主流的行人檢測數(shù)據(jù)集主要有Caltech和INRIA[41]。其中Caltech數(shù)據(jù)集主要使用車載攝像頭采集道路交通行人數(shù)據(jù),人物距離較遠(yuǎn),人物數(shù)量稀疏且人的尺寸非常校但是,本文做人物目標(biāo)區(qū)域檢測是為了進一步做詳細(xì)的人體關(guān)鍵點檢測以及動作識別,所以需要的是清晰的近景人物圖像,因此沒有使用目前主流的行人檢測數(shù)據(jù)集Caltech,而使用了人物目標(biāo)更加清晰且人物在圖像中占比更大的INRIA數(shù)據(jù)集,該數(shù)據(jù)集包含尺寸不同、場景不同的行人圖片如圖2.5所示,且該數(shù)據(jù)集有正樣本和負(fù)樣本(不包含行人的樣本)之分。圖2.5INRIA數(shù)據(jù)集樣本圖片示意圖
杭州電子科技大學(xué)碩士學(xué)位論文152.2.2人體關(guān)鍵點檢測數(shù)據(jù)集隨著人體姿態(tài)識別、行為識別等一系列視覺研究任務(wù)的快速發(fā)展,目前國際上也出現(xiàn)越來越多的人體關(guān)鍵點檢測數(shù)據(jù)集,為了更好的對比本文提出的改進方法對算法性能的影響,并與主流人體關(guān)鍵點檢測算法進行對比,本文選用了三種目前主流的人體關(guān)鍵點檢測數(shù)據(jù)集,分別是LSP、MPII和MSCOCO。本小節(jié)將對三類數(shù)據(jù)集進行簡要的介紹。LSP是一個單人人體關(guān)鍵點檢測數(shù)據(jù)集,該數(shù)據(jù)集包含2000幅標(biāo)注了單人人體關(guān)鍵點的圖片,該數(shù)據(jù)集主要采集了一些運動員的動作。LSP數(shù)據(jù)集的圖片主要來源于圖片分享網(wǎng)站Flickr,并將圖片中的人物目標(biāo)都進行縮放,縮放到150像素大小,從而使人物大小突出。數(shù)據(jù)集為每個人標(biāo)注了14個人體關(guān)鍵點,且該數(shù)據(jù)集人物服裝色彩豐富、場景變化豐富。MPII同時包含單人關(guān)鍵點檢測和多人關(guān)鍵點檢測兩類數(shù)據(jù)集[42]。該數(shù)據(jù)集包含2萬多張圖片,人物數(shù)目超過4萬個,對于每個人物標(biāo)注出了16個人體關(guān)鍵點位置,該數(shù)據(jù)集的圖像內(nèi)容主要來自于視頻網(wǎng)站YouTube,針對的場景主要是人類的日常生活場景。但是,該數(shù)據(jù)集沒有提供相應(yīng)的驗證集,因此本文從訓(xùn)練集數(shù)據(jù)中分離出2958個人物目標(biāo)作為驗證集,保留剩下的人物作為訓(xùn)練集進行訓(xùn)練。圖2.6MSCOCO人體關(guān)鍵點示意圖動作識別數(shù)據(jù)集MSCOCO數(shù)據(jù)集是一個針對目標(biāo)檢測、語義分割、關(guān)鍵點檢測等多項視覺任務(wù)的龐大數(shù)據(jù)集[43],數(shù)據(jù)量十分的龐大,其中關(guān)于人體關(guān)鍵點檢測的訓(xùn)練集包括2萬張人物圖片、2.5萬個人體關(guān)鍵點,為每個人物分別標(biāo)注出18個關(guān)鍵點坐
本文編號:3009405
【文章來源】:杭州電子科技大學(xué)浙江省
【文章頁數(shù)】:82 頁
【學(xué)位級別】:碩士
【部分圖文】:
OpenPose算法流程示意圖[32]
杭州電子科技大學(xué)碩士學(xué)位論文14圖2.4關(guān)鍵點匹配錯誤現(xiàn)象示意圖2.2主流數(shù)據(jù)集簡介2.2.1人物目標(biāo)檢測數(shù)據(jù)集目前學(xué)術(shù)界主流的行人檢測數(shù)據(jù)集主要有Caltech和INRIA[41]。其中Caltech數(shù)據(jù)集主要使用車載攝像頭采集道路交通行人數(shù)據(jù),人物距離較遠(yuǎn),人物數(shù)量稀疏且人的尺寸非常校但是,本文做人物目標(biāo)區(qū)域檢測是為了進一步做詳細(xì)的人體關(guān)鍵點檢測以及動作識別,所以需要的是清晰的近景人物圖像,因此沒有使用目前主流的行人檢測數(shù)據(jù)集Caltech,而使用了人物目標(biāo)更加清晰且人物在圖像中占比更大的INRIA數(shù)據(jù)集,該數(shù)據(jù)集包含尺寸不同、場景不同的行人圖片如圖2.5所示,且該數(shù)據(jù)集有正樣本和負(fù)樣本(不包含行人的樣本)之分。圖2.5INRIA數(shù)據(jù)集樣本圖片示意圖
杭州電子科技大學(xué)碩士學(xué)位論文152.2.2人體關(guān)鍵點檢測數(shù)據(jù)集隨著人體姿態(tài)識別、行為識別等一系列視覺研究任務(wù)的快速發(fā)展,目前國際上也出現(xiàn)越來越多的人體關(guān)鍵點檢測數(shù)據(jù)集,為了更好的對比本文提出的改進方法對算法性能的影響,并與主流人體關(guān)鍵點檢測算法進行對比,本文選用了三種目前主流的人體關(guān)鍵點檢測數(shù)據(jù)集,分別是LSP、MPII和MSCOCO。本小節(jié)將對三類數(shù)據(jù)集進行簡要的介紹。LSP是一個單人人體關(guān)鍵點檢測數(shù)據(jù)集,該數(shù)據(jù)集包含2000幅標(biāo)注了單人人體關(guān)鍵點的圖片,該數(shù)據(jù)集主要采集了一些運動員的動作。LSP數(shù)據(jù)集的圖片主要來源于圖片分享網(wǎng)站Flickr,并將圖片中的人物目標(biāo)都進行縮放,縮放到150像素大小,從而使人物大小突出。數(shù)據(jù)集為每個人標(biāo)注了14個人體關(guān)鍵點,且該數(shù)據(jù)集人物服裝色彩豐富、場景變化豐富。MPII同時包含單人關(guān)鍵點檢測和多人關(guān)鍵點檢測兩類數(shù)據(jù)集[42]。該數(shù)據(jù)集包含2萬多張圖片,人物數(shù)目超過4萬個,對于每個人物標(biāo)注出了16個人體關(guān)鍵點位置,該數(shù)據(jù)集的圖像內(nèi)容主要來自于視頻網(wǎng)站YouTube,針對的場景主要是人類的日常生活場景。但是,該數(shù)據(jù)集沒有提供相應(yīng)的驗證集,因此本文從訓(xùn)練集數(shù)據(jù)中分離出2958個人物目標(biāo)作為驗證集,保留剩下的人物作為訓(xùn)練集進行訓(xùn)練。圖2.6MSCOCO人體關(guān)鍵點示意圖動作識別數(shù)據(jù)集MSCOCO數(shù)據(jù)集是一個針對目標(biāo)檢測、語義分割、關(guān)鍵點檢測等多項視覺任務(wù)的龐大數(shù)據(jù)集[43],數(shù)據(jù)量十分的龐大,其中關(guān)于人體關(guān)鍵點檢測的訓(xùn)練集包括2萬張人物圖片、2.5萬個人體關(guān)鍵點,為每個人物分別標(biāo)注出18個關(guān)鍵點坐
本文編號:3009405
本文鏈接:http://sikaile.net/kejilunwen/shengwushengchang/3009405.html
最近更新
教材專著