基于骨架信息的人體動(dòng)作識(shí)別
本文選題:人體動(dòng)作識(shí)別 + 人體骨架 ; 參考:《中國(guó)科學(xué)技術(shù)大學(xué)》2017年碩士論文
【摘要】:人體動(dòng)作識(shí)別是計(jì)算機(jī)視覺(jué)領(lǐng)域一大熱門(mén)的研究方向。其主要目的是對(duì)視頻中的人體動(dòng)作進(jìn)行正確地分類(lèi)。這項(xiàng)技術(shù)可以被應(yīng)用到智能視頻監(jiān)控、人機(jī)自然交互、運(yùn)動(dòng)視頻分析以及無(wú)人駕駛等領(lǐng)域。然而如何構(gòu)造有效的特征來(lái)對(duì)視頻當(dāng)中的人體動(dòng)作進(jìn)行描述一直是一個(gè)非常有挑戰(zhàn)性的問(wèn)題。本文通過(guò)對(duì)人體骨架信息進(jìn)行深入挖掘,提出了基于關(guān)節(jié)點(diǎn)位置的動(dòng)力學(xué)和關(guān)系特征,這組特征由4大類(lèi)特征、36種子特征構(gòu)成。1.關(guān)節(jié)動(dòng)力學(xué)特征:這一大類(lèi)特征由速度、加速度、角速度、角加速度、速率、加速率、動(dòng)能、動(dòng)能變化、重力勢(shì)能、重力勢(shì)能變化、總能量、總能量變化、歸一化位置等13種子特征構(gòu)成,這組特征從關(guān)節(jié)點(diǎn)運(yùn)動(dòng)和能量變化的角度出發(fā),充分地挖掘了人體骨架的動(dòng)力學(xué)信息。2.相關(guān)關(guān)系特征:這一大類(lèi)特征由速度相關(guān)關(guān)系、加速度相關(guān)關(guān)系、角速度相關(guān)關(guān)系、角加速度相關(guān)關(guān)系,能量變化相關(guān)關(guān)系等5種子特征構(gòu)成,這組特征描述了任意一對(duì)關(guān)節(jié)點(diǎn)之間的運(yùn)動(dòng)相關(guān)關(guān)系和能量變化相關(guān)關(guān)系。3.距離關(guān)系特征:這一大類(lèi)特征由水平距離關(guān)系及其軌跡、垂直距離關(guān)系及其軌跡、方向正弦距離關(guān)系及其軌跡、方向余弦距離關(guān)系及其軌跡、特征向量方向距離關(guān)系及其軌跡、連通距離關(guān)系及其軌跡等12種子特征構(gòu)成,這組特征描述了任意一對(duì)關(guān)節(jié)點(diǎn)在特定方向上的距離關(guān)系。4.幾何關(guān)系特征:這一大類(lèi)特征由關(guān)節(jié)向量?jī)?nèi)積及其軌跡、關(guān)節(jié)向量余弦相關(guān)性及其軌跡、關(guān)節(jié)三角形面積周長(zhǎng)比及其軌跡等6種子特征構(gòu)成構(gòu)成,這組特征描述了任意三個(gè)關(guān)節(jié)點(diǎn)之間幾何關(guān)系。將這些特征合并在一起構(gòu)成基于關(guān)節(jié)點(diǎn)位置的動(dòng)力學(xué)和關(guān)系特征。本文對(duì)這組特征的各個(gè)子特征進(jìn)行了全面的比較。這組特征在JHMDB數(shù)據(jù)集、sub-JHMDB數(shù)據(jù)集和Penn Action數(shù)據(jù)集上均取得了不錯(cuò)的效果。此外,由于動(dòng)作識(shí)別系統(tǒng)中每個(gè)環(huán)節(jié)都會(huì)對(duì)最后的識(shí)別結(jié)果產(chǎn)生一定的影響,因此本文探索了適合基于關(guān)節(jié)點(diǎn)位置的動(dòng)力學(xué)和關(guān)系特征的動(dòng)作識(shí)別算法框架。其中最合適的詞袋模型為基于K均值聚類(lèi)和向量量化的詞袋模型,最有效的分類(lèi)模型為多通道的RBF-χ2核的支持向量機(jī)。總而言之,通過(guò)充分挖掘骨架信息,本文提出了一組基于關(guān)節(jié)點(diǎn)位置的動(dòng)力學(xué)和相關(guān)關(guān)系特征,并探索了適合這一特征的詞袋模型和分類(lèi)模型。通過(guò)充分的實(shí)驗(yàn)驗(yàn)證了這組特征的有效性,也為下一步利用基于骨架信息對(duì)人體動(dòng)作進(jìn)行識(shí)別的研究工作提供了建議。
[Abstract]:Human motion recognition is a hot research direction in the field of computer vision.Its main purpose is to correctly classify human actions in video.This technology can be applied to intelligent video surveillance, human-computer natural interaction, motion video analysis and driverless.However, how to construct effective features to describe human actions in video has been a very challenging problem.In this paper, a dynamic and relational feature based on the location of the gate node is proposed by mining the skeleton information of the human body.Joint dynamics: this broad category of characteristics consists of velocity, acceleration, angular velocity, angular acceleration, rate, acceleration rate, kinetic energy, kinetic energy change, gravity potential energy, gravity potential energy change, total energy, total energy change,The normalized position and other 13 seed features are formed. This set of features fully excavates the dynamic information of the human skeleton from the point of view of the movement and energy change of the node.Correlation characteristics: this kind of feature is composed of five characteristics: velocity correlation, acceleration correlation, angular velocity correlation, angular acceleration correlation, energy variation correlation, etc.This set of features describes the kinematic and energy-dependent relationships between any pair of nodes.The feature of distance relation: this kind of feature consists of horizontal distance relation and its trajectory, vertical distance relation and its trajectory, directional sinusoidal distance relationship and its trajectory, directional cosine distance relationship and its trajectory, characteristic vector directional distance relation and its trajectory.The connected distance relation and its trace are composed of 12 seed features, which describe the distance relation of any pair of nodes in a particular direction.Geometric relation feature: this kind of feature is composed of 6 seed features, such as joint vector inner product and its trajectory, joint vector cosine correlation and its trajectory, joint triangle area / circumference ratio and its trajectory, etc.This set of features describes the geometric relationship between any three nodes.These features are combined to form dynamic and relational features based on the location of the node.This paper makes a comprehensive comparison of each subfeature of this set of features.This set of features has achieved good results on JHMDB data sets sub-JHMDB datasets and Penn Action datasets.In addition, because every link in the motion recognition system will have a certain impact on the final recognition results, this paper explores an action recognition algorithm framework that is suitable for dynamic and relational features based on the location of the node.The most suitable word bag model is based on K-means clustering and vector quantization, and the most effective classification model is multi-channel RBF- 蠂 2 kernel support vector machine.In a word, by fully mining the skeleton information, this paper proposes a set of dynamics and correlation features based on the location of the node, and explores the word bag model and classification model suitable for this feature.The validity of this set of features is verified by experiments, and some suggestions are provided for the further research on the recognition of human actions based on skeleton information.
【學(xué)位授予單位】:中國(guó)科學(xué)技術(shù)大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2017
【分類(lèi)號(hào)】:TP391.41
【相似文獻(xiàn)】
相關(guān)期刊論文 前10條
1 袁飛;程韜波;周松斌;肖先文;;基于加速度特征的可拓動(dòng)作識(shí)別方法[J];自動(dòng)化與信息工程;2009年04期
2 胡雅琴;;動(dòng)作識(shí)別技術(shù)及其發(fā)展[J];電視技術(shù);2013年S2期
3 倪世宏,史忠科,謝川,王彥鴻;軍用戰(zhàn)機(jī)機(jī)動(dòng)飛行動(dòng)作識(shí)別知識(shí)庫(kù)的建立[J];計(jì)算機(jī)仿真;2005年04期
4 程祥;;人體動(dòng)作識(shí)別的研究[J];電腦知識(shí)與技術(shù);2006年20期
5 黃飛躍;徐光yP;;視角無(wú)關(guān)的動(dòng)作識(shí)別[J];軟件學(xué)報(bào);2008年07期
6 徐光yP;曹媛媛;;動(dòng)作識(shí)別與行為理解綜述[J];中國(guó)圖象圖形學(xué)報(bào);2009年02期
7 黃麗鴻;高智勇;劉海華;;基于脈沖神經(jīng)網(wǎng)絡(luò)的人體動(dòng)作識(shí)別[J];現(xiàn)代科學(xué)儀器;2012年02期
8 周艷青;王磊;;基于視覺(jué)的人體動(dòng)作識(shí)別綜述[J];山東輕工業(yè)學(xué)院學(xué)報(bào)(自然科學(xué)版);2012年01期
9 曹琨;;基于檢索表的實(shí)時(shí)動(dòng)作識(shí)別技術(shù)研究[J];中外企業(yè)家;2014年05期
10 劉博;安建成;;基于關(guān)鍵姿勢(shì)的人體動(dòng)作識(shí)別[J];電視技術(shù);2014年05期
相關(guān)會(huì)議論文 前7條
1 袁飛;程韜波;周松斌;肖先文;;基于加速度特征的可拓動(dòng)作識(shí)別方法[A];廣州市儀器儀表學(xué)會(huì)2009年學(xué)術(shù)年會(huì)論文集[C];2010年
2 黃飛躍;徐光yP;;自然的人體動(dòng)作識(shí)別[A];第三屆和諧人機(jī)環(huán)境聯(lián)合學(xué)術(shù)會(huì)議(HHME2007)論文集[C];2007年
3 葉喜勇;陶霖密;王國(guó)建;邸慧軍;;視角無(wú)關(guān)的人體軀干動(dòng)作識(shí)別[A];第六屆和諧人機(jī)環(huán)境聯(lián)合學(xué)術(shù)會(huì)議(HHME2010)、第19屆全國(guó)多媒體學(xué)術(shù)會(huì)議(NCMT2010)、第6屆全國(guó)人機(jī)交互學(xué)術(shù)會(huì)議(CHCI2010)、第5屆全國(guó)普適計(jì)算學(xué)術(shù)會(huì)議(PCC2010)論文集[C];2010年
4 黃艷歡;葉少珍;;連續(xù)動(dòng)作分割綜述[A];第十四屆全國(guó)圖象圖形學(xué)學(xué)術(shù)會(huì)議論文集[C];2008年
5 董力賡;陶霖密;徐光yP;;頭部姿態(tài)和動(dòng)作的識(shí)別與理解[A];第三屆和諧人機(jī)環(huán)境聯(lián)合學(xué)術(shù)會(huì)議(HHME2007)論文集[C];2007年
6 朱巖;趙旭;劉允才;;基于稀疏編碼和局部時(shí)空特征的人體動(dòng)作識(shí)別[A];第十五屆全國(guó)圖象圖形學(xué)學(xué)術(shù)會(huì)議論文集[C];2010年
7 席旭剛;金燕;朱海港;高云園;;基于小波包熵和支持向量機(jī)的手部肌電信號(hào)動(dòng)作識(shí)別[A];2013年中國(guó)智能自動(dòng)化學(xué)術(shù)會(huì)議論文集(第五分冊(cè))[C];2013年
相關(guān)重要報(bào)紙文章 前2條
1 本報(bào)記者 陳丹;人與機(jī)器的“對(duì)話”[N];科技日?qǐng)?bào);2010年
2 ;凌空敲鍵盤(pán)?無(wú)線計(jì)算機(jī)手套問(wèn)世[N];中國(guó)計(jì)算機(jī)報(bào);2004年
相關(guān)博士學(xué)位論文 前10條
1 諶先敢;現(xiàn)實(shí)環(huán)境下的人體動(dòng)作識(shí)別[D];武漢大學(xué);2012年
2 陳淵博;視頻序列中的人體動(dòng)作識(shí)別[D];北京郵電大學(xué);2015年
3 劉翠微;視頻中人的動(dòng)作分析與理解[D];北京理工大學(xué);2015年
4 陳萌;基于李代數(shù)高斯表示的動(dòng)作識(shí)別方法研究[D];華中科技大學(xué);2016年
5 李擬s,
本文編號(hào):1754428
本文鏈接:http://sikaile.net/shoufeilunwen/xixikjs/1754428.html