基于軌跡時空匹配的動作識別算法研究
本文關鍵詞:基于軌跡時空匹配的動作識別算法研究 出處:《華東師范大學》2017年碩士論文 論文類型:學位論文
【摘要】:動作識別在諸多領域有廣泛的潛在應用,例如智能視頻監(jiān)控,視頻檢索,人機交互等,近年來已經(jīng)成為計算機視覺領域的一個研究熱點。盡管許多學者在這方面已經(jīng)做了非常多的工作,然而它仍然是計算機視覺的一個難點。首先,存在因運動速度的不同,視角變化和背景噪聲引起的巨大的類內(nèi)變化。其次,類別的定義建立在動作的概念和語義之上,底層視頻特征和高級語義之間存在的偏差使得分類變得非常困難。在動作識別領域已經(jīng)出現(xiàn)非常多優(yōu)秀的方法,其中密集軌跡作為一種高魯棒性的底層特征和Fisher Vector作為一個通用的組合被廣泛應用于動作識別,并在許多公共數(shù)據(jù)集上取得了優(yōu)異的表現(xiàn)。它構建基于高斯混合模型(Gaussian Mixture Model,GMM)的字典來表示視頻中軌跡的分布,然后將其用于對給定視頻的軌跡進行編碼。由于對視頻中的所有軌跡進行無序編碼,從而忽略了不同軌跡之間的時空位置關系。為了彌補時空信息的丟失,本文提出了兩種不同軌跡匹配算法來捕獲丟失的時空位置關系,即:基于KNN的特征匹配策略和基于堆積的特征匹配策略。首先,我們定義了一個軌跡距離來衡量兩條軌跡之間的關系。然后,執(zhí)行本文提出的特征匹配策略對軌跡進行匹配,對于匹配之后的成對軌跡,我們采用平均池策略(average pooling strategy)來進行特征融合得到本文提出的時空配對軌跡(Space-time Pairwise Trajectories,SPT)。然后用 GMM 和 Fisher Vector 對 SPT進行編碼。SPT包含了每條軌跡周圍的局部時空信息,從而使得SPT比原始的密集軌跡的特征更具有判別性。我們在四個被廣泛應用的公共數(shù)據(jù)集(Olympic Sports,HMDB51,UCF50,UCF101)上進行實驗,實驗結果證明我們提出的SPT的表現(xiàn)優(yōu)于當前優(yōu)秀的方法。
[Abstract]:Action recognition has potential application in a wide variety of fields, such as intelligent video surveillance, video retrieval, human-computer interaction, in recent years has become a hot research topic in the field of computer vision. Although many scholars have done a lot of work in this area, but it is still a difficult problem in computer vision. First of all, due to different velocities, caused by the change of angle change and background noise of the huge class. Secondly, the definitions of the categories based on concepts and semantic actions, partial job exists between the bottom of the video features and the high-level semantic classification have become very difficult. In the field of action recognition has been a very good number of methods, including dense trajectories as low-level features and Fisher Vector a high robustness as a generic combination is widely used in action recognition, and in many public data sets Excellent performance. It builds the Gauss mixture model based on (Gaussian Mixture Model, GMM) the dictionary said in the video distribution path, which is then used for a given video encoding. Because of the track of the disorder on all track in video encoding, which ignores the relationship between different space-time position trajectory for the missing. For temporal information, this paper presents two different path matching algorithm to capture the spatial position relation, namely: loss of KNN feature matching strategy and matching based on the feature of accumulation based on strategy. First, we define a path to measure the distance between two paths. Then, implementation of the proposed feature matching strategy of trajectory matching for paired trajectory matching after, we use the average pool strategy (average pooling strategy) for feature fusion of the time The empty pair (Space-time Pairwise Trajectories, SPT locus). Then GMM and Fisher Vector of SPT encoding.SPT contains local spatio-temporal information around each trajectory, so that the SPT is more discriminative than characteristic trajectory. The original intensive public data in four widely used set (Olympic Sports, HMDB51, UCF50, UCF101) on the experiment, the experimental results show that our proposed method performs better than the current SPT good.
【學位授予單位】:華東師范大學
【學位級別】:碩士
【學位授予年份】:2017
【分類號】:TP391.41
【相似文獻】
相關期刊論文 前10條
1 袁飛;程韜波;周松斌;肖先文;;基于加速度特征的可拓動作識別方法[J];自動化與信息工程;2009年04期
2 胡雅琴;;動作識別技術及其發(fā)展[J];電視技術;2013年S2期
3 倪世宏,史忠科,謝川,王彥鴻;軍用戰(zhàn)機機動飛行動作識別知識庫的建立[J];計算機仿真;2005年04期
4 程祥;;人體動作識別的研究[J];電腦知識與技術;2006年20期
5 黃飛躍;徐光yP;;視角無關的動作識別[J];軟件學報;2008年07期
6 徐光yP;曹媛媛;;動作識別與行為理解綜述[J];中國圖象圖形學報;2009年02期
7 黃麗鴻;高智勇;劉海華;;基于脈沖神經(jīng)網(wǎng)絡的人體動作識別[J];現(xiàn)代科學儀器;2012年02期
8 周艷青;王磊;;基于視覺的人體動作識別綜述[J];山東輕工業(yè)學院學報(自然科學版);2012年01期
9 曹琨;;基于檢索表的實時動作識別技術研究[J];中外企業(yè)家;2014年05期
10 劉博;安建成;;基于關鍵姿勢的人體動作識別[J];電視技術;2014年05期
相關會議論文 前7條
1 袁飛;程韜波;周松斌;肖先文;;基于加速度特征的可拓動作識別方法[A];廣州市儀器儀表學會2009年學術年會論文集[C];2010年
2 黃飛躍;徐光yP;;自然的人體動作識別[A];第三屆和諧人機環(huán)境聯(lián)合學術會議(HHME2007)論文集[C];2007年
3 葉喜勇;陶霖密;王國建;邸慧軍;;視角無關的人體軀干動作識別[A];第六屆和諧人機環(huán)境聯(lián)合學術會議(HHME2010)、第19屆全國多媒體學術會議(NCMT2010)、第6屆全國人機交互學術會議(CHCI2010)、第5屆全國普適計算學術會議(PCC2010)論文集[C];2010年
4 黃艷歡;葉少珍;;連續(xù)動作分割綜述[A];第十四屆全國圖象圖形學學術會議論文集[C];2008年
5 董力賡;陶霖密;徐光yP;;頭部姿態(tài)和動作的識別與理解[A];第三屆和諧人機環(huán)境聯(lián)合學術會議(HHME2007)論文集[C];2007年
6 朱巖;趙旭;劉允才;;基于稀疏編碼和局部時空特征的人體動作識別[A];第十五屆全國圖象圖形學學術會議論文集[C];2010年
7 席旭剛;金燕;朱海港;高云園;;基于小波包熵和支持向量機的手部肌電信號動作識別[A];2013年中國智能自動化學術會議論文集(第五分冊)[C];2013年
相關重要報紙文章 前2條
1 本報記者 陳丹;人與機器的“對話”[N];科技日報;2010年
2 ;凌空敲鍵盤?無線計算機手套問世[N];中國計算機報;2004年
相關博士學位論文 前10條
1 諶先敢;現(xiàn)實環(huán)境下的人體動作識別[D];武漢大學;2012年
2 陳淵博;視頻序列中的人體動作識別[D];北京郵電大學;2015年
3 劉翠微;視頻中人的動作分析與理解[D];北京理工大學;2015年
4 陳萌;基于李代數(shù)高斯表示的動作識別方法研究[D];華中科技大學;2016年
5 李擬s,
本文編號:1385423
本文鏈接:http://sikaile.net/shoufeilunwen/xixikjs/1385423.html