局部時(shí)空特征及部件的視頻人體動(dòng)作識(shí)別方法研究
本文關(guān)鍵詞:局部時(shí)空特征及部件的視頻人體動(dòng)作識(shí)別方法研究,,由筆耕文化傳播整理發(fā)布。
【摘要】:視頻中人體動(dòng)作識(shí)別旨在利用計(jì)算機(jī)自動(dòng)分析視頻數(shù)據(jù),從中提取與人體動(dòng)作相關(guān)的信息,達(dá)到分析與理解視頻的目的,是計(jì)算機(jī)視覺領(lǐng)域的一個(gè)活躍研究主題,具有廣泛的潛在應(yīng)用場(chǎng)景,如智能視頻監(jiān)控、基于內(nèi)容的視頻分析、智能監(jiān)護(hù)和人機(jī)交互等。近年來,人體動(dòng)作識(shí)別研究取得了豐富的研究成果。由于該問題的復(fù)雜多樣性,已有的研究方法存在著缺點(diǎn)和不足,自動(dòng)識(shí)別人體動(dòng)作的技術(shù)還處在不斷探索之中。人體動(dòng)作識(shí)別作為一個(gè)分類問題,視頻特征提取與表達(dá)是有效識(shí)別的關(guān)鍵一環(huán)。本文從特征提取與表達(dá)出發(fā),在已有工作基礎(chǔ)上提出新的方法和思路。主要?jiǎng)?chuàng)新點(diǎn)歸納如下:①提出了一種基于上下文結(jié)構(gòu)信息的動(dòng)作表示方法。詞袋模型采用矢量量化技術(shù)將局部特征量化至最近鄰的視覺單詞,產(chǎn)生較大的量化誤差。此外,詞袋模型對(duì)局部特征進(jìn)行全局統(tǒng)計(jì),忽略了時(shí)空興趣點(diǎn)的時(shí)空分布。針對(duì)量化誤差問題,首先推廣后驗(yàn)概率編碼框架,基于該框架分析了已有的編碼方法。在此基礎(chǔ)上,提出一種新的后驗(yàn)概率編碼方法。該編碼方法編碼時(shí)不僅考慮了視覺單詞與特征向量之間的空間相似性,而且考慮了它們之間的線性相似性,能更好的捕捉豐富的局部流形信息。在該編碼方法基礎(chǔ)上,計(jì)算興趣點(diǎn)局部上下文范圍內(nèi)興趣點(diǎn)的空間分布和時(shí)間順序分布,形成累計(jì)概率直方圖特征,描述興趣點(diǎn)的時(shí)空分布。在多個(gè)標(biāo)準(zhǔn)數(shù)據(jù)庫(kù)上的實(shí)驗(yàn)表明,作為局部特征的互補(bǔ)特征,累計(jì)概率直方圖特征不僅提高了動(dòng)作識(shí)別的正確率,而且具有較好的魯棒性。②提出了一種判別核字典學(xué)習(xí)框架。基于局部特征的字典學(xué)習(xí)識(shí)別人體動(dòng)作包含三個(gè)獨(dú)立步驟:字典學(xué)習(xí)、特征編碼和池化。忽略了這三個(gè)步驟彼此之間的影響,不能針對(duì)分類任務(wù)學(xué)習(xí)最佳判別字典,使得特征編碼判別力較低;且傳統(tǒng)字典學(xué)習(xí)方法是在線性空間進(jìn)行訓(xùn)練,不能有效處理非線性數(shù)據(jù)。針對(duì)這些問題,提出的判別字典學(xué)習(xí)框架融合這三個(gè)獨(dú)立步驟,形成一個(gè)統(tǒng)一的目標(biāo)函數(shù)。通過同時(shí)最優(yōu)化,減少三個(gè)獨(dú)立步驟彼此之間的影響,增強(qiáng)了特征編碼的判別力。此外,在學(xué)習(xí)判別字典的同時(shí)學(xué)習(xí)了一個(gè)線性分類器。采用雙字典模型對(duì)框架進(jìn)行核推廣,將特征非線性映射到高維特征空間,增強(qiáng)該框架處理非線性數(shù)據(jù)的能力。實(shí)驗(yàn)證明了該框架的有效性。③提出了一種基于幀間編碼系數(shù)變化的動(dòng)作表示方法。觀察到視頻幀間編碼系數(shù)的變化反映了視頻運(yùn)動(dòng)信息的變化,對(duì)視頻幀間編碼系數(shù)變化進(jìn)行統(tǒng)計(jì)可有效捕捉視頻中的運(yùn)動(dòng)信息,特別是時(shí)間變化信息。采用空間金字塔模型將視頻在空間維度分割成多個(gè)單元,對(duì)每個(gè)單元連續(xù)幀間編碼系數(shù)在時(shí)間上的變大和變小變化進(jìn)行統(tǒng)計(jì),統(tǒng)計(jì)的直方圖特征用基于空間金字塔匹配核的支持向量機(jī)進(jìn)行分類。與其他動(dòng)作表示方法相比,這種特征具有較強(qiáng)的魯棒性,容易計(jì)算,且不依賴于特定的編碼方法。④提出了一種新的基于隱變量支持向量機(jī)的判別模型。將視頻表示成稠密的時(shí)空部件,觀察到動(dòng)作可由一組判別時(shí)空部件聯(lián)合區(qū)分。定義時(shí)空部件為隱變量,引入組稀疏正則化技術(shù),通過最優(yōu)化刪除判別力低的時(shí)空部件檢測(cè)器,達(dá)到同時(shí)學(xué)習(xí)和選擇一組判別時(shí)空部件檢測(cè)器的目的。針對(duì)時(shí)空部件檢測(cè)器冗余問題,引入類內(nèi)非相關(guān)性約束。針對(duì)判別部件一致性問題,引入相似性約束促使同類動(dòng)作視頻中檢測(cè)到的時(shí)空部件盡可能的一致,并提出一個(gè)迭代算法快速求解帶有相似性約束的隱變量。實(shí)驗(yàn)結(jié)果表明,檢測(cè)到的時(shí)空部件具有判別性,且在多個(gè)數(shù)據(jù)庫(kù)上取得了較好的識(shí)別效果。
【關(guān)鍵詞】:人體動(dòng)作識(shí)別 上下文 判別字典學(xué)習(xí) 特征編碼 隱變量支持向量機(jī)
【學(xué)位授予單位】:重慶大學(xué)
【學(xué)位級(jí)別】:博士
【學(xué)位授予年份】:2015
【分類號(hào)】:TP391.41
【目錄】:
- 中文摘要3-5
- ABSTRACT5-11
- 1 緒論11-31
- 1.1 課題研究背景及意義11-12
- 1.2 人體動(dòng)作識(shí)別問題的描述12-14
- 1.3 國(guó)內(nèi)外研究現(xiàn)狀14-24
- 1.3.1 特征提取與表達(dá)14-21
- 1.3.2 動(dòng)作分類21-24
- 1.4 人體動(dòng)作數(shù)據(jù)庫(kù)24-27
- 1.5 本文主要研究?jī)?nèi)容與結(jié)構(gòu)安排27-31
- 2 基于興趣點(diǎn)上下文結(jié)構(gòu)信息的人體動(dòng)作識(shí)別31-51
- 2.1 引言31-32
- 2.2 已有研究介紹32-35
- 2.2.1 特征編碼32-34
- 2.2.2 興趣點(diǎn)時(shí)空結(jié)構(gòu)34-35
- 2.3 興趣點(diǎn)上下文結(jié)構(gòu)信息35-44
- 2.3.1 后驗(yàn)概率編碼35-38
- 2.3.2 累計(jì)概率直方圖38-40
- 2.3.3 動(dòng)作分類40-44
- 2.4 實(shí)驗(yàn)與分析44-50
- 2.4.1 實(shí)驗(yàn)設(shè)計(jì)44-45
- 2.4.2 KTH數(shù)據(jù)庫(kù)動(dòng)作分類實(shí)驗(yàn)45-47
- 2.4.3 ADL數(shù)據(jù)庫(kù)動(dòng)作分類實(shí)驗(yàn)47-48
- 2.4.4 UCF Sports數(shù)據(jù)庫(kù)動(dòng)作分類實(shí)驗(yàn)48
- 2.4.5 HMDB51數(shù)據(jù)庫(kù)動(dòng)作分類實(shí)驗(yàn)48-50
- 2.5 本章小結(jié)50-51
- 3 基于判別核字典學(xué)習(xí)的人體動(dòng)作識(shí)別51-71
- 3.1 引言51-52
- 3.2 已有研究介紹52-58
- 3.2.1 字典學(xué)習(xí)模型52-57
- 3.2.2 協(xié)作表示57-58
- 3.3 基于判別核字典學(xué)習(xí)的人體動(dòng)作識(shí)別58-66
- 3.3.1 判別核字典學(xué)習(xí)框架58-59
- 3.3.2 最優(yōu)化方法59-64
- 3.3.3 編碼系數(shù)時(shí)間變化特征64-65
- 3.3.4 動(dòng)作分類65-66
- 3.4 實(shí)驗(yàn)與分析66-69
- 3.4.1 實(shí)驗(yàn)設(shè)計(jì)66
- 3.4.2 KTH數(shù)據(jù)庫(kù)動(dòng)作分類實(shí)驗(yàn)66-67
- 3.4.3 UCF Sports數(shù)據(jù)庫(kù)動(dòng)作分類實(shí)驗(yàn)67
- 3.4.4 HMDB51數(shù)據(jù)庫(kù)動(dòng)作分類實(shí)驗(yàn)67-69
- 3.5 本章小結(jié)69-71
- 4 基于判別時(shí)空部件的人體動(dòng)作識(shí)別71-89
- 4.1 引言71-72
- 4.2 已有研究介紹72-75
- 4.2.1 基于部件的人體動(dòng)作識(shí)別73-74
- 4.2.2 隱變量支持向量機(jī)74-75
- 4.3 基于判別時(shí)空部件的人體動(dòng)作識(shí)別75-82
- 4.3.1 視頻時(shí)空部件提取與描述77
- 4.3.2 多類隱變量支持向量機(jī)77
- 4.3.3 判別時(shí)空部件學(xué)習(xí)模型77-79
- 4.3.4 最優(yōu)化方法79-81
- 4.3.5 動(dòng)作分類81-82
- 4.4 實(shí)驗(yàn)與分析82-87
- 4.4.1 實(shí)驗(yàn)設(shè)計(jì)82
- 4.4.2 KTH數(shù)據(jù)庫(kù)動(dòng)作分類實(shí)驗(yàn)82-84
- 4.4.3 UCF Sports數(shù)據(jù)庫(kù)動(dòng)作分類實(shí)驗(yàn)84-86
- 4.4.4 HMDB51數(shù)據(jù)庫(kù)動(dòng)作分類實(shí)驗(yàn)86-87
- 4.5 本章小結(jié)87-89
- 5 特征融合實(shí)驗(yàn)與分析89-95
- 5.1 引言89
- 5.2 特征融合89-90
- 5.2.1 特征級(jí)融合89
- 5.2.2 匹配分?jǐn)?shù)級(jí)融合89-90
- 5.3 融合實(shí)驗(yàn)與結(jié)果分析90-91
- 5.4 本章小結(jié)91-95
- 6 總結(jié)與展望95-99
- 6.1 本文工作總結(jié)95-96
- 6.2 后續(xù)工作展望96-99
- 致謝99-101
- 參考文獻(xiàn)101-117
- 附錄117
- A作者在攻讀博士學(xué)位期間參加的科研項(xiàng)目117
- B作者在攻讀博士學(xué)位期間發(fā)表論文情況117
【參考文獻(xiàn)】
中國(guó)期刊全文數(shù)據(jù)庫(kù) 前7條
1 王宇新;郭禾;何昌欽;馮振;賈棋;;用于圖像場(chǎng)景分類的空間視覺詞袋模型[J];計(jì)算機(jī)科學(xué);2011年08期
2 錢X;馬旭東;戴先中;;基于抽象隱馬爾可夫模型的運(yùn)動(dòng)行為識(shí)別方法[J];模式識(shí)別與人工智能;2009年03期
3 申曉霞;張樺;高贊;徐光平;薛彥兵;張哲;;基于深度信息和RGB圖像的行為識(shí)別算法[J];模式識(shí)別與人工智能;2013年08期
4 胡瓊;秦磊;黃慶明;;基于視覺的人體動(dòng)作識(shí)別綜述[J];計(jì)算機(jī)學(xué)報(bào);2013年12期
5 段菲;章毓晉;;一種面向稀疏表示的最大間隔字典學(xué)習(xí)算法[J];清華大學(xué)學(xué)報(bào)(自然科學(xué)版);2012年04期
6 胡長(zhǎng)勃,馮濤,馬頌德,盧漢清;基于主元分析法的行為識(shí)別[J];中國(guó)圖象圖形學(xué)報(bào);2000年10期
7 徐光yP;曹媛媛;;動(dòng)作識(shí)別與行為理解綜述[J];中國(guó)圖象圖形學(xué)報(bào);2009年02期
本文關(guān)鍵詞:局部時(shí)空特征及部件的視頻人體動(dòng)作識(shí)別方法研究,由筆耕文化傳播整理發(fā)布。
本文編號(hào):347737
本文鏈接:http://sikaile.net/shoufeilunwen/xxkjbs/347737.html