視頻序列中人體行為的特征提取與識別方法研究
發(fā)布時間:2021-11-03 00:21
基于視頻序列的行為識別(以下簡稱行為識別)是計算機(jī)視覺領(lǐng)域研究的熱點(diǎn)課題之一,具有十分重要的理論研究價值和廣闊的應(yīng)用前景。由于人體行為的復(fù)雜性和多樣性,目前仍有兩方面的問題亟待解決,一是類內(nèi)與類間的不確定性導(dǎo)致對相似行為的識別混淆程度較高;二是長視頻序列中存在不規(guī)律的可預(yù)測性,特別是當(dāng)主體行為由多個子行為共同構(gòu)成時,子行為的分布狀態(tài)對識別效果的影響較大。對此,本文主要從特征提取與行為分類兩方面進(jìn)行研究,本文的主要成果包括以下方面:1.提出了基于局部時空協(xié)方差矩陣特征的行為識別算法。傳統(tǒng)的特征級聯(lián)可以視作特征向量在單一維度上的簡單堆疊,這種特征融合方式通常無法對時空域特征的關(guān)聯(lián)性作出準(zhǔn)確描述。為此,論文通過在局部范圍內(nèi),對空域梯度特征與時域梯度特征作協(xié)方差矩陣融合,增強(qiáng)了外觀信息與行為信息在同一時刻的聯(lián)合表達(dá)能力,提高了特征的判別性,這對行為識別具有重要意義。但協(xié)方差矩陣屬于黎曼空間,無法使用傳統(tǒng)的歐氏空間的度量方式進(jìn)行量化,通過研究發(fā)現(xiàn)運(yùn)用對數(shù)歐氏運(yùn)算可以將黎曼空間下的協(xié)方差矩陣映射至歐氏向量空間。實(shí)驗(yàn)證實(shí)了協(xié)方差矩陣融合特征明顯優(yōu)于傳統(tǒng)的級聯(lián)特征。2.提出了基于低秩稀疏聯(lián)合表達(dá)的行為...
【文章來源】:電子科技大學(xué)四川省 211工程院校 985工程院校 教育部直屬院校
【文章頁數(shù)】:132 頁
【學(xué)位級別】:博士
【部分圖文】:
UCFSports數(shù)據(jù)集的樣本幀
第一章緒論圖1-4UCFSports數(shù)據(jù)集的樣本幀圖1-5ADL數(shù)據(jù)集的樣本幀600個視頻序列。2.ActivityofDailyLiving(ADL)數(shù)據(jù)集ADL數(shù)據(jù)集[72]由羅切斯特大學(xué)的Messing等人提供,共包含150個行為視頻,由5個行為主體在廚房環(huán)境中執(zhí)行10類日常行為,且均為單人與物品之間的交互行為,包括接電話(Answering-phone)、撥電話(Dialing-phone)、查電話簿(Checkingphone-book)、喝水(Drinking)、吃零食(Eating-snack)、用餐具(Usingsilverware)、切香蕉(Choppingbanana)、剝香蕉(Peelingbanana)、吃香蕉(Eatingbanana)、寫白板(Writingwhiteboard),背景固定且由靜態(tài)攝像機(jī)記錄。視頻沒有尺度變化,其特點(diǎn)在于:每類動作視頻長度變化較大,分布從幾百幀到上千幀都有,如圖1-4所示。視頻幀的分辨率為1280×720。3.UCFSports數(shù)據(jù)集UCFSports數(shù)據(jù)集[73]由佛羅里達(dá)大學(xué)計算機(jī)視覺研究中心提供,該數(shù)據(jù)集來源于網(wǎng)絡(luò),共包含10種行為,分別為跳水(Diving)、打高爾夫球(Golfswinging)、踢腿(Kicking)、舉重(Lifting)、騎馬(Horse-riding)、跑步(Running)、滑板運(yùn)動(Skateboarding)、鞍馬運(yùn)動(Swingingatthebench)、高低杠運(yùn)動(Swingingatthehighbar)和散步(Walking)。UCFSports數(shù)據(jù)庫共有150個行為視頻,但數(shù)量分布不均,最少的“舉重”視頻僅有5個,最多的“散步”行為有21個,且場景變化很大,拍攝視角靈活,是具備一定挑戰(zhàn)性的行為數(shù)據(jù)集,如圖1-5所示。13
UCF101數(shù)據(jù)集的樣本幀
【參考文獻(xiàn)】:
期刊論文
[1]基于視覺的人體動作識別綜述[J]. 胡瓊,秦磊,黃慶明. 計算機(jī)學(xué)報. 2013(12)
[2]基于視覺的人的運(yùn)動識別綜述[J]. 杜友田,陳峰,徐文立,李永彬. 電子學(xué)報. 2007(01)
本文編號:3472667
【文章來源】:電子科技大學(xué)四川省 211工程院校 985工程院校 教育部直屬院校
【文章頁數(shù)】:132 頁
【學(xué)位級別】:博士
【部分圖文】:
UCFSports數(shù)據(jù)集的樣本幀
第一章緒論圖1-4UCFSports數(shù)據(jù)集的樣本幀圖1-5ADL數(shù)據(jù)集的樣本幀600個視頻序列。2.ActivityofDailyLiving(ADL)數(shù)據(jù)集ADL數(shù)據(jù)集[72]由羅切斯特大學(xué)的Messing等人提供,共包含150個行為視頻,由5個行為主體在廚房環(huán)境中執(zhí)行10類日常行為,且均為單人與物品之間的交互行為,包括接電話(Answering-phone)、撥電話(Dialing-phone)、查電話簿(Checkingphone-book)、喝水(Drinking)、吃零食(Eating-snack)、用餐具(Usingsilverware)、切香蕉(Choppingbanana)、剝香蕉(Peelingbanana)、吃香蕉(Eatingbanana)、寫白板(Writingwhiteboard),背景固定且由靜態(tài)攝像機(jī)記錄。視頻沒有尺度變化,其特點(diǎn)在于:每類動作視頻長度變化較大,分布從幾百幀到上千幀都有,如圖1-4所示。視頻幀的分辨率為1280×720。3.UCFSports數(shù)據(jù)集UCFSports數(shù)據(jù)集[73]由佛羅里達(dá)大學(xué)計算機(jī)視覺研究中心提供,該數(shù)據(jù)集來源于網(wǎng)絡(luò),共包含10種行為,分別為跳水(Diving)、打高爾夫球(Golfswinging)、踢腿(Kicking)、舉重(Lifting)、騎馬(Horse-riding)、跑步(Running)、滑板運(yùn)動(Skateboarding)、鞍馬運(yùn)動(Swingingatthebench)、高低杠運(yùn)動(Swingingatthehighbar)和散步(Walking)。UCFSports數(shù)據(jù)庫共有150個行為視頻,但數(shù)量分布不均,最少的“舉重”視頻僅有5個,最多的“散步”行為有21個,且場景變化很大,拍攝視角靈活,是具備一定挑戰(zhàn)性的行為數(shù)據(jù)集,如圖1-5所示。13
UCF101數(shù)據(jù)集的樣本幀
【參考文獻(xiàn)】:
期刊論文
[1]基于視覺的人體動作識別綜述[J]. 胡瓊,秦磊,黃慶明. 計算機(jī)學(xué)報. 2013(12)
[2]基于視覺的人的運(yùn)動識別綜述[J]. 杜友田,陳峰,徐文立,李永彬. 電子學(xué)報. 2007(01)
本文編號:3472667
本文鏈接:http://sikaile.net/shoufeilunwen/xxkjbs/3472667.html
最近更新
教材專著