基于深度卷積神經(jīng)網(wǎng)絡(luò)的人體行為識別研究
發(fā)布時間:2022-05-02 21:11
人體行為識別是當(dāng)前計算機視覺領(lǐng)域的一個重要研究分支,通常分為個體行為識別與群組行為識別兩個任務(wù)。個體與群組行為識別在研究上基于相似的理論,而在方法上有所不同,且具有各自的局限性。當(dāng)前已有的個體行為識別方法需要大規(guī)模數(shù)據(jù)集預(yù)訓(xùn)練支撐,學(xué)習(xí)成本高,且無法充分利用輸入數(shù)據(jù)中的時間信息。而已有的群組行為識別方法在群組中個體之間的關(guān)聯(lián)信息的挖掘方面不夠充分。本文在總結(jié)了行為識別方法的基礎(chǔ)上,針對兩種行為識別任務(wù),主要解決了行為識別中的以下幾個問題:第一,對于個體行為識別,如何有效利用時間信息提升識別性能,是個體任務(wù)中一個重要的問題;第二,群組中個體之間是有關(guān)聯(lián)的,對群組中個體間的關(guān)系進行分析也是群組行為識別中一個關(guān)鍵的問題。針對這些問題,本文做出以下工作:(1)針對目前主流網(wǎng)絡(luò)需要大型數(shù)據(jù)集預(yù)訓(xùn)練以及無法有效利用跨時間信息的問題,提出了基于雙流卷積網(wǎng)絡(luò)與膨脹3D卷積網(wǎng)絡(luò)的深度神經(jīng)網(wǎng)絡(luò)模型。并重新設(shè)計網(wǎng)絡(luò)結(jié)構(gòu),命名為多流3D融合網(wǎng)絡(luò)。首先,利用改進的雙流網(wǎng)絡(luò)與膨脹3D網(wǎng)絡(luò)提取人物動作特征。再利用分段長短期記憶網(wǎng)絡(luò)提取時間特征。最后利用殘差連接方法融合特征,得到最終的個體識別結(jié)果,實現(xiàn)了精確的個體行...
【文章頁數(shù)】:71 頁
【學(xué)位級別】:碩士
【文章目錄】:
致謝
摘要
abstract
第一章 緒論
1.1 選題背景及意義
1.2 國內(nèi)外研究現(xiàn)狀
1.2.1 個體行為識別介紹
1.2.2 群組行為識別介紹
1.3 論文研究內(nèi)容和章節(jié)安排
1.3.1 研究內(nèi)容
1.3.2 章節(jié)安排
1.4 本章小結(jié)
第二章 視頻行為識別關(guān)鍵算法
2.1 運動目標(biāo)檢測
2.1.1 背景減除法
2.1.2 光流法
2.1.3 幀間差分法
2.2 深度學(xué)習(xí)方法
2.2.1 卷積神經(jīng)網(wǎng)絡(luò)
2.2.2 雙流神經(jīng)網(wǎng)絡(luò)
2.2.3 3D卷積網(wǎng)絡(luò)
2.2.4 長短期記憶神經(jīng)網(wǎng)絡(luò)
2.2.5 門控循環(huán)單元
2.3 本章小結(jié)
第三章 基于深度卷積網(wǎng)絡(luò)的個體行為識別
3.1 引言
3.2 相關(guān)工作
3.3 多流3D融合網(wǎng)絡(luò)
3.3.1 膨脹3D卷積網(wǎng)絡(luò)
3.3.2 雙流卷積網(wǎng)絡(luò)
3.3.3 分段LSTM網(wǎng)絡(luò)
3.3.4 分支特征融合
3.4 個體行為識別的實驗結(jié)果及分析
3.4.1 數(shù)據(jù)集介紹
3.4.2 評價指標(biāo)
3.4.3 實驗環(huán)境
3.4.4 實驗方法
3.4.5 對比實驗結(jié)果分析
3.4.6 與其他方法對比分析
3.4.7 混淆矩陣分析
3.5 本章小結(jié)
第四章 基于聚類關(guān)聯(lián)網(wǎng)絡(luò)的群組行為識別
4.1 引言
4.2 相關(guān)工作
4.3 聚類關(guān)聯(lián)網(wǎng)絡(luò)
4.3.1 近鄰傳播算法
4.3.2 改進的層次關(guān)聯(lián)網(wǎng)絡(luò)
4.4 實驗結(jié)果與分析
4.4.1 數(shù)據(jù)集介紹
4.4.2 評價指標(biāo)
4.4.3 實驗環(huán)境
4.4.4 實驗方法
4.4.5 實驗設(shè)置
4.4.6 消融實驗結(jié)果與分析
4.4.7 與其他方法的對比分析
4.4.8 混淆矩陣分析
4.4.9 部分實驗結(jié)果可視化
4.5 本章小結(jié)
第五章 總結(jié)和展望
5.1 論文總結(jié)
5.2 工作展望
參考文獻
攻讀碩士學(xué)位期間的學(xué)術(shù)活動及成果情況
【參考文獻】:
期刊論文
[1]基于稀疏化雙線性卷積神經(jīng)網(wǎng)絡(luò)的細粒度圖像分類[J]. 馬力,王永雄. 模式識別與人工智能. 2019(04)
[2]基于深度卷積網(wǎng)絡(luò)的目標(biāo)檢測綜述[J]. 吳帥,徐勇,趙東寧. 模式識別與人工智能. 2018(04)
本文編號:3649969
【文章頁數(shù)】:71 頁
【學(xué)位級別】:碩士
【文章目錄】:
致謝
摘要
abstract
第一章 緒論
1.1 選題背景及意義
1.2 國內(nèi)外研究現(xiàn)狀
1.2.1 個體行為識別介紹
1.2.2 群組行為識別介紹
1.3 論文研究內(nèi)容和章節(jié)安排
1.3.1 研究內(nèi)容
1.3.2 章節(jié)安排
1.4 本章小結(jié)
第二章 視頻行為識別關(guān)鍵算法
2.1 運動目標(biāo)檢測
2.1.1 背景減除法
2.1.2 光流法
2.1.3 幀間差分法
2.2 深度學(xué)習(xí)方法
2.2.1 卷積神經(jīng)網(wǎng)絡(luò)
2.2.2 雙流神經(jīng)網(wǎng)絡(luò)
2.2.3 3D卷積網(wǎng)絡(luò)
2.2.4 長短期記憶神經(jīng)網(wǎng)絡(luò)
2.2.5 門控循環(huán)單元
2.3 本章小結(jié)
第三章 基于深度卷積網(wǎng)絡(luò)的個體行為識別
3.1 引言
3.2 相關(guān)工作
3.3 多流3D融合網(wǎng)絡(luò)
3.3.1 膨脹3D卷積網(wǎng)絡(luò)
3.3.2 雙流卷積網(wǎng)絡(luò)
3.3.3 分段LSTM網(wǎng)絡(luò)
3.3.4 分支特征融合
3.4 個體行為識別的實驗結(jié)果及分析
3.4.1 數(shù)據(jù)集介紹
3.4.2 評價指標(biāo)
3.4.3 實驗環(huán)境
3.4.4 實驗方法
3.4.5 對比實驗結(jié)果分析
3.4.6 與其他方法對比分析
3.4.7 混淆矩陣分析
3.5 本章小結(jié)
第四章 基于聚類關(guān)聯(lián)網(wǎng)絡(luò)的群組行為識別
4.1 引言
4.2 相關(guān)工作
4.3 聚類關(guān)聯(lián)網(wǎng)絡(luò)
4.3.1 近鄰傳播算法
4.3.2 改進的層次關(guān)聯(lián)網(wǎng)絡(luò)
4.4 實驗結(jié)果與分析
4.4.1 數(shù)據(jù)集介紹
4.4.2 評價指標(biāo)
4.4.3 實驗環(huán)境
4.4.4 實驗方法
4.4.5 實驗設(shè)置
4.4.6 消融實驗結(jié)果與分析
4.4.7 與其他方法的對比分析
4.4.8 混淆矩陣分析
4.4.9 部分實驗結(jié)果可視化
4.5 本章小結(jié)
第五章 總結(jié)和展望
5.1 論文總結(jié)
5.2 工作展望
參考文獻
攻讀碩士學(xué)位期間的學(xué)術(shù)活動及成果情況
【參考文獻】:
期刊論文
[1]基于稀疏化雙線性卷積神經(jīng)網(wǎng)絡(luò)的細粒度圖像分類[J]. 馬力,王永雄. 模式識別與人工智能. 2019(04)
[2]基于深度卷積網(wǎng)絡(luò)的目標(biāo)檢測綜述[J]. 吳帥,徐勇,趙東寧. 模式識別與人工智能. 2018(04)
本文編號:3649969
本文鏈接:http://sikaile.net/kejilunwen/shengwushengchang/3649969.html
最近更新
教材專著