基于視頻內容的行為識別算法研究
發(fā)布時間:2021-08-03 02:16
隨著視頻信息量的激增與機器視覺的快速發(fā)展,人們對視頻處理領域的技術要求越來越高。視頻行為識別作為視頻理解方向的一個分支,具有十分重要的研究意義。該文對視頻行為識別算法做了詳細研究,旨在于通過對視頻時空信息的分析,形成更加有效的視頻特征,得到更有判別力的視頻行為識別系統(tǒng)。首先,設計了基于時空卷積網(wǎng)絡的視頻行為識別算法,將視頻行為識別處理為單獨對視頻空間與時間信息的獲取。在雙流卷積網(wǎng)絡的基礎上,比較分析了光流圖像和顯著性圖像作為網(wǎng)絡輸入時,對行為識別效果的影響。同時,通過視頻時空信息的分析,并借助三維卷積,構建了一個具有雙分支結構的時空卷積網(wǎng)絡,該網(wǎng)絡能夠以獨立且明確的方式獲取視頻的時間與空間信息,提高了行為識別效果。其次,研究了基于循環(huán)神經(jīng)網(wǎng)絡的特征融合與視頻分段的視頻行為識別算法,將視頻行為識別工作按時序信息處理。在循環(huán)神經(jīng)網(wǎng)絡的基礎上,首先實現(xiàn)了與卷積神經(jīng)網(wǎng)絡聯(lián)合的行為識別算法,并對網(wǎng)絡類型和采樣長度的選取進行比較分析;再者,分別根據(jù)相鄰特征平均化和三維卷積網(wǎng)絡,提出了基于特征融合的識別算法;之后,提出了基于視頻分段的視頻行為識別算法,并比較分析了融合函數(shù)和視頻段數(shù)對行為識別效果的影...
【文章來源】:燕山大學河北省
【文章頁數(shù)】:70 頁
【學位級別】:碩士
【文章目錄】:
摘要
Abstract
第1章 緒論
1.1 課題背景及意義
1.2 國內外研究現(xiàn)狀
1.2.1 基于人工設計的特征
1.2.2 基于網(wǎng)絡訓練的特征
1.3 本文研究內容
1.4 本文組織結構
第2章 深度學習及神經(jīng)網(wǎng)絡理論基礎
2.1 深度學習概述
2.2 人工神經(jīng)網(wǎng)絡
2.2.1 單個神經(jīng)元
2.2.2 前饋神經(jīng)網(wǎng)絡
2.2.3 反向傳播
2.3 卷積神經(jīng)網(wǎng)絡
2.3.1 卷積
2.3.2 池化
2.3.3 激活函數(shù)
2.4 深度學習工具
2.5 本章小結
第3章 基于時空卷積網(wǎng)絡的視頻行為識別算法
3.1 引言
3.2 雙流卷積網(wǎng)絡
3.2.1 雙流卷積網(wǎng)絡結構
3.2.2 光流
3.2.3 時間流卷積網(wǎng)絡
3.3 時空卷積網(wǎng)絡
3.3.1 三維卷積
3.3.2 時空卷積模塊
3.3.3 時空卷積網(wǎng)絡構建
3.4 實驗仿真與分析
3.4.1 數(shù)據(jù)集
3.4.2 雙流卷積網(wǎng)絡的實驗設置
3.4.3 雙流卷積網(wǎng)絡的識別性能分析
3.4.4 時空卷積網(wǎng)絡的實驗設置
3.4.5 時空卷積網(wǎng)絡的識別性能分析
3.5 本章小結
第4章 基于循環(huán)神經(jīng)網(wǎng)絡的視頻行為識別算法
4.1 引言
4.2 基于循環(huán)神經(jīng)網(wǎng)絡的視頻行為識別
4.2.1 RNN及 LSTM
4.2.2 基于LSTM網(wǎng)絡的視頻行為識別
4.2.3 基于特征融合與LSTM網(wǎng)絡的視頻行為識別
4.2.4 基于視頻分段與LSTM網(wǎng)絡的視頻行為識別
4.3 實驗仿真與分析
4.3.1 實驗設置
4.3.2 基于LSTM網(wǎng)絡算法的識別性能分析
4.3.3 基于特征融合與LSTM網(wǎng)絡算法的識別性能分析
4.3.4 基于視頻分段與LSTM網(wǎng)絡算法的識別性能分析
4.3.5 與其他方法的比較
4.4 本章小結
第5章 基于三維卷積稠密網(wǎng)絡的視頻行為識別算法
5.1 引言
5.2 網(wǎng)絡構建
5.2.1 三維卷積網(wǎng)絡
5.2.2 DenseNet網(wǎng)絡
5.2.3 三維卷積稠密網(wǎng)絡
5.2.4 多尺度三維卷積稠密網(wǎng)絡
5.3 實驗仿真與分析
5.3.1 實驗設置
5.3.2 三維卷積稠密網(wǎng)絡的識別性能分析
5.3.3 多尺度三維卷積稠密網(wǎng)絡的識別性能分析
5.4 本章小結
結論
參考文獻
攻讀碩士學位期間承擔的科研任務與主要成果
致謝
本文編號:3318722
【文章來源】:燕山大學河北省
【文章頁數(shù)】:70 頁
【學位級別】:碩士
【文章目錄】:
摘要
Abstract
第1章 緒論
1.1 課題背景及意義
1.2 國內外研究現(xiàn)狀
1.2.1 基于人工設計的特征
1.2.2 基于網(wǎng)絡訓練的特征
1.3 本文研究內容
1.4 本文組織結構
第2章 深度學習及神經(jīng)網(wǎng)絡理論基礎
2.1 深度學習概述
2.2 人工神經(jīng)網(wǎng)絡
2.2.1 單個神經(jīng)元
2.2.2 前饋神經(jīng)網(wǎng)絡
2.2.3 反向傳播
2.3 卷積神經(jīng)網(wǎng)絡
2.3.1 卷積
2.3.2 池化
2.3.3 激活函數(shù)
2.4 深度學習工具
2.5 本章小結
第3章 基于時空卷積網(wǎng)絡的視頻行為識別算法
3.1 引言
3.2 雙流卷積網(wǎng)絡
3.2.1 雙流卷積網(wǎng)絡結構
3.2.2 光流
3.2.3 時間流卷積網(wǎng)絡
3.3 時空卷積網(wǎng)絡
3.3.1 三維卷積
3.3.2 時空卷積模塊
3.3.3 時空卷積網(wǎng)絡構建
3.4 實驗仿真與分析
3.4.1 數(shù)據(jù)集
3.4.2 雙流卷積網(wǎng)絡的實驗設置
3.4.3 雙流卷積網(wǎng)絡的識別性能分析
3.4.4 時空卷積網(wǎng)絡的實驗設置
3.4.5 時空卷積網(wǎng)絡的識別性能分析
3.5 本章小結
第4章 基于循環(huán)神經(jīng)網(wǎng)絡的視頻行為識別算法
4.1 引言
4.2 基于循環(huán)神經(jīng)網(wǎng)絡的視頻行為識別
4.2.1 RNN及 LSTM
4.2.2 基于LSTM網(wǎng)絡的視頻行為識別
4.2.3 基于特征融合與LSTM網(wǎng)絡的視頻行為識別
4.2.4 基于視頻分段與LSTM網(wǎng)絡的視頻行為識別
4.3 實驗仿真與分析
4.3.1 實驗設置
4.3.2 基于LSTM網(wǎng)絡算法的識別性能分析
4.3.3 基于特征融合與LSTM網(wǎng)絡算法的識別性能分析
4.3.4 基于視頻分段與LSTM網(wǎng)絡算法的識別性能分析
4.3.5 與其他方法的比較
4.4 本章小結
第5章 基于三維卷積稠密網(wǎng)絡的視頻行為識別算法
5.1 引言
5.2 網(wǎng)絡構建
5.2.1 三維卷積網(wǎng)絡
5.2.2 DenseNet網(wǎng)絡
5.2.3 三維卷積稠密網(wǎng)絡
5.2.4 多尺度三維卷積稠密網(wǎng)絡
5.3 實驗仿真與分析
5.3.1 實驗設置
5.3.2 三維卷積稠密網(wǎng)絡的識別性能分析
5.3.3 多尺度三維卷積稠密網(wǎng)絡的識別性能分析
5.4 本章小結
結論
參考文獻
攻讀碩士學位期間承擔的科研任務與主要成果
致謝
本文編號:3318722
本文鏈接:http://sikaile.net/kejilunwen/shengwushengchang/3318722.html
最近更新
教材專著