基于特征編碼與池化的動作識別方法研究
發(fā)布時間:2024-12-26 23:12
隨著移動通訊技術(shù)的發(fā)展,視頻數(shù)據(jù)在互聯(lián)網(wǎng)上正占有越來越大的比重,我們的生活娛樂也逐漸離不開各種視頻應(yīng)用。智能視頻分析技術(shù)在智能監(jiān)控、自動駕駛、鑒黃鑒恐等多個領(lǐng)域有重要的應(yīng)用價值。動作識別任務(wù)作為視頻分析領(lǐng)域的核心任務(wù),對它的研究不僅能夠提升動作識別效果,而且能夠為其它視頻相關(guān)任務(wù)提供理論基礎(chǔ)。特征表達(dá)是視覺領(lǐng)域的核心問題,而特征編碼與池化在特征表達(dá)的研究中處于重要地位。特征編碼是對輸入特征進(jìn)行編碼而得到更高層特征的過程,特征池化是指將空間或時間上特定區(qū)域內(nèi)的視覺特征進(jìn)行聚合的過程。這兩個操作都是在已有局部冗余特征的基礎(chǔ)上,通過特定的統(tǒng)計方法來得到更有表達(dá)能力的整體緊湊特征。本文針對基于特征編碼與池化的動作識別方法進(jìn)行研究,其中在特征編碼方面開展了兩項工作:基于局部聚合思想對光流等底層特征進(jìn)行編碼;設(shè)計注意力編碼層對空域特征進(jìn)行編碼。在特征池化方面也開展了兩項研究:運用軌跡先驗對視頻卷積特征進(jìn)行時域池化;設(shè)計時空門控金字塔池化層對視頻卷積特征進(jìn)行時空域池化。本文的研究內(nèi)容和主要貢獻(xiàn)分為以下四個方面:(1)將局部聚合思想應(yīng)用到手工設(shè)計特征中,提出了基于局部聚合直方圖編碼描述子的動作識別方法。...
【文章頁數(shù)】:125 頁
【學(xué)位級別】:博士
【文章目錄】:
摘要
Abstract
第1章 緒論
1.1 課題研究背景及意義
1.1.1 研究背景
1.1.2 研究意義
1.2 研究現(xiàn)狀及分析
1.2.1 所研究課題的定義
1.2.2 動作識別
1.2.3 特征編碼與特征池化
1.2.4 具有代表性的動作識別數(shù)據(jù)集
1.2.5 現(xiàn)有方法存在的主要問題及可能的解決方案
1.3 本文主要研究內(nèi)容及組織結(jié)構(gòu)
第2章 基于局部聚合直方圖編碼描述子的動作識別方法
2.1 引言
2.2 相關(guān)工作
2.3 局部聚合直方圖編碼描述子
2.3.1 基于LA-HOF和LA-MBH描述子的動作識別
2.3.2 基于LA-HOG描述子的目標(biāo)識別
2.3.3 對所提出描述子的討論
2.4 實驗結(jié)果及分析
2.4.1 基于LA-HOF和LA-MBH描述子的動作識別
2.4.2 基于LA-HOG描述子的目標(biāo)識別
2.5 本章小結(jié)
第3章 基于雙流卷積注意力編碼網(wǎng)絡(luò)的動作識別方法
3.1 引言
3.2 相關(guān)工作
3.3 雙流卷積注意力編碼網(wǎng)絡(luò)
3.3.1 基于BN-Inception模型和時域分割思想的特征圖提取
3.3.2 注意力編碼層
3.3.3 雙流特征融合
3.4 實驗結(jié)果及分析
3.4.1 數(shù)據(jù)集
3.4.2 實現(xiàn)細(xì)節(jié)
3.4.3 探索性實驗
3.4.4 與現(xiàn)有方法的比較
3.5 本章小結(jié)
第4章 基于多尺度軌跡池化三維卷積描述子的動作識別方法
4.1 引言
4.2 相關(guān)工作
4.3 多尺度軌跡池化三維卷積描述子
4.3.1 改進(jìn)軌跡的計算
4.3.2 卷積特征圖的提取
4.3.3 特征圖歸一化和軌跡池化操作
4.3.4 多尺度擴展
4.4 實驗結(jié)果及分析
4.4.1 數(shù)據(jù)集和實現(xiàn)細(xì)節(jié)
4.4.2 探索性實驗
4.4.3 與現(xiàn)有方法的比較
4.4.4 錯誤分析
4.4.5 對實驗結(jié)果的討論
4.5 本章小結(jié)
第5章 基于時空門控金字塔池化網(wǎng)絡(luò)的動作識別方法
5.1 引言
5.2 相關(guān)工作
5.3 時空門控金字塔池化網(wǎng)絡(luò)
5.3.1 R(2+1)D網(wǎng)絡(luò)
5.3.2 時空金字塔池化方法
5.3.3 特征門控機制
5.4 實驗結(jié)果及分析
5.4.1 數(shù)據(jù)集和實現(xiàn)細(xì)節(jié)
5.4.2 探索性實驗
5.4.3 與現(xiàn)有方法的比較
5.4.4 定性結(jié)果展示
5.5 本章小結(jié)
結(jié)論
參考文獻(xiàn)
攻讀博士學(xué)位期間發(fā)表的論文及其他成果
致謝
個人簡歷
本文編號:4020769
【文章頁數(shù)】:125 頁
【學(xué)位級別】:博士
【文章目錄】:
摘要
Abstract
第1章 緒論
1.1 課題研究背景及意義
1.1.1 研究背景
1.1.2 研究意義
1.2 研究現(xiàn)狀及分析
1.2.1 所研究課題的定義
1.2.2 動作識別
1.2.3 特征編碼與特征池化
1.2.4 具有代表性的動作識別數(shù)據(jù)集
1.2.5 現(xiàn)有方法存在的主要問題及可能的解決方案
1.3 本文主要研究內(nèi)容及組織結(jié)構(gòu)
第2章 基于局部聚合直方圖編碼描述子的動作識別方法
2.1 引言
2.2 相關(guān)工作
2.3 局部聚合直方圖編碼描述子
2.3.1 基于LA-HOF和LA-MBH描述子的動作識別
2.3.2 基于LA-HOG描述子的目標(biāo)識別
2.3.3 對所提出描述子的討論
2.4 實驗結(jié)果及分析
2.4.1 基于LA-HOF和LA-MBH描述子的動作識別
2.4.2 基于LA-HOG描述子的目標(biāo)識別
2.5 本章小結(jié)
第3章 基于雙流卷積注意力編碼網(wǎng)絡(luò)的動作識別方法
3.1 引言
3.2 相關(guān)工作
3.3 雙流卷積注意力編碼網(wǎng)絡(luò)
3.3.1 基于BN-Inception模型和時域分割思想的特征圖提取
3.3.2 注意力編碼層
3.3.3 雙流特征融合
3.4 實驗結(jié)果及分析
3.4.1 數(shù)據(jù)集
3.4.2 實現(xiàn)細(xì)節(jié)
3.4.3 探索性實驗
3.4.4 與現(xiàn)有方法的比較
3.5 本章小結(jié)
第4章 基于多尺度軌跡池化三維卷積描述子的動作識別方法
4.1 引言
4.2 相關(guān)工作
4.3 多尺度軌跡池化三維卷積描述子
4.3.1 改進(jìn)軌跡的計算
4.3.2 卷積特征圖的提取
4.3.3 特征圖歸一化和軌跡池化操作
4.3.4 多尺度擴展
4.4 實驗結(jié)果及分析
4.4.1 數(shù)據(jù)集和實現(xiàn)細(xì)節(jié)
4.4.2 探索性實驗
4.4.3 與現(xiàn)有方法的比較
4.4.4 錯誤分析
4.4.5 對實驗結(jié)果的討論
4.5 本章小結(jié)
第5章 基于時空門控金字塔池化網(wǎng)絡(luò)的動作識別方法
5.1 引言
5.2 相關(guān)工作
5.3 時空門控金字塔池化網(wǎng)絡(luò)
5.3.1 R(2+1)D網(wǎng)絡(luò)
5.3.2 時空金字塔池化方法
5.3.3 特征門控機制
5.4 實驗結(jié)果及分析
5.4.1 數(shù)據(jù)集和實現(xiàn)細(xì)節(jié)
5.4.2 探索性實驗
5.4.3 與現(xiàn)有方法的比較
5.4.4 定性結(jié)果展示
5.5 本章小結(jié)
結(jié)論
參考文獻(xiàn)
攻讀博士學(xué)位期間發(fā)表的論文及其他成果
致謝
個人簡歷
本文編號:4020769
本文鏈接:http://sikaile.net/kejilunwen/shengwushengchang/4020769.html
最近更新
教材專著