基于深度注意力機制的視頻中人體動作識別
發(fā)布時間:2021-07-01 07:31
視頻中人體動作識別是計算機視覺領域內(nèi)長期備受關注的課題,在視頻監(jiān)控、人機交互和視頻理解等領域發(fā)揮著重要的作用,受到國內(nèi)外學者的廣泛關注。隨著大數(shù)據(jù)時代的到來,視頻數(shù)據(jù)的數(shù)量呈指數(shù)式增長。然而由于視頻中人體動作的復雜性和多樣性,如何有效地識別動作成為一項頗具挑戰(zhàn)的研究課題。根據(jù)人體動作的表示和分類兩大步驟,本文提出了基于深度編解碼框架結合注意力機制的研究思路。本文應用深度學習技術,以卷積神經(jīng)網(wǎng)絡自動提取動作特征表示動作,利用深度循環(huán)網(wǎng)絡分類動作。同時,本文建立集成模型,在學習的過程中完成整體優(yōu)化,實現(xiàn)動作表示和動作識別的統(tǒng)一。具體地,本文的主要研究成果如下:(1)提出適應視頻時域信息的Attention-again模型。大多數(shù)注意力機制的方法,都是關注空間信息,僅通過LSTM去對視頻的序列信息進行建模。考慮到傳統(tǒng)方法對時域的信息獲取不完善性,本文受人們閱讀習慣的啟發(fā)提出了Attention-again模型。將相鄰時刻的圖像幀與當前圖像幀相結合,利用LSTM長時間依賴的特性,使得底層LSTM能獲取到一定的全局信息;在頂層LSTM識別過程中進行一定的指導。本文的方法在公開數(shù)據(jù)集UCF11,H...
【文章來源】:國防科技大學湖南省 211工程院校 985工程院校
【文章頁數(shù)】:74 頁
【學位級別】:碩士
【部分圖文】:
視頻中人體動作識別的一般過程
國防科技大學研究生院碩士學位論文第11頁圖2.1感知器的解空間,左:單個感知器,右:多個感知器其中,為SGD中的關鍵參數(shù)——學習率(learningrate),以此來控制著每一次迭代中梯度更新的步長。在每一次迭代中,參數(shù)的更新都是朝著誤差更小的方向變化,直到迭代更新量達到一定的閾值水平或者達到指定的最大迭代數(shù)訓練停止。圖2.2展示了一個使用固定學習率進行梯度下降的迭代過程。圖2.2梯度下降示例根據(jù)以上步驟,首先隨機地從樣本里抽取一批樣本,以這些樣本為依據(jù)來更新參數(shù),具體的流程見算法2.1。為了加速網(wǎng)絡的訓練速度,最為經(jīng)典的方法就是引入梯度沖量項,從而疊加
國防科技大學研究生院碩士學位論文第11頁圖2.1感知器的解空間,左:單個感知器,右:多個感知器其中,為SGD中的關鍵參數(shù)——學習率(learningrate),以此來控制著每一次迭代中梯度更新的步長。在每一次迭代中,參數(shù)的更新都是朝著誤差更小的方向變化,直到迭代更新量達到一定的閾值水平或者達到指定的最大迭代數(shù)訓練停止。圖2.2展示了一個使用固定學習率進行梯度下降的迭代過程。圖2.2梯度下降示例根據(jù)以上步驟,首先隨機地從樣本里抽取一批樣本,以這些樣本為依據(jù)來更新參數(shù),具體的流程見算法2.1。為了加速網(wǎng)絡的訓練速度,最為經(jīng)典的方法就是引入梯度沖量項,從而疊加
【參考文獻】:
期刊論文
[1]基于深度學習的人體行為識別算法綜述[J]. 朱煜,趙江坤,王逸寧,鄭兵兵. 自動化學報. 2016(06)
博士論文
[1]基于深度編解碼框架的視覺數(shù)據(jù)理解[D]. 李碩豪.國防科技大學 2018
[2]視頻中人體動作識別關鍵技術研究[D]. 王斌.國防科學技術大學 2015
本文編號:3258718
【文章來源】:國防科技大學湖南省 211工程院校 985工程院校
【文章頁數(shù)】:74 頁
【學位級別】:碩士
【部分圖文】:
視頻中人體動作識別的一般過程
國防科技大學研究生院碩士學位論文第11頁圖2.1感知器的解空間,左:單個感知器,右:多個感知器其中,為SGD中的關鍵參數(shù)——學習率(learningrate),以此來控制著每一次迭代中梯度更新的步長。在每一次迭代中,參數(shù)的更新都是朝著誤差更小的方向變化,直到迭代更新量達到一定的閾值水平或者達到指定的最大迭代數(shù)訓練停止。圖2.2展示了一個使用固定學習率進行梯度下降的迭代過程。圖2.2梯度下降示例根據(jù)以上步驟,首先隨機地從樣本里抽取一批樣本,以這些樣本為依據(jù)來更新參數(shù),具體的流程見算法2.1。為了加速網(wǎng)絡的訓練速度,最為經(jīng)典的方法就是引入梯度沖量項,從而疊加
國防科技大學研究生院碩士學位論文第11頁圖2.1感知器的解空間,左:單個感知器,右:多個感知器其中,為SGD中的關鍵參數(shù)——學習率(learningrate),以此來控制著每一次迭代中梯度更新的步長。在每一次迭代中,參數(shù)的更新都是朝著誤差更小的方向變化,直到迭代更新量達到一定的閾值水平或者達到指定的最大迭代數(shù)訓練停止。圖2.2展示了一個使用固定學習率進行梯度下降的迭代過程。圖2.2梯度下降示例根據(jù)以上步驟,首先隨機地從樣本里抽取一批樣本,以這些樣本為依據(jù)來更新參數(shù),具體的流程見算法2.1。為了加速網(wǎng)絡的訓練速度,最為經(jīng)典的方法就是引入梯度沖量項,從而疊加
【參考文獻】:
期刊論文
[1]基于深度學習的人體行為識別算法綜述[J]. 朱煜,趙江坤,王逸寧,鄭兵兵. 自動化學報. 2016(06)
博士論文
[1]基于深度編解碼框架的視覺數(shù)據(jù)理解[D]. 李碩豪.國防科技大學 2018
[2]視頻中人體動作識別關鍵技術研究[D]. 王斌.國防科學技術大學 2015
本文編號:3258718
本文鏈接:http://sikaile.net/kejilunwen/zidonghuakongzhilunwen/3258718.html
最近更新
教材專著