基于光流導(dǎo)向特征的行為識別算法研究
發(fā)布時間:2022-01-09 12:33
行為識別是人工智能以及計算機視覺領(lǐng)域中一個重要的研究課題。在日常生活和工作中,具有行為識別能力的智能設(shè)備在視頻檢索、視頻監(jiān)控、人機交互等場景中發(fā)揮著重要作用。現(xiàn)有的行為識別算法普遍存在運行速度緩慢的問題,在實際應(yīng)用中不能達到滿意的實時效果。針對此問題本文提出了基于光流導(dǎo)向特征的行為識別算法,主要工作如下:針對提取光流特征的速度緩慢,很難達到滿意實時效果的問題,本文使用光流導(dǎo)向特征(Optical Flow guided Feature,OFF)作為表征運動信息的介質(zhì)提出了OFF特征差分提取算法。該算法首先使用Sobel算子提取空間特征,然后通過差分運算獲得視頻幀之間的時序信息,最后將空間特征和時間特征進行融合得到所需要的OFF特征。本文利用稀疏采樣策略和提出的算法構(gòu)建了基于OFF特征差分提取算法的行為識別網(wǎng)絡(luò)(Action Recognition Network based on differential extraction algorithm,即ARNDEA網(wǎng)絡(luò))。通過實驗對該網(wǎng)絡(luò)中的OFF特征子網(wǎng)絡(luò)的位置、學習參數(shù)以及迭代次數(shù)進行了優(yōu)化,并探究了網(wǎng)絡(luò)中空間特征和時間特征的融合方式...
【文章來源】:電子科技大學四川省 211工程院校 985工程院校 教育部直屬院校
【文章頁數(shù)】:77 頁
【學位級別】:碩士
【部分圖文】:
行為識別算法的應(yīng)用場景
電子科技大學碩士學位論文18情或者加強前后時間的事物聯(lián)系。如圖2-8所示,對于給出的一個時間的兩個序列圖片,人們可以很容易的可以分辨它的先后順序并且推理出在這兩個圖片所展示的內(nèi)容之間發(fā)生的動作。行為識別中時間推理顯得極其重要,它對行為類別的推斷提供很多幫助。比如短跑這個單一的動作既包含跑道開始時的助跑、跑道中的奔馳以及最后終點撞線的長時間序列信息,也存在著手臂揮動的短時間序列信息,正確地分清這兩個時間序列對于行為的識別是非常有幫助的,視頻中的行為識別更是我們需要研究和探索的要點。自從深度學習成為研究熱點以來,人們幾乎都很重視對視頻動作的時間信息的研究。圖2-734層卷積網(wǎng)絡(luò)模塊循環(huán)卷積神經(jīng)網(wǎng)絡(luò)(RecurrentNeurralNework,RNN)是一種專門用來處理時間依賴關(guān)系的網(wǎng)絡(luò),但是由于梯度消失問題只有短期記憶的功能,它不能順利使用時間較遠的一些信息,而這些信息在某些時候又是非常重要的。Hochreiter等[38]于
第二章行為識別相關(guān)基礎(chǔ)和理論191997年提出了LSTM模型,該模型通過門控制將短期記憶和長期記憶結(jié)合起來,從一定程度上解決了梯度消失問題,成為了解決像行為識別等需要處理時序信息的任務(wù)的重要方法。圖2-8時間關(guān)系推理所有的RNN網(wǎng)絡(luò)都有重復(fù)神經(jīng)網(wǎng)絡(luò)的鏈式的形式,如圖2-9為標準的RNN網(wǎng)絡(luò)圖,它的重復(fù)模塊非常簡單,用tanh層來實現(xiàn);而LSTM除了h在隨時間流動外,細胞狀態(tài)也在不斷改變,這就表示了長期記憶,如圖2-10所示。XtHtTanhXt-1Ht-1AXt+1Ht+1A圖2-9標準RNN網(wǎng)絡(luò)XtHtTanhXt-1Ht-1AXt+1Ht+1Aδδδxx+圖2-10LSTM網(wǎng)絡(luò)
【參考文獻】:
期刊論文
[1]家庭智能空間下基于場景的人的行為理解[J]. 田國會,吉艷青,李曉磊. 智能系統(tǒng)學報. 2010(01)
本文編號:3578729
【文章來源】:電子科技大學四川省 211工程院校 985工程院校 教育部直屬院校
【文章頁數(shù)】:77 頁
【學位級別】:碩士
【部分圖文】:
行為識別算法的應(yīng)用場景
電子科技大學碩士學位論文18情或者加強前后時間的事物聯(lián)系。如圖2-8所示,對于給出的一個時間的兩個序列圖片,人們可以很容易的可以分辨它的先后順序并且推理出在這兩個圖片所展示的內(nèi)容之間發(fā)生的動作。行為識別中時間推理顯得極其重要,它對行為類別的推斷提供很多幫助。比如短跑這個單一的動作既包含跑道開始時的助跑、跑道中的奔馳以及最后終點撞線的長時間序列信息,也存在著手臂揮動的短時間序列信息,正確地分清這兩個時間序列對于行為的識別是非常有幫助的,視頻中的行為識別更是我們需要研究和探索的要點。自從深度學習成為研究熱點以來,人們幾乎都很重視對視頻動作的時間信息的研究。圖2-734層卷積網(wǎng)絡(luò)模塊循環(huán)卷積神經(jīng)網(wǎng)絡(luò)(RecurrentNeurralNework,RNN)是一種專門用來處理時間依賴關(guān)系的網(wǎng)絡(luò),但是由于梯度消失問題只有短期記憶的功能,它不能順利使用時間較遠的一些信息,而這些信息在某些時候又是非常重要的。Hochreiter等[38]于
第二章行為識別相關(guān)基礎(chǔ)和理論191997年提出了LSTM模型,該模型通過門控制將短期記憶和長期記憶結(jié)合起來,從一定程度上解決了梯度消失問題,成為了解決像行為識別等需要處理時序信息的任務(wù)的重要方法。圖2-8時間關(guān)系推理所有的RNN網(wǎng)絡(luò)都有重復(fù)神經(jīng)網(wǎng)絡(luò)的鏈式的形式,如圖2-9為標準的RNN網(wǎng)絡(luò)圖,它的重復(fù)模塊非常簡單,用tanh層來實現(xiàn);而LSTM除了h在隨時間流動外,細胞狀態(tài)也在不斷改變,這就表示了長期記憶,如圖2-10所示。XtHtTanhXt-1Ht-1AXt+1Ht+1A圖2-9標準RNN網(wǎng)絡(luò)XtHtTanhXt-1Ht-1AXt+1Ht+1Aδδδxx+圖2-10LSTM網(wǎng)絡(luò)
【參考文獻】:
期刊論文
[1]家庭智能空間下基于場景的人的行為理解[J]. 田國會,吉艷青,李曉磊. 智能系統(tǒng)學報. 2010(01)
本文編號:3578729
本文鏈接:http://sikaile.net/kejilunwen/zidonghuakongzhilunwen/3578729.html
最近更新
教材專著