天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁 > 科技論文 > 自動(dòng)化論文 >

基于深度學(xué)習(xí)的視頻人體動(dòng)作識(shí)別研究

發(fā)布時(shí)間:2020-12-21 18:09
  人體動(dòng)作識(shí)別是判斷一段視頻中人的動(dòng)作的類別。人體動(dòng)作識(shí)別具有廣泛的應(yīng)用前景,如火車站監(jiān)控、智能醫(yī)療機(jī)器人、考場(chǎng)作弊行為分析等。傳統(tǒng)的動(dòng)作識(shí)別方法需要手動(dòng)提取視頻的特征進(jìn)行分類,工作量較大且識(shí)別率低;谏疃葘W(xué)習(xí)的方法能夠自動(dòng)的提取視頻中的特征,更準(zhǔn)確的識(shí)別視頻中的動(dòng)作。目前基于深度學(xué)習(xí)的動(dòng)作識(shí)別方法主要存在兩個(gè)問題:一是現(xiàn)有的方法無法有效利用視頻中的關(guān)鍵時(shí)空信息,特征中存在著大量的冗余時(shí)空信息。二是現(xiàn)有方法缺乏對(duì)交互動(dòng)作中關(guān)鍵時(shí)空信息的推理,動(dòng)作識(shí)別率尚存提升空間。因此,本文以雙流網(wǎng)絡(luò)為基礎(chǔ)提出兩種動(dòng)作識(shí)別方法來提高動(dòng)作識(shí)別性能。首先,本文提出一種基于雙流時(shí)空注意力機(jī)制的動(dòng)作識(shí)別方法。該方法先將通道注意力機(jī)制引入到雙流基礎(chǔ)網(wǎng)絡(luò)中,通過對(duì)特征通道間的依賴關(guān)系進(jìn)行建模來校準(zhǔn)通道信息,提高特征的表達(dá)能力。其次,提出一種基于CNN(Convolutional Neural Networks,CNN)的時(shí)間注意力模型,使用較少的參數(shù)學(xué)習(xí)每幀的注意力得分,重點(diǎn)關(guān)注運(yùn)動(dòng)幅度明顯的幀。同時(shí),提出一種多空間注意力模型,從不同角度計(jì)算每幀中各個(gè)位置的注意力得分,提取多個(gè)運(yùn)動(dòng)顯著區(qū)域。接著,對(duì)時(shí)空特征進(jìn)行融... 

【文章來源】:遼寧大學(xué)遼寧省 211工程院校

【文章頁數(shù)】:66 頁

【學(xué)位級(jí)別】:碩士

【部分圖文】:

基于深度學(xué)習(xí)的視頻人體動(dòng)作識(shí)別研究


Le-Net模型圖

連接圖,神經(jīng)元,連接圖,參數(shù)


第2章相關(guān)工作8圖2-1Le-Net模型圖卷積神經(jīng)網(wǎng)絡(luò)的特點(diǎn)有兩個(gè):稀疏連接和參數(shù)共享。稀疏連接:動(dòng)物大腦中存在大量神經(jīng)元,在感知外界物體時(shí)只有部分神經(jīng)元起作用。圖像的結(jié)構(gòu)也是這樣,圖像空間內(nèi)的聯(lián)系是局部的,因此只需要感受局部的神經(jīng)元就可提取圖像特征。局部神經(jīng)元的連接如圖2-2所示。局部神經(jīng)元結(jié)構(gòu)中,每層神經(jīng)元并不和上一層全部連接。第m層的每個(gè)神經(jīng)元接受來自m-1層的3個(gè)神經(jīng)元的輸入,同樣,第m+1層的神經(jīng)元接受m層的3個(gè)神經(jīng)元的輸入得到特征。這個(gè)特征綜合了神經(jīng)元之間的聯(lián)系,是最后的全局特征。局部神經(jīng)元的連接就是稀疏連接。稀疏連接不僅可以減少連接的數(shù)目,還可以增強(qiáng)圖像信息。圖2-2局部神經(jīng)元的連接圖參數(shù)共享:在不同神經(jīng)元之間共享參數(shù)能減少整體的參數(shù)量。在圖像處理中,需要使用卷積核對(duì)圖像進(jìn)行操作。參數(shù)共享是對(duì)圖像進(jìn)行卷積操作時(shí)使用相同的卷積核,即整個(gè)圖像的像素都共享參數(shù)。這樣不僅減少參數(shù)數(shù)量,還能降低網(wǎng)絡(luò)運(yùn)算的復(fù)雜度。另外,共享參數(shù)使得圖片底層邊緣特征與其在圖中的位置沒有關(guān)系,具有平移不變性。參數(shù)共享如圖2-3所示。

參數(shù),卷積,激活函數(shù),激活層


第2章相關(guān)工作9圖2-3參數(shù)共享圖卷積神經(jīng)網(wǎng)絡(luò)由輸入層、卷積層、激活層、池化層、全連接層以及輸出層組成,下面各層分別進(jìn)行介紹。輸入層:對(duì)輸入圖像進(jìn)行預(yù)處理的一層,預(yù)處理操作包括灰度處理、歸一化、去均值等。卷積層:卷積層是對(duì)經(jīng)過輸入層圖像進(jìn)行卷積操作。不僅能增強(qiáng)一些特征,還能降低噪聲。卷積操作用一個(gè)卷積核對(duì)圖像進(jìn)行滑動(dòng)卷積,將卷積核的參數(shù)與感受野的像素相乘求和,再加上偏置參數(shù),得到卷積結(jié)果。卷積操作具體如圖2-4所示。圖2-4卷積操作圖激活層:激活函數(shù)用于卷積層和池化層之間,能增加網(wǎng)絡(luò)的非線性,增強(qiáng)神經(jīng)網(wǎng)絡(luò)的表達(dá)能力。常用的激活函數(shù)有Sigmoid函數(shù)、Tanh函數(shù)和ReLU函數(shù),這三個(gè)激活函數(shù)如圖2-5所示。

【參考文獻(xiàn)】:
期刊論文
[1]人體動(dòng)作行為識(shí)別研究綜述[J]. 李瑞峰,王亮亮,王珂.  模式識(shí)別與人工智能. 2014(01)



本文編號(hào):2930254

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/zidonghuakongzhilunwen/2930254.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶6f0dd***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com