融合時空網(wǎng)絡(luò)與注意力機制的人體行為識別研究
【文章頁數(shù)】:69 頁
【學(xué)位級別】:碩士
【部分圖文】:
圖2-2?DT算法結(jié)構(gòu)[2]??Figure?2-2?Structure?of?Dense?Trajectories?(DT)?algorithm^??
Figure?2-1?Haar-like?characteristics??密集軌跡[2]?(Dense?Trajectories,DT)算法和改進的密集軌跡(Improved?Dense??Trajectories,iDT)算法。圖2-2闡釋了提取和描述密集軌跡的方法。DT算法....
圖2 ̄4改進的Inception結(jié)構(gòu)??Figure?2-4?Structure?of?improved?Inception??
但是卷積核基于上一層的所有輸出進行操作,會導(dǎo)致5x5的卷積核的計算量??過大,進而導(dǎo)致特征圖厚度過大。為了解決這個問題,就出現(xiàn)了改進的Inception結(jié)??構(gòu),如圖2-4所不。在3><3、5><5的卷積核前和3><3的maxpooling后分別添加1x1??的卷積核,以此降低特....
圖2-6?IndRNN結(jié)構(gòu)??Figure?2-6?Structure?of?IndRNN??
在每一個通道中分別進行卷積和池化操作。??Tran等人[14]在3D?CNN模型的基礎(chǔ)上設(shè)計了?C3D網(wǎng)絡(luò)。C3D可以基于視頻提??取特征。2D與3D卷積的對比,如圖2-7所示。(a)和(b)分別顯示2D卷積用于單??通道圖像和多通道圖像的情況(多通道圖像可以指同一張圖片的3個顏....
圖2-7?2D卷積和3D卷積的對比??Figure?2-7?Comparison?of?2D?convolution?and?3D?convolution??
2.3.2?CNN與RNN結(jié)合的方法??J.Donahue等人[17]提出長期循環(huán)卷積神經(jīng)網(wǎng)絡(luò)(Long-term?Recurrent??Convolutional?Network,?LRCN),如圖2-8所示。LRCN的結(jié)構(gòu)包含兩部分:卷積神??經(jīng)網(wǎng)絡(luò)CNN和長短期記憶網(wǎng)絡(luò)LS....
本文編號:4038184
本文鏈接:http://sikaile.net/kejilunwen/zidonghuakongzhilunwen/4038184.html