基于深度學(xué)習(xí)的時序動作檢測研究
【文章頁數(shù)】:58 頁
【學(xué)位級別】:碩士
【部分圖文】:
圖2.1卷積操作示例
華中科技大學(xué)碩士學(xué)位論文轉(zhuǎn)換為另一個。常用的神經(jīng)元層由三種類型:卷積層,池化層,以通過一系列隱藏層將輸入圖像轉(zhuǎn)換為輸出向量。每個隱藏層由一對其輸入應(yīng)用線性變換,即用于卷積層的卷積和用于全連接層的通常會緊隨一個激活函數(shù),例如ReLU,Sigmoid等非線性函數(shù)。和輸出是稱為特征....
圖2.2ReLU函數(shù)示意圖
設(shè)卷積步長值為S,將每個卷積核滑過輸入特征圖。當(dāng)S1時跳過S像素,將產(chǎn)生一個空間下采樣的特征圖。最后,設(shè)對應(yīng)填像素的數(shù)為P。通常我們使用它來保證輸入特征圖的空間大小,因度和高度是相同的。入特征圖的空間大小為WWD。則輸出特征圖的大小為MMW....
圖2.4FasterR-CNN網(wǎng)絡(luò)結(jié)構(gòu)簡圖
圖2.4FasterR-CNN網(wǎng)絡(luò)結(jié)構(gòu)簡圖[75]RPN被放置在最后的共享卷積層conv5之后,并在特征圖上滑動以確定該區(qū)否為目標(biāo)。值得注意的是,RPN網(wǎng)絡(luò)與目標(biāo)檢測層是共享的。具體來說,圖像入網(wǎng)絡(luò),在經(jīng)過conv5層的卷積操作之后,特征圖被傳到RPN網(wǎng)絡(luò)....
圖3.1特征提取采樣示意圖
和內(nèi)存容量的問題,整個視頻無法直接輸入網(wǎng)絡(luò)。因此,需要對視頻進(jìn)行一定的處理,在獲得準(zhǔn)確有效的特征圖的前提下,盡量減小內(nèi)存的占用。首先,需要確定的是采樣的方式。設(shè)現(xiàn)有視頻V,以25fps/s的幀率將視頻拆分為圖像,拆分后的總幀數(shù)為T,則有1={f}TttV,ft代表視....
本文編號:4003332
本文鏈接:http://sikaile.net/kejilunwen/zidonghuakongzhilunwen/4003332.html
下一篇:沒有了