基于深度學習的時序動作檢測研究

發(fā)布時間：2024-07-07 07:04

　　近年來,隨著全球移動互聯(lián)網(wǎng)技術(shù)以及數(shù)字化設(shè)備的快速發(fā)展和普及,互聯(lián)網(wǎng)上的視頻數(shù)據(jù)每天都在以驚人的速度增長,依靠人工的方式處理如此海量的視頻數(shù)據(jù)并不現(xiàn)實,基于深度學習的時序動作檢測研究引起了廣大研究者們的興趣,已經(jīng)成為了目前智能視頻分析領(lǐng)域中的研究熱點。該研究涉及計算機視覺、圖像處理、視頻分析、目標檢測等諸多研究領(lǐng)域,具有重要的科學意義,可以廣泛應(yīng)用于智能安防、機器人視覺、虛擬現(xiàn)實、視頻監(jiān)控、人機交互等多個領(lǐng)域,具有良好的應(yīng)用前景。時序動作檢測是給定一段未裁剪的視頻,實現(xiàn)視頻中動作片段的檢測,包括開始時間、結(jié)束時間和動作類別,是智能視頻分析領(lǐng)域中的研究熱點之一�；谑止ぬ卣魈崛〉膫鹘y(tǒng)方法對于復雜多變的動作類型魯棒性較差,基于深度學習的方法可以有效地學習到不同動作之間的差異,在視頻動作分析領(lǐng)域已取得了大量的研究成果。然而時序動作檢測的性能嚴重依賴于目標動作的時序提議效果,有效的時序提議對動作檢測效果起到了決定性的作用,而視頻數(shù)據(jù)結(jié)構(gòu)復雜、目標動作變化多樣且動作持續(xù)時間長短不一等問題,使得時序動作檢測中時序提議方法存在著視頻特征利用不充分、目標動作邊界檢測困難等問題。針對以上所存在的問題,本...

【文章頁數(shù)】：58 頁

【學位級別】：碩士

【部分圖文】：

圖2.1卷積操作示例

華中科技大學碩士學位論文轉(zhuǎn)換為另一個。常用的神經(jīng)元層由三種類型：卷積層，池化層，以通過一系列隱藏層將輸入圖像轉(zhuǎn)換為輸出向量。每個隱藏層由一對其輸入應(yīng)用線性變換，即用于卷積層的卷積和用于全連接層的通常會緊隨一個激活函數(shù)，例如ReLU，Sigmoid等非線性函數(shù)。和輸出是稱為特征....

圖2.2ReLU函數(shù)示意圖

設(shè)卷積步長值為S，將每個卷積核滑過輸入特征圖。當S1時跳過S像素，將產(chǎn)生一個空間下采樣的特征圖。最后，設(shè)對應(yīng)填像素的數(shù)為P。通常我們使用它來保證輸入特征圖的空間大小，因度和高度是相同的。入特征圖的空間大小為WWD。則輸出特征圖的大小為MMW....

圖2.4FasterR-CNN網(wǎng)絡(luò)結(jié)構(gòu)簡圖

圖2.4FasterR-CNN網(wǎng)絡(luò)結(jié)構(gòu)簡圖[75]RPN被放置在最后的共享卷積層conv5之后，并在特征圖上滑動以確定該區(qū)否為目標。值得注意的是，RPN網(wǎng)絡(luò)與目標檢測層是共享的。具體來說，圖像入網(wǎng)絡(luò)，在經(jīng)過conv5層的卷積操作之后，特征圖被傳到RPN網(wǎng)絡(luò)....

圖3.1特征提取采樣示意圖

和內(nèi)存容量的問題，整個視頻無法直接輸入網(wǎng)絡(luò)。因此，需要對視頻進行一定的處理，在獲得準確有效的特征圖的前提下，盡量減小內(nèi)存的占用。首先，需要確定的是采樣的方式。設(shè)現(xiàn)有視頻V，以25fps/s的幀率將視頻拆分為圖像，拆分后的總幀數(shù)為T，則有1={f}TttV，ft代表視....

本文編號：4003332

資料下載

論文發(fā)表

支付寶下載

Download by Alipay
微信下載

Download by Wechat
會員下載

Download by Member

本文鏈接：http://sikaile.net/kejilunwen/zidonghuakongzhilunwen/4003332.html

上一篇：基于深度學習的植物葉片識別研究與實現(xiàn)
下一篇：沒有了

論文發(fā)表

·知網(wǎng)|萬方|維普|龍源|省級|國家級|科技核心|北大核心|南大核心CSSCI|EI|SCI|SSCI|

天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

基于深度學習的時序動作檢測研究