基于邊界概率的級聯(lián)動作檢測技術研究

發(fā)布時間：2020-10-10 16:55

　　人體動作檢測研究如何讓計算機自動地找出視頻中發(fā)生動作的位置,并識別出動作的類別。它是自動視頻分析的一項重要內容,也是計算機視覺研究領域的一個重點研究方向,在智能安防、人機交互和自動駕駛等方面都扮演著非常重要的角色。目前的動作檢測方法多是先使用動作候選片段提議方法生成一些候選片段,再對這些候選片段進行調整來得到最后的檢測結果,因此動作檢測的性能很大程度上取決于動作候選片段的質量。但由于目前的動作候選片段提議方案不能充分捕捉時域上下文信息,且沒有考慮動作在時域上的相關性,因此生成的候選動作片段往往數(shù)量冗余且質量不高。為了解決上述問題,本文提出了基于邊界概率的級聯(lián)動作檢測技術,主要工作如下:(1)提出了基于時域卷積神經(jīng)網(wǎng)絡的動作邊界概率預測模型,用來預測輸入視頻的動作邊界概率。該模型能夠在保持模型參數(shù)較少的同時,讓網(wǎng)絡不僅具有多個尺度的“感受野”,更具有自適應的“感受野”,從而充分捕捉時域上運動的細微變化,來實現(xiàn)準確的動作邊界預測。(2)提出了基于長短期記憶網(wǎng)絡的邊界概率微調模型,對上一步得到的邊界概率進行微調。該模型利用長短期記憶網(wǎng)絡在時域上的記憶特性,來捕捉時域上動作不同階段的關聯(lián)性,能夠對動作概率進行修正,從而減少冗余的候選片段并提高候選片段的質量。最終將以上兩個模型整合為一個級聯(lián)模型,用來產(chǎn)生高質量的動作候選片段,然后基于這些候選片段實現(xiàn)了更準確的動作檢測。本文的方法在THUMOS2014數(shù)據(jù)庫上平均檢索候選片段數(shù)目為50時的將召回率從目前最好的37.46%提高到了43.06%;基于這些動作候選片段實現(xiàn)的動作檢測的平均準確率從目前最好的45.1%提高到了48.8%;在這兩項指標上都超過目前學術界最好的性能。
【學位單位】：華中科技大學
【學位級別】：碩士
【學位年份】：2019
【中圖分類】：TP391.41;TP183
【部分圖文】：

應用場

和公共場所的安全隱患，為人們的生活增添一道保障。機交互�；谟嬎銠C視覺技術的人體動作識別技術能夠在非機器進行交互，相較于傳統(tǒng)的鍵盤手柄等輸入設備，這種方式感游戲方面尤其出色。育運動分析�？捎糜谳o助體育運動中的日常訓練和對運動員軌跡等信息的統(tǒng)計分析。駕駛�？捎糜趯Φ缆飞闲腥说臋z測和識別，讓自動駕駛變得頻內容壓縮。目前各種視頻在線網(wǎng)站繁多，允許用戶上傳視可以幫助快速用戶壓縮視頻中不必要的背景和無用鏡頭，減能家居。為家中有老人小孩或者行動不便的用戶提供針對家在家中檢測到嬰兒摔倒等意外場景發(fā)出警報并緊急聯(lián)系其他

示意圖,檢測數(shù)據(jù)庫,難點,示意圖

因為不同的人對同一個動作何時開始和結束的判定是有誤差的，因此動作檢測的邊界往往有幾幀甚至幾十幀的偏移。如圖 1-3 中（a）所示，數(shù)據(jù)集中的標注動作是從 2025 幀開始的，但是實際上第 2025 幀和在其之前的第 2020 甚至第 2015 幀并無太大差異。（2）自然場景下的視頻質量不一，而且會有很多干擾，如鏡頭模糊和光線變化等，在這樣的條件下實現(xiàn)精準的動作檢測極具挑戰(zhàn)性。如圖 1-3 中（b）所示，視頻的鏡頭模糊和光線變化讓視頻中發(fā)生的動作變得難以區(qū)分。（3）不同類別的動作之間有很多共享的肢體動作或背景環(huán)境，也就是說對動作檢測有區(qū)分性的特征在視頻中占比很少。這些小細節(jié)對計算機來說是難以觀察捕捉，如在撐桿跳和跳遠這兩個運動中，運動員的助跑姿勢是一樣的，而且都是在標準的田徑場，背景又是高度一致的，如圖 1-3 中（c）所示。（4）不同的動作持續(xù)時長和整段視頻時長的比例變化非常大，不同的動作持續(xù)時長少則幾幀，多則幾百幀；而整段視頻的時長一般在 2000幀~20000 幀之間，二者的比例甚至能達到萬分之一，因此如何在時序上進行有效的建模是一個關鍵難點。

一般框架,特征提取,時序編碼,視頻

圖 2-1 人體動作識別的一般框架可分為輸入視頻、數(shù)據(jù)預處理、特征提取、時序編碼和動作分類五大步驟。第一步是獲取不同類型的輸入視頻，可以是基于常見的彩色圖像，也可以是經(jīng)過計算后的光流圖像或者特殊設備采集到的深度圖像等。第二步接著對數(shù)據(jù)進行必要的預處理，如數(shù)據(jù)歸一化和尺寸縮放等常見的數(shù)據(jù)增強方法，以及為了減輕計算復雜度常用的數(shù)據(jù)采樣，如對視頻的等間隔下采樣或者抽幀。第三步是對得到的基于幀的數(shù)據(jù)進行特征提取，得到統(tǒng)一的向量表達，常見的是手工特征和神經(jīng)網(wǎng)絡特征。第四步是通過時序編碼將提取的局部特征融合成全局視頻特征，一般分為基于傳統(tǒng)方法和神經(jīng)網(wǎng)絡方法這兩類。第五步是使用分類器對得到的特征進行分類學習，同樣地也有基于傳統(tǒng)方法和神經(jīng)網(wǎng)絡方法這兩類。由以上框架簡介可知，高質量的視頻特征對視頻分類的精度尤為重要，一般來說特征提取也是整個框架中最耗時的部分，因此這部分也是研究者的重點研究對象。下文也將主要介紹特征提取的相關技術。
【相似文獻】

相關期刊論文前10條

1 ;用概率判生死:法庭上的數(shù)學證據(jù)[J];語數(shù)外學習(高中版中旬);2017年01期

2 ;統(tǒng)計概率值[J];護理管理雜志;2009年06期

3 林兆升;甘玉華;;分析測試疑難問題評述及實例分析[J];重慶環(huán)境保護;1987年06期

4 屈定坤;Fuzzy概率預測初探[J];安徽財貿學院學報;1988年03期

5 葉子祥;用模糊事件的概率變換進行非線性相關因子篩選[J];氣象;1988年07期

6 崔德山;關于七點鏈[J];兵工學報;1988年03期

7 徐斌;;FTA中基本概率值選取途徑的探討[J];工業(yè)安全與防塵;1988年09期

8 葉子祥;;用模糊事件的概率變換進行非線性相關因子篩選[J];浙江氣象科技;1988年03期

9 劉治中;王俊德;叢樹錚;;P-Ⅲ型分布的期望概率計算[J];河海大學學報;1989年04期

10 王艷;模糊概率值法在曬煙品種(系)綜合評價中的應用[J];延邊大學農(nóng)學學報;2002年01期

相關碩士學位論文前10條

1 徐亮;基于邊界概率的級聯(lián)動作檢測技術研究[D];華中科技大學;2019年

2 洪嘉玲;基于光伏出力概率預測的儲能優(yōu)化配置方法[D];合肥工業(yè)大學;2019年

3 龐東澤;基于風電出力重構的風電容量效益評估研究[D];華北電力大學(北京);2019年

4 方凱;基于轉換概率分析的硬件木馬檢測方法研究[D];合肥工業(yè)大學;2019年

5 喻瑤;考慮員工偏好分布的服務型單位概率用工研究[D];杭州電子科技大學;2019年

6 堯睿智;基于貝葉斯方法的盾構隧道參數(shù)概率反演及可靠度分析[D];南昌大學;2019年

7 靳培英;11-15歲兒童概率概念認知水平與認知策略發(fā)展研究[D];杭州師范大學;2019年

8 李昊;販毒人員屬性關聯(lián)分析與概率預測[D];東北大學;2017年

9 許敏;概率教學情境下學生隨機性思維發(fā)展水平研究[D];閩南師范大學;2017年

10 周琳琳;概率反Top-k查詢上Why-not問題研究[D];浙江大學;2017年

本文編號：2835337

資料下載

論文發(fā)表

支付寶下載

Download by Alipay
微信下載

Download by Wechat
會員下載

Download by Member

本文鏈接：http://sikaile.net/kejilunwen/zidonghuakongzhilunwen/2835337.html

上一篇：基于生成對抗網(wǎng)絡的自監(jiān)督表示學習研究及應用
下一篇：輪腿式仿生機器人運動控制研究

論文發(fā)表

·知網(wǎng)|萬方|維普|龍源|省級|國家級|科技核心|北大核心|南大核心CSSCI|EI|SCI|SSCI|

天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

基于邊界概率的級聯(lián)動作檢測技術研究