基于深度特征建模的人體行為識(shí)別與檢測研究
發(fā)布時(shí)間:2021-07-28 22:43
人體行為識(shí)別近年來發(fā)展迅速,已經(jīng)成為計(jì)算機(jī)視覺領(lǐng)域的熱點(diǎn)問題,其目的在于分析理解視頻內(nèi)容,并識(shí)別出目標(biāo)人物的動(dòng)作類別。人體行為識(shí)別廣泛應(yīng)用于汽車自動(dòng)駕駛、人工智能機(jī)器人、無人零售以及安防監(jiān)控等領(lǐng)域。然而,由于視頻背景的復(fù)雜性、光照變換以及相機(jī)運(yùn)動(dòng)等外在因素,以及人體運(yùn)動(dòng)多變性等內(nèi)在因素,使得基于視頻的人體行為識(shí)別任務(wù)的研究充滿挑戰(zhàn)。傳統(tǒng)的行為識(shí)別算法主要依賴人工提取的標(biāo)準(zhǔn)特征,計(jì)算量大且時(shí)效性低。近年來,基于深度學(xué)習(xí)的行為識(shí)別算法已經(jīng)成為主流,大部分算法都采用雙流網(wǎng)絡(luò)(Two-Stream)結(jié)構(gòu)對(duì)視頻的空間和時(shí)間特征進(jìn)行學(xué)習(xí)。然而由于光流信息的語義不明確和數(shù)據(jù)冗余等問題,使得深度網(wǎng)絡(luò)模型在處理復(fù)雜視頻內(nèi)容時(shí)在計(jì)算和特征層面存在著一定局限性。本文重點(diǎn)研究在不使用額外運(yùn)動(dòng)信息的情況下,利用卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Network,CNN)和長短期記憶網(wǎng)絡(luò)(Long Short-Term Memory,LSTM)挖掘視頻中的判別信息,對(duì)視頻中的人體運(yùn)動(dòng)進(jìn)行分析與理解。本文主要工作如下:(1)本文提出了一種基于判別語義特征學(xué)習(xí)的深度人體行為識(shí)別算法。首先通過上下文...
【文章來源】:西安電子科技大學(xué)陜西省 211工程院校 教育部直屬院校
【文章頁數(shù)】:76 頁
【學(xué)位級(jí)別】:碩士
【部分圖文】:
012-2018年中國網(wǎng)絡(luò)視頻用戶規(guī)模及占比
識(shí)別三個(gè)方向。目前,視頻人體行為識(shí)別的研究方法主要分為兩種,分別是基于傳統(tǒng)人工標(biāo)準(zhǔn)特征的行為識(shí)別和基于深度學(xué)習(xí)的行為識(shí)別,如圖1.2。早期的行為識(shí)別方法基本上取決于手工制作的特征,首先對(duì)輸入的視頻數(shù)據(jù)進(jìn)行圖像去噪、圖像增強(qiáng)等預(yù)處理,然后對(duì)視頻中人體運(yùn)動(dòng)區(qū)域進(jìn)行目標(biāo)檢測、目標(biāo)分類、運(yùn)動(dòng)跟蹤、特征描述等一系列特征提取步驟,最后采用機(jī)器學(xué)習(xí)中的相關(guān)分類算法對(duì)數(shù)據(jù)進(jìn)行動(dòng)作識(shí)別與理解;跍\層高維編碼的局部時(shí)空特征是最著名的方法之一。最為廣泛使用的淺層方法是改進(jìn)的密集軌跡(iDT)算法,它描述了具有局部時(shí)空特征的稀疏時(shí)空興趣點(diǎn),即方向梯度直方圖(HOG)、光流直方圖(HOF)和運(yùn)動(dòng)邊界直方圖(MH)。使用詞袋(BUG)將上述描述符編碼為高維表示,可以通過空間金字塔池合并,然后與SVM分類器集成。此外,基于軌跡的人工特征表示的改進(jìn)包括Fisher矢量編碼,其本質(zhì)是使用似然函數(shù)的梯度向量來表達(dá)圖像。然而,傳統(tǒng)人工提取特征的方法很大程度上依賴于數(shù)據(jù)集的質(zhì)量
主要分為以下幾種:基于視頻序列、基于靜態(tài)圖像、基于深度圖像、基于骨骼節(jié)點(diǎn)。從數(shù)據(jù)包含信息的多少和采集設(shè)備的難易程度來看,視頻序列都是目前為止最優(yōu)的選擇,所以現(xiàn)今人體行為識(shí)別研究更偏向于視頻序列,其主要研究方法如圖2.1所示。接下來我們將分別介紹基于傳統(tǒng)人工標(biāo)準(zhǔn)特征和基于深度學(xué)習(xí)中幾種最具代表性的行為識(shí)別算法。圖2.1行為識(shí)別常用算法分類2.2 基基于于傳傳統(tǒng)統(tǒng)淺淺層層特特征征的的人人體體行行為為識(shí)識(shí)別別方方法法基于傳統(tǒng)的淺層特征提取方法可以分為局部和全局特征提取算法。以下做具體介紹:2.2.1 全全局局特特征征提提取取人體行為識(shí)別全局特征是指對(duì)檢測出來的目標(biāo)整體進(jìn)行表示,一般是通過背景剪除法、高斯背景模型等來實(shí)現(xiàn),通常采用的是人體的邊緣,光流語義以及剪影邊框等信息。但全局特征對(duì)噪聲、目標(biāo)遮擋、光線變化、視角變化等背景因素比較敏感;谌痔卣鞯奶崛∷惴ú襟E為:首先數(shù)據(jù)預(yù)處理部分先對(duì)圖像/視頻進(jìn)行背景分割、目標(biāo)檢測等處理,然后提取視圖像/視頻的全局特征并利用SVM等分類器進(jìn)9
本文編號(hào):3308791
【文章來源】:西安電子科技大學(xué)陜西省 211工程院校 教育部直屬院校
【文章頁數(shù)】:76 頁
【學(xué)位級(jí)別】:碩士
【部分圖文】:
012-2018年中國網(wǎng)絡(luò)視頻用戶規(guī)模及占比
識(shí)別三個(gè)方向。目前,視頻人體行為識(shí)別的研究方法主要分為兩種,分別是基于傳統(tǒng)人工標(biāo)準(zhǔn)特征的行為識(shí)別和基于深度學(xué)習(xí)的行為識(shí)別,如圖1.2。早期的行為識(shí)別方法基本上取決于手工制作的特征,首先對(duì)輸入的視頻數(shù)據(jù)進(jìn)行圖像去噪、圖像增強(qiáng)等預(yù)處理,然后對(duì)視頻中人體運(yùn)動(dòng)區(qū)域進(jìn)行目標(biāo)檢測、目標(biāo)分類、運(yùn)動(dòng)跟蹤、特征描述等一系列特征提取步驟,最后采用機(jī)器學(xué)習(xí)中的相關(guān)分類算法對(duì)數(shù)據(jù)進(jìn)行動(dòng)作識(shí)別與理解;跍\層高維編碼的局部時(shí)空特征是最著名的方法之一。最為廣泛使用的淺層方法是改進(jìn)的密集軌跡(iDT)算法,它描述了具有局部時(shí)空特征的稀疏時(shí)空興趣點(diǎn),即方向梯度直方圖(HOG)、光流直方圖(HOF)和運(yùn)動(dòng)邊界直方圖(MH)。使用詞袋(BUG)將上述描述符編碼為高維表示,可以通過空間金字塔池合并,然后與SVM分類器集成。此外,基于軌跡的人工特征表示的改進(jìn)包括Fisher矢量編碼,其本質(zhì)是使用似然函數(shù)的梯度向量來表達(dá)圖像。然而,傳統(tǒng)人工提取特征的方法很大程度上依賴于數(shù)據(jù)集的質(zhì)量
主要分為以下幾種:基于視頻序列、基于靜態(tài)圖像、基于深度圖像、基于骨骼節(jié)點(diǎn)。從數(shù)據(jù)包含信息的多少和采集設(shè)備的難易程度來看,視頻序列都是目前為止最優(yōu)的選擇,所以現(xiàn)今人體行為識(shí)別研究更偏向于視頻序列,其主要研究方法如圖2.1所示。接下來我們將分別介紹基于傳統(tǒng)人工標(biāo)準(zhǔn)特征和基于深度學(xué)習(xí)中幾種最具代表性的行為識(shí)別算法。圖2.1行為識(shí)別常用算法分類2.2 基基于于傳傳統(tǒng)統(tǒng)淺淺層層特特征征的的人人體體行行為為識(shí)識(shí)別別方方法法基于傳統(tǒng)的淺層特征提取方法可以分為局部和全局特征提取算法。以下做具體介紹:2.2.1 全全局局特特征征提提取取人體行為識(shí)別全局特征是指對(duì)檢測出來的目標(biāo)整體進(jìn)行表示,一般是通過背景剪除法、高斯背景模型等來實(shí)現(xiàn),通常采用的是人體的邊緣,光流語義以及剪影邊框等信息。但全局特征對(duì)噪聲、目標(biāo)遮擋、光線變化、視角變化等背景因素比較敏感;谌痔卣鞯奶崛∷惴ú襟E為:首先數(shù)據(jù)預(yù)處理部分先對(duì)圖像/視頻進(jìn)行背景分割、目標(biāo)檢測等處理,然后提取視圖像/視頻的全局特征并利用SVM等分類器進(jìn)9
本文編號(hào):3308791
本文鏈接:http://sikaile.net/kejilunwen/shengwushengchang/3308791.html
最近更新
教材專著