基于人物交互動作行為識別方法研究
發(fā)布時間:2022-01-10 03:49
人體行為識別技術(shù)的飛速發(fā)展,使其逐漸滲入到許多行業(yè),是計算機自動理解真實場景的重要步驟,有著廣闊的應(yīng)用前景,越來越多的研究人員對其投入研究。通過分析人體行為的復雜度,發(fā)現(xiàn)相對于單人行為而言,交互行為的識別存在復雜性高,冗余信息量大,特征維數(shù)高且難以區(qū)分等特點,因此交互行為的特征選取及表達對識別算法起著至關(guān)重要的作用。對交互動作的研究大部分基于RGB圖像,雖然取得了較好的研究成果,但也存在一定的局限性。對于RGB圖像,復雜的背景,光照強度,角度等因素都會給交互行為識別帶來影響,使得識別率降低。所以在本文中,主要對如何結(jié)合深度圖像選取交互動作的特征提取以及優(yōu)化算法效率進行重點研究。本文的研究工作如下:利用多源信息的互補性,相應(yīng)地提取了各自的特征。本文首先對深度圖像采用Canny算子提取邊緣特征,對RGB圖像采用局部二值模式算子旋轉(zhuǎn)不變模式提取紋理特征,采用光流直方圖來描述動態(tài)特征;然后對提取的邊緣特征及紋理特征進行加權(quán)融合;之后利用基于稀疏編碼空間金字塔匹配模型(對靜態(tài)融合特征和光流運動軌跡特征進行編碼池化,將得到的池化特征再融合;最后采用支持向量機(Support Vector Mach...
【文章來源】:內(nèi)蒙古科技大學內(nèi)蒙古自治區(qū)
【文章頁數(shù)】:50 頁
【學位級別】:碩士
【部分圖文】:
*3窗口像素灰度值
內(nèi)蒙古科技大學碩士學位論文-7-產(chǎn)生了一個八位的二進制數(shù),將其轉(zhuǎn)化為對應(yīng)的十進制數(shù)就是這個區(qū)域的LBP值。LBP算子的數(shù)學公式為:802iiiLgsgg(式2.1)其中,g表示窗口中心灰度值,1,2,...,8igi表示相鄰像素的灰度值,1,00,0xsxx。這樣就將二進制序列轉(zhuǎn)化為十進制數(shù)字代表該區(qū)域的LBP值。原始的LBP算子的3*3固定區(qū)域應(yīng)用區(qū)域比較狹窄,而實際應(yīng)用中,需要滿足不用尺度或頻率紋理需求。之后改進的算子是以某一像素為中心在圓周上等間距選取像素點,其中圓的半徑R,圓周上采樣像素點的數(shù)目為P。具體的半徑R和像素點數(shù)目P需要根據(jù)圖像的實際情況來確定。下面對R,P取了三對值,具體表示如圖2.2所示。(a)R=1.P=8(b)R=1.5,P=12(c)R=2,P=16圖2.2不同取值的圓對稱鄰域集LBP算子的圓形區(qū)域采樣的方法對應(yīng)的數(shù)學公式為:1,02PiPRiiLgsgg(式2.2)P個鄰域像素點在和中心像素點灰度值進行比較后得到二進制串,加權(quán)求和后,會產(chǎn)生2P種二進制模式。由于1g總是位于中心像素相鄰采樣點的同一位置,當圖像發(fā)生旋轉(zhuǎn)時,對應(yīng)標點的灰度值會發(fā)生變化,從而會產(chǎn)生不同的LBP編碼,為了解決圖像因旋轉(zhuǎn)而產(chǎn)生不同LBP值的問題,提出了旋轉(zhuǎn)不變LBP特征。通過不斷旋轉(zhuǎn)最初的局部二值模式得到不同的LBP值,選取最小的LBP值對應(yīng)的局部二值模式,其對應(yīng)的公式為:,,min,|0,1,1nPRPRLRORLii…,P(式2.3)其中,函數(shù)RORx,i是對P比特位數(shù)值x按環(huán)形,比特位右移i次,得到局部二值模式。
內(nèi)蒙古科技大學碩士學位論文-8-原始的LBP算子與其不變模式對圖像處理的不同結(jié)果圖如圖2.3所示。(a)灰度圖(b)原始LBP算子處理結(jié)果(c)旋轉(zhuǎn)不變模式處理結(jié)果圖2.3原始LBP算子與不變模式處理結(jié)果2.1.2邊緣特征深度圖像的每個像素值只和傳感器距離圖像中物體的距離有關(guān),一定程度上減少了復雜背景、顏色、遮擋等因素的影響。深度圖像的邊緣包含豐富的信息,是區(qū)域?qū)傩园l(fā)生突變的地方[24,25]。邊緣上的灰度變化較平緩,其兩側(cè)變化較快。與RGB圖像相比,深度圖像中識別的目標更加突出,在邊緣的值變化明顯,所以提取出的邊緣更加純粹且良好,易于將目標與背景區(qū)分。常見的算子有Prewitt算子、Sobel算子、Canny算子等。其中,Prewitt算子和Sobel算子屬于梯度算子,對灰度漸變、低噪聲的圖像有較好的檢測結(jié)果。梯度算子比其他的算子計算起來更加簡單,但是計算出來的邊緣略粗糙,精度低。Canny算子對圖像的邊緣檢測更加精準、細致,檢測的結(jié)果比上述兩算子效果更好。因此,本文采用Canny算子[26]對深度圖像提取邊緣特征,其具體計算過程如下:(1)采用高斯濾波器平滑處理圖像。22221,exp()22xyGxy(式2.4)hx,yGx,yfx,y(式2.5)其中,是高斯函數(shù)的標準差,調(diào)節(jié)平滑程度;fx,y為原始圖像;hx,y為平滑處理后的圖像;表示卷積。(2)為了計算梯度幅值和方向,采用一階偏導的有限差分方法。對平滑圖像hx,y用22的一階有限差分計算二維高斯函數(shù)Gx,y的梯度。
本文編號:3579996
【文章來源】:內(nèi)蒙古科技大學內(nèi)蒙古自治區(qū)
【文章頁數(shù)】:50 頁
【學位級別】:碩士
【部分圖文】:
*3窗口像素灰度值
內(nèi)蒙古科技大學碩士學位論文-7-產(chǎn)生了一個八位的二進制數(shù),將其轉(zhuǎn)化為對應(yīng)的十進制數(shù)就是這個區(qū)域的LBP值。LBP算子的數(shù)學公式為:802iiiLgsgg(式2.1)其中,g表示窗口中心灰度值,1,2,...,8igi表示相鄰像素的灰度值,1,00,0xsxx。這樣就將二進制序列轉(zhuǎn)化為十進制數(shù)字代表該區(qū)域的LBP值。原始的LBP算子的3*3固定區(qū)域應(yīng)用區(qū)域比較狹窄,而實際應(yīng)用中,需要滿足不用尺度或頻率紋理需求。之后改進的算子是以某一像素為中心在圓周上等間距選取像素點,其中圓的半徑R,圓周上采樣像素點的數(shù)目為P。具體的半徑R和像素點數(shù)目P需要根據(jù)圖像的實際情況來確定。下面對R,P取了三對值,具體表示如圖2.2所示。(a)R=1.P=8(b)R=1.5,P=12(c)R=2,P=16圖2.2不同取值的圓對稱鄰域集LBP算子的圓形區(qū)域采樣的方法對應(yīng)的數(shù)學公式為:1,02PiPRiiLgsgg(式2.2)P個鄰域像素點在和中心像素點灰度值進行比較后得到二進制串,加權(quán)求和后,會產(chǎn)生2P種二進制模式。由于1g總是位于中心像素相鄰采樣點的同一位置,當圖像發(fā)生旋轉(zhuǎn)時,對應(yīng)標點的灰度值會發(fā)生變化,從而會產(chǎn)生不同的LBP編碼,為了解決圖像因旋轉(zhuǎn)而產(chǎn)生不同LBP值的問題,提出了旋轉(zhuǎn)不變LBP特征。通過不斷旋轉(zhuǎn)最初的局部二值模式得到不同的LBP值,選取最小的LBP值對應(yīng)的局部二值模式,其對應(yīng)的公式為:,,min,|0,1,1nPRPRLRORLii…,P(式2.3)其中,函數(shù)RORx,i是對P比特位數(shù)值x按環(huán)形,比特位右移i次,得到局部二值模式。
內(nèi)蒙古科技大學碩士學位論文-8-原始的LBP算子與其不變模式對圖像處理的不同結(jié)果圖如圖2.3所示。(a)灰度圖(b)原始LBP算子處理結(jié)果(c)旋轉(zhuǎn)不變模式處理結(jié)果圖2.3原始LBP算子與不變模式處理結(jié)果2.1.2邊緣特征深度圖像的每個像素值只和傳感器距離圖像中物體的距離有關(guān),一定程度上減少了復雜背景、顏色、遮擋等因素的影響。深度圖像的邊緣包含豐富的信息,是區(qū)域?qū)傩园l(fā)生突變的地方[24,25]。邊緣上的灰度變化較平緩,其兩側(cè)變化較快。與RGB圖像相比,深度圖像中識別的目標更加突出,在邊緣的值變化明顯,所以提取出的邊緣更加純粹且良好,易于將目標與背景區(qū)分。常見的算子有Prewitt算子、Sobel算子、Canny算子等。其中,Prewitt算子和Sobel算子屬于梯度算子,對灰度漸變、低噪聲的圖像有較好的檢測結(jié)果。梯度算子比其他的算子計算起來更加簡單,但是計算出來的邊緣略粗糙,精度低。Canny算子對圖像的邊緣檢測更加精準、細致,檢測的結(jié)果比上述兩算子效果更好。因此,本文采用Canny算子[26]對深度圖像提取邊緣特征,其具體計算過程如下:(1)采用高斯濾波器平滑處理圖像。22221,exp()22xyGxy(式2.4)hx,yGx,yfx,y(式2.5)其中,是高斯函數(shù)的標準差,調(diào)節(jié)平滑程度;fx,y為原始圖像;hx,y為平滑處理后的圖像;表示卷積。(2)為了計算梯度幅值和方向,采用一階偏導的有限差分方法。對平滑圖像hx,y用22的一階有限差分計算二維高斯函數(shù)Gx,y的梯度。
本文編號:3579996
本文鏈接:http://sikaile.net/shoufeilunwen/xixikjs/3579996.html
最近更新
教材專著