自然場景下基于卷積神經(jīng)網(wǎng)絡(luò)的人臉檢測與人臉性別識別研究
發(fā)布時間:2020-12-20 07:50
人臉特征因其所包含的性別、表情、身份及年齡等大量信息,在公共安全、智能服務(wù)、人機交互等領(lǐng)域顯得至關(guān)重要;谌四樚卣鞯娜四槞z測及人臉性別識別如今已是計算機視覺領(lǐng)域的研究重點,但因自然場景下的人臉圖像會受到光照、姿態(tài)、表情、遮擋、尺寸等因素影響,從而影響人臉檢測與人臉性別識別效果。本文在卷積神經(jīng)網(wǎng)絡(luò)理論框架下,就自然場景下的人臉檢測與人臉性別識別問題開展研究,主要研究內(nèi)容如下:(1)基于四級級聯(lián)全卷積神經(jīng)網(wǎng)絡(luò)的人臉檢測研究傳統(tǒng)的人臉檢測存在提取特征表征能力較差,以及特征與分類器匹配程度不高等問題。針對上述情況,本文設(shè)計了一種基于四級級聯(lián)全卷積神經(jīng)網(wǎng)絡(luò)的人臉檢測算法;舅悸肥峭ㄟ^構(gòu)建四級級聯(lián)網(wǎng)絡(luò),采用級聯(lián)分級訓(xùn)練來代替端到端訓(xùn)練,以避免只共享一個網(wǎng)絡(luò)權(quán)值的局限,進(jìn)而獲得有區(qū)分性功能的深度網(wǎng)絡(luò),提高檢測精度;另外每級網(wǎng)絡(luò)均設(shè)計為全卷積結(jié)構(gòu),用于提升檢測速率;采用自舉法進(jìn)行網(wǎng)絡(luò)模型的優(yōu)化訓(xùn)練;最后通過前三級網(wǎng)絡(luò)逐步檢測過濾,同時借助最后一級網(wǎng)絡(luò)矯正輸出來得到人臉檢測結(jié)果。實驗結(jié)果表明,本文算法對于自然場景下的多姿態(tài)、遮擋、不同膚色人臉等均具有良好的魯棒性,同時檢測速度達(dá)到單張86ms,在人臉...
【文章來源】:河北工業(yè)大學(xué)天津市 211工程院校
【文章頁數(shù)】:81 頁
【學(xué)位級別】:碩士
【部分圖文】:
神經(jīng)元結(jié)構(gòu)示意圖
自然場景下基于卷積神經(jīng)網(wǎng)絡(luò)的人臉檢測與人臉性別識別研究-10-niiixw1(2.2)則激活函數(shù)f變?yōu)槿缦露x:0,001,fy(2.3)即如果0,此時這個神經(jīng)元被激活,處于興奮狀態(tài),f1;當(dāng)0時,該神經(jīng)元被抑制,f0。2.1.2前向傳播算法前向傳播算法(ForwardPropagation,FP)指在卷積神經(jīng)網(wǎng)絡(luò)中由前向后依次進(jìn)行的推導(dǎo)算法。以簡單的三層神經(jīng)網(wǎng)絡(luò)為例,如圖2.2所示,三層網(wǎng)絡(luò)由輸入層、輸出層及隱藏層組成。前向傳播為首先將數(shù)據(jù)從輸入層傳遞給中間的隱藏層,之后再將隱藏層的輸出傳給輸出層,經(jīng)輸出層得到最后的輸出結(jié)果,整個前向傳播過程中每一層神經(jīng)元狀態(tài)只會對下一層的神經(jīng)元產(chǎn)生影響。圖2.2三層網(wǎng)絡(luò)結(jié)構(gòu)示意圖假定輸入層存在s個神經(jīng)元,此層神經(jīng)元用i表示;中間隱藏層有t個神經(jīng)元,用j表示;最后的輸出層有o個神經(jīng)元,用k來表示。jiv表示i與j連接時對應(yīng)的權(quán)值,kjw表示j與k連接時對應(yīng)ix的權(quán)值。用.1f表示中間隱藏層的激活函數(shù),.2f為輸出層對應(yīng)的激活函數(shù)。若輸入值為ix,其中si,,...,0那么對于隱藏層的每個神經(jīng)元輸出的值可表示為:t,...,2,1,01jxvfzsiijik(2.4)輸出層的每個神經(jīng)元輸出的值為:o,...,2,1,02kzwfyqjkkjj(2.5)
自然場景下基于卷積神經(jīng)網(wǎng)絡(luò)的人臉檢測與人臉性別識別研究-12-"tyufnnll)((2.12)最后,通過采用靈敏度值對每個神經(jīng)元進(jìn)行權(quán)值更新。其中第l層的誤差對于該層每一個權(quán)值的導(dǎo)數(shù)值,即該網(wǎng)絡(luò)層對應(yīng)的輸入與該層的靈敏度的叉乘值。最終神經(jīng)元權(quán)值的更新就是前面得到的偏導(dǎo)數(shù)再乘上一個負(fù)的學(xué)習(xí)率:TlllxWE1(2.13)llWEW(2.14)2.2卷積神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu)卷積神經(jīng)網(wǎng)絡(luò)是一種含有多個卷積層的深度網(wǎng)絡(luò),其中每層又由多個二維平面組成,另外二維平面又由多個神經(jīng)元組成,如圖2.3所示,其基本網(wǎng)絡(luò)結(jié)構(gòu)由卷積層、池化層、全連接層、輸出層組成。圖2.3卷積神經(jīng)網(wǎng)絡(luò)的基本網(wǎng)絡(luò)結(jié)構(gòu)卷積層可看作由許多卷積核組成的一組平行的平面,其輸出為一組平行的映射特征圖,圖像的卷積過程可以看作為原始圖像中的像素與卷積核進(jìn)行加權(quán)求和的過程。此過程是通過在輸入圖像上滑動不同的卷積核并執(zhí)行卷積操作,其中,在每一次滑動的位置上,輸入圖像的每個像素點會與卷積核完成一次乘積并求和的運算,最終將感受野的信息投影到特征圖中。其每張?zhí)卣鲌D中的所有元素都是由一個卷積核計算得到的,即每張?zhí)卣鲌D共享了相同的權(quán)重和偏置。一般卷積核的尺寸要遠(yuǎn)小于輸入圖像的大小,然而過小的卷積核將會出現(xiàn)不完全覆蓋卷積的問題,一般使用圖像四周填補0像素操作來控制圖像大校設(shè)輸入圖像的尺寸為,,CWH,卷積核的維度為,,ckk21,則經(jīng)過卷積層得到的特征圖為:DSPSPWHDimHkZDW,1/2,1/2),,(KZkZZ21111(2.15)其中1H、1W、1D分別表示一張?zhí)卣鲌D的高度、寬度和深度,pZ為周邊補0的P填補
【參考文獻(xiàn)】:
期刊論文
[1]基于級聯(lián)Adaboost和神經(jīng)網(wǎng)絡(luò)主元分析算法的人臉檢測系統(tǒng)[J]. 李振雨,王好臣,王功亮,李家鵬. 科學(xué)技術(shù)與工程. 2018(01)
[2]Recent advances in efficient computation of deep convolutional neural networks[J]. Jian CHENG,Pei-song WANG,Gang LI,Qing-hao HU,Han-qing LU. Frontiers of Information Technology & Electronic Engineering. 2018(01)
[3]基于跨連卷積神經(jīng)網(wǎng)絡(luò)的性別分類模型[J]. 張婷,李玉鑑,胡海鶴,張亞紅. 自動化學(xué)報. 2016(06)
[4]基于卷積神經(jīng)網(wǎng)絡(luò)的人臉性別識別[J]. 汪濟民,陸建峰. 現(xiàn)代電子技術(shù). 2015(07)
[5]一種基于卷積神經(jīng)網(wǎng)絡(luò)的性別識別方法[J]. 蔡詩威,郭太良,姚劍敏. 電視技術(shù). 2014(19)
[6]人臉檢測技術(shù)現(xiàn)狀與發(fā)展研究[J]. 霍鵬. 科技信息. 2012(24)
[7]基于改進(jìn)BP網(wǎng)絡(luò)的人臉檢測與定位[J]. 周彩霞,易江義. 科學(xué)技術(shù)與工程. 2008(06)
[8]基于局部二元模式算子的人臉性別分類方法[J]. 孫寧,冀貞海,鄒采榮,趙力. 華中科技大學(xué)學(xué)報(自然科學(xué)版). 2007(S1)
[9]融合AdaBoost和啟發(fā)式特征搜索的人臉性別分類[J]. 朱文球,劉強. 計算機工程. 2007(02)
[10]基于支持向量AAM迭代學(xué)習(xí)的性別分類算法[J]. 陳華杰,韋巍. 浙江大學(xué)學(xué)報(工學(xué)版). 2005(12)
本文編號:2927502
【文章來源】:河北工業(yè)大學(xué)天津市 211工程院校
【文章頁數(shù)】:81 頁
【學(xué)位級別】:碩士
【部分圖文】:
神經(jīng)元結(jié)構(gòu)示意圖
自然場景下基于卷積神經(jīng)網(wǎng)絡(luò)的人臉檢測與人臉性別識別研究-10-niiixw1(2.2)則激活函數(shù)f變?yōu)槿缦露x:0,001,fy(2.3)即如果0,此時這個神經(jīng)元被激活,處于興奮狀態(tài),f1;當(dāng)0時,該神經(jīng)元被抑制,f0。2.1.2前向傳播算法前向傳播算法(ForwardPropagation,FP)指在卷積神經(jīng)網(wǎng)絡(luò)中由前向后依次進(jìn)行的推導(dǎo)算法。以簡單的三層神經(jīng)網(wǎng)絡(luò)為例,如圖2.2所示,三層網(wǎng)絡(luò)由輸入層、輸出層及隱藏層組成。前向傳播為首先將數(shù)據(jù)從輸入層傳遞給中間的隱藏層,之后再將隱藏層的輸出傳給輸出層,經(jīng)輸出層得到最后的輸出結(jié)果,整個前向傳播過程中每一層神經(jīng)元狀態(tài)只會對下一層的神經(jīng)元產(chǎn)生影響。圖2.2三層網(wǎng)絡(luò)結(jié)構(gòu)示意圖假定輸入層存在s個神經(jīng)元,此層神經(jīng)元用i表示;中間隱藏層有t個神經(jīng)元,用j表示;最后的輸出層有o個神經(jīng)元,用k來表示。jiv表示i與j連接時對應(yīng)的權(quán)值,kjw表示j與k連接時對應(yīng)ix的權(quán)值。用.1f表示中間隱藏層的激活函數(shù),.2f為輸出層對應(yīng)的激活函數(shù)。若輸入值為ix,其中si,,...,0那么對于隱藏層的每個神經(jīng)元輸出的值可表示為:t,...,2,1,01jxvfzsiijik(2.4)輸出層的每個神經(jīng)元輸出的值為:o,...,2,1,02kzwfyqjkkjj(2.5)
自然場景下基于卷積神經(jīng)網(wǎng)絡(luò)的人臉檢測與人臉性別識別研究-12-"tyufnnll)((2.12)最后,通過采用靈敏度值對每個神經(jīng)元進(jìn)行權(quán)值更新。其中第l層的誤差對于該層每一個權(quán)值的導(dǎo)數(shù)值,即該網(wǎng)絡(luò)層對應(yīng)的輸入與該層的靈敏度的叉乘值。最終神經(jīng)元權(quán)值的更新就是前面得到的偏導(dǎo)數(shù)再乘上一個負(fù)的學(xué)習(xí)率:TlllxWE1(2.13)llWEW(2.14)2.2卷積神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu)卷積神經(jīng)網(wǎng)絡(luò)是一種含有多個卷積層的深度網(wǎng)絡(luò),其中每層又由多個二維平面組成,另外二維平面又由多個神經(jīng)元組成,如圖2.3所示,其基本網(wǎng)絡(luò)結(jié)構(gòu)由卷積層、池化層、全連接層、輸出層組成。圖2.3卷積神經(jīng)網(wǎng)絡(luò)的基本網(wǎng)絡(luò)結(jié)構(gòu)卷積層可看作由許多卷積核組成的一組平行的平面,其輸出為一組平行的映射特征圖,圖像的卷積過程可以看作為原始圖像中的像素與卷積核進(jìn)行加權(quán)求和的過程。此過程是通過在輸入圖像上滑動不同的卷積核并執(zhí)行卷積操作,其中,在每一次滑動的位置上,輸入圖像的每個像素點會與卷積核完成一次乘積并求和的運算,最終將感受野的信息投影到特征圖中。其每張?zhí)卣鲌D中的所有元素都是由一個卷積核計算得到的,即每張?zhí)卣鲌D共享了相同的權(quán)重和偏置。一般卷積核的尺寸要遠(yuǎn)小于輸入圖像的大小,然而過小的卷積核將會出現(xiàn)不完全覆蓋卷積的問題,一般使用圖像四周填補0像素操作來控制圖像大校設(shè)輸入圖像的尺寸為,,CWH,卷積核的維度為,,ckk21,則經(jīng)過卷積層得到的特征圖為:DSPSPWHDimHkZDW,1/2,1/2),,(KZkZZ21111(2.15)其中1H、1W、1D分別表示一張?zhí)卣鲌D的高度、寬度和深度,pZ為周邊補0的P填補
【參考文獻(xiàn)】:
期刊論文
[1]基于級聯(lián)Adaboost和神經(jīng)網(wǎng)絡(luò)主元分析算法的人臉檢測系統(tǒng)[J]. 李振雨,王好臣,王功亮,李家鵬. 科學(xué)技術(shù)與工程. 2018(01)
[2]Recent advances in efficient computation of deep convolutional neural networks[J]. Jian CHENG,Pei-song WANG,Gang LI,Qing-hao HU,Han-qing LU. Frontiers of Information Technology & Electronic Engineering. 2018(01)
[3]基于跨連卷積神經(jīng)網(wǎng)絡(luò)的性別分類模型[J]. 張婷,李玉鑑,胡海鶴,張亞紅. 自動化學(xué)報. 2016(06)
[4]基于卷積神經(jīng)網(wǎng)絡(luò)的人臉性別識別[J]. 汪濟民,陸建峰. 現(xiàn)代電子技術(shù). 2015(07)
[5]一種基于卷積神經(jīng)網(wǎng)絡(luò)的性別識別方法[J]. 蔡詩威,郭太良,姚劍敏. 電視技術(shù). 2014(19)
[6]人臉檢測技術(shù)現(xiàn)狀與發(fā)展研究[J]. 霍鵬. 科技信息. 2012(24)
[7]基于改進(jìn)BP網(wǎng)絡(luò)的人臉檢測與定位[J]. 周彩霞,易江義. 科學(xué)技術(shù)與工程. 2008(06)
[8]基于局部二元模式算子的人臉性別分類方法[J]. 孫寧,冀貞海,鄒采榮,趙力. 華中科技大學(xué)學(xué)報(自然科學(xué)版). 2007(S1)
[9]融合AdaBoost和啟發(fā)式特征搜索的人臉性別分類[J]. 朱文球,劉強. 計算機工程. 2007(02)
[10]基于支持向量AAM迭代學(xué)習(xí)的性別分類算法[J]. 陳華杰,韋巍. 浙江大學(xué)學(xué)報(工學(xué)版). 2005(12)
本文編號:2927502
本文鏈接:http://sikaile.net/kejilunwen/zidonghuakongzhilunwen/2927502.html
最近更新
教材專著