基于聯(lián)合編碼和卷積網(wǎng)絡(luò)的人臉圖像特征提取方法研究
發(fā)布時(shí)間:2020-08-13 18:55
【摘要】:人臉識別是圖像處理和計(jì)算機(jī)視覺領(lǐng)域的一個研究熱點(diǎn),經(jīng)過幾十年的發(fā)展,取得了令人矚目的進(jìn)展,但是人臉識別依然是一個具有挑戰(zhàn)性的研究課題,因?yàn)閳D像在拍攝過程受姿態(tài)、光照、遮擋等因素的影響,導(dǎo)致同類樣本的相似度減小、異類樣本的相似度提升。經(jīng)典的人臉識別系統(tǒng)主要包括檢測、對齊、特征提取和識別四個部分,其中特征提取對整個識別系統(tǒng)的性能起著至關(guān)重要的作用。本文以人臉識別為應(yīng)用背景,以提升人臉特征的魯棒性與判別性為研究目標(biāo),從手工設(shè)計(jì)、淺層學(xué)習(xí)和深層學(xué)習(xí)三個層面分別提出了三種人臉特征提取方法。本文主要研究工作和創(chuàng)新點(diǎn)如下:(1)在手工設(shè)計(jì)特征層面,提出多方向局部線形模式聯(lián)合編碼(Joint Encoding of Multi-Direction Line Binary Patterns,JEMDLBP)。該方法包含三個核心部分:局部方向線形模式(Direction Line Binary Patterns,DLBP)、顯著模式統(tǒng)計(jì)、多方向聯(lián)合編碼。不同于LBP在局部方形空間編碼,DLBP在局部線形空間編碼;顯著模式統(tǒng)計(jì)可以在不同數(shù)據(jù)庫、不同方向自適應(yīng)地提取顯著DLBP模式;多方向聯(lián)合編碼能夠捕捉多個方向DLBP模式之間的共生信息,從而提高特征的判別能力。在四個人臉識別數(shù)據(jù)庫和一個人臉表情識別數(shù)據(jù)庫上的實(shí)驗(yàn)結(jié)果表明JEMDLBP特征優(yōu)于傳統(tǒng)的局部二值模式類特征。(2)在淺層學(xué)習(xí)特征層面,提出判別概率潛在語義分析模型(Discriminative probabilistic Latent Semantic Analysis,DpLSA),把傳統(tǒng)人臉特征提取問題轉(zhuǎn)化為文檔主題分析問題進(jìn)行解決,為人臉特征提取提供全新的思路。針對基于主題模型p LSA的人臉識別算法所學(xué)特征P(z|d)(主題-圖像分布)缺乏明確意義的不足,本文提出的DpLSA模型利用每類訓(xùn)練樣本的結(jié)構(gòu)信息,給出一個新穎的單詞-主題分布初始化方法,在主題和圖像類別之間建立一一對應(yīng)關(guān)系,解決了傳統(tǒng)主題模型中如何選擇合適主題個數(shù)的問題、解決了EM算法對模型初始化的敏感問題、加快了模型的訓(xùn)練速度,更為重要的是Dp LSA學(xué)到的人臉圖像特征P(z|d)具有判別語義性,可以直接用于識別任務(wù)。在多個人臉數(shù)據(jù)庫上的實(shí)驗(yàn)結(jié)果表明DpLSA對光照、遮擋和姿態(tài)具有較好的魯棒性。(3)在深層學(xué)習(xí)特征層面,提出級聯(lián)K-means卷積特征學(xué)習(xí)方法(Cascaded K-means Convolutional Feature Learning,CKCFL),該方法延用卷積神經(jīng)網(wǎng)絡(luò)的特征提取思想,采用輕量級深度神經(jīng)網(wǎng)絡(luò)框架,在性能與效率兩方面提供良好的折中。CKCFL對深度神經(jīng)網(wǎng)絡(luò)的三個核心模塊:濾波器學(xué)習(xí)、特征變換和池化進(jìn)行深入研究。在卷積濾波器學(xué)習(xí)層,CKCFL將K-means算法用于加速卷積濾波器的學(xué)習(xí);在非線性變換層,利用激勵函數(shù)進(jìn)行非線性特征變換,實(shí)驗(yàn)發(fā)現(xiàn)Tanh函數(shù)的性能優(yōu)于其他激勵函數(shù);在特征池化層采用空間金字塔二階池化,一方面能夠刻畫不同維度特征之間的相關(guān)性,克服傳統(tǒng)一階池化只統(tǒng)計(jì)每個維度特征之間信息的不足,另一方面可以同時(shí)提取局部特征和整體特征。本文詳細(xì)探討了CKCFL的不同參數(shù)和模塊對識別率的影響,在AR、Extended Yale B、FERET和LFW等受限和非受限人臉數(shù)據(jù)庫上的實(shí)驗(yàn)結(jié)果證明了CKCFL特征的判別性和魯棒性。
【學(xué)位授予單位】:重慶大學(xué)
【學(xué)位級別】:博士
【學(xué)位授予年份】:2018
【分類號】:TP391.41;TP183
【圖文】:
(a) 圖 2.6 (a) 深度信念網(wǎng)Fig. 2.6 (a) Deep Brief N2.4.2 卷積神經(jīng)網(wǎng)絡(luò)卷積神經(jīng)網(wǎng)絡(luò)是 LeCun 等人[123]在于手寫數(shù)字識別,圖 2.7 顯示了兩階段① 局部感知野:由于圖像相鄰像部感知野來捕捉像素間相關(guān)信息,即接;逐層傳遞到深層,網(wǎng)絡(luò)可以學(xué)習(xí)② 權(quán)值共享:為了避免全鏈接方了權(quán)值共享策略,每一層的所有神經(jīng)取圖像的一類特征,則多種卷積濾波于兩方面,一方面減少模型參數(shù)、加速③ 特征池化層:采用池化層可以
本文編號:2792385
【學(xué)位授予單位】:重慶大學(xué)
【學(xué)位級別】:博士
【學(xué)位授予年份】:2018
【分類號】:TP391.41;TP183
【圖文】:
(a) 圖 2.6 (a) 深度信念網(wǎng)Fig. 2.6 (a) Deep Brief N2.4.2 卷積神經(jīng)網(wǎng)絡(luò)卷積神經(jīng)網(wǎng)絡(luò)是 LeCun 等人[123]在于手寫數(shù)字識別,圖 2.7 顯示了兩階段① 局部感知野:由于圖像相鄰像部感知野來捕捉像素間相關(guān)信息,即接;逐層傳遞到深層,網(wǎng)絡(luò)可以學(xué)習(xí)② 權(quán)值共享:為了避免全鏈接方了權(quán)值共享策略,每一層的所有神經(jīng)取圖像的一類特征,則多種卷積濾波于兩方面,一方面減少模型參數(shù)、加速③ 特征池化層:采用池化層可以
【參考文獻(xiàn)】
相關(guān)期刊論文 前1條
1 江悅;王潤生;王程;;采用上下文金字塔特征的場景分類[J];計(jì)算機(jī)輔助設(shè)計(jì)與圖形學(xué)學(xué)報(bào);2010年08期
相關(guān)博士學(xué)位論文 前4條
1 鄢萌;軟件倉庫的主題挖掘及其在軟件維護(hù)中的應(yīng)用研究[D];重慶大學(xué);2017年
2 蘇煜;融合全局和局部特征的人臉識別[D];哈爾濱工業(yè)大學(xué);2009年
3 鄧偉洪;高精度人臉識別算法研究[D];北京郵電大學(xué);2009年
4 山世光;人臉識別中若干關(guān)鍵問題的研究[D];中國科學(xué)院研究生院(計(jì)算技術(shù)研究所);2004年
本文編號:2792385
本文鏈接:http://sikaile.net/kejilunwen/zidonghuakongzhilunwen/2792385.html
最近更新
教材專著