基于聯(lián)合編碼和卷積網(wǎng)絡(luò)的人臉圖像特征提取方法研究
發(fā)布時(shí)間:2020-08-13 18:55
【摘要】:人臉識(shí)別是圖像處理和計(jì)算機(jī)視覺(jué)領(lǐng)域的一個(gè)研究熱點(diǎn),經(jīng)過(guò)幾十年的發(fā)展,取得了令人矚目的進(jìn)展,但是人臉識(shí)別依然是一個(gè)具有挑戰(zhàn)性的研究課題,因?yàn)閳D像在拍攝過(guò)程受姿態(tài)、光照、遮擋等因素的影響,導(dǎo)致同類樣本的相似度減小、異類樣本的相似度提升。經(jīng)典的人臉識(shí)別系統(tǒng)主要包括檢測(cè)、對(duì)齊、特征提取和識(shí)別四個(gè)部分,其中特征提取對(duì)整個(gè)識(shí)別系統(tǒng)的性能起著至關(guān)重要的作用。本文以人臉識(shí)別為應(yīng)用背景,以提升人臉特征的魯棒性與判別性為研究目標(biāo),從手工設(shè)計(jì)、淺層學(xué)習(xí)和深層學(xué)習(xí)三個(gè)層面分別提出了三種人臉特征提取方法。本文主要研究工作和創(chuàng)新點(diǎn)如下:(1)在手工設(shè)計(jì)特征層面,提出多方向局部線形模式聯(lián)合編碼(Joint Encoding of Multi-Direction Line Binary Patterns,JEMDLBP)。該方法包含三個(gè)核心部分:局部方向線形模式(Direction Line Binary Patterns,DLBP)、顯著模式統(tǒng)計(jì)、多方向聯(lián)合編碼。不同于LBP在局部方形空間編碼,DLBP在局部線形空間編碼;顯著模式統(tǒng)計(jì)可以在不同數(shù)據(jù)庫(kù)、不同方向自適應(yīng)地提取顯著DLBP模式;多方向聯(lián)合編碼能夠捕捉多個(gè)方向DLBP模式之間的共生信息,從而提高特征的判別能力。在四個(gè)人臉識(shí)別數(shù)據(jù)庫(kù)和一個(gè)人臉表情識(shí)別數(shù)據(jù)庫(kù)上的實(shí)驗(yàn)結(jié)果表明JEMDLBP特征優(yōu)于傳統(tǒng)的局部二值模式類特征。(2)在淺層學(xué)習(xí)特征層面,提出判別概率潛在語(yǔ)義分析模型(Discriminative probabilistic Latent Semantic Analysis,DpLSA),把傳統(tǒng)人臉特征提取問(wèn)題轉(zhuǎn)化為文檔主題分析問(wèn)題進(jìn)行解決,為人臉特征提取提供全新的思路。針對(duì)基于主題模型p LSA的人臉識(shí)別算法所學(xué)特征P(z|d)(主題-圖像分布)缺乏明確意義的不足,本文提出的DpLSA模型利用每類訓(xùn)練樣本的結(jié)構(gòu)信息,給出一個(gè)新穎的單詞-主題分布初始化方法,在主題和圖像類別之間建立一一對(duì)應(yīng)關(guān)系,解決了傳統(tǒng)主題模型中如何選擇合適主題個(gè)數(shù)的問(wèn)題、解決了EM算法對(duì)模型初始化的敏感問(wèn)題、加快了模型的訓(xùn)練速度,更為重要的是Dp LSA學(xué)到的人臉圖像特征P(z|d)具有判別語(yǔ)義性,可以直接用于識(shí)別任務(wù)。在多個(gè)人臉數(shù)據(jù)庫(kù)上的實(shí)驗(yàn)結(jié)果表明DpLSA對(duì)光照、遮擋和姿態(tài)具有較好的魯棒性。(3)在深層學(xué)習(xí)特征層面,提出級(jí)聯(lián)K-means卷積特征學(xué)習(xí)方法(Cascaded K-means Convolutional Feature Learning,CKCFL),該方法延用卷積神經(jīng)網(wǎng)絡(luò)的特征提取思想,采用輕量級(jí)深度神經(jīng)網(wǎng)絡(luò)框架,在性能與效率兩方面提供良好的折中。CKCFL對(duì)深度神經(jīng)網(wǎng)絡(luò)的三個(gè)核心模塊:濾波器學(xué)習(xí)、特征變換和池化進(jìn)行深入研究。在卷積濾波器學(xué)習(xí)層,CKCFL將K-means算法用于加速卷積濾波器的學(xué)習(xí);在非線性變換層,利用激勵(lì)函數(shù)進(jìn)行非線性特征變換,實(shí)驗(yàn)發(fā)現(xiàn)Tanh函數(shù)的性能優(yōu)于其他激勵(lì)函數(shù);在特征池化層采用空間金字塔二階池化,一方面能夠刻畫不同維度特征之間的相關(guān)性,克服傳統(tǒng)一階池化只統(tǒng)計(jì)每個(gè)維度特征之間信息的不足,另一方面可以同時(shí)提取局部特征和整體特征。本文詳細(xì)探討了CKCFL的不同參數(shù)和模塊對(duì)識(shí)別率的影響,在AR、Extended Yale B、FERET和LFW等受限和非受限人臉數(shù)據(jù)庫(kù)上的實(shí)驗(yàn)結(jié)果證明了CKCFL特征的判別性和魯棒性。
【學(xué)位授予單位】:重慶大學(xué)
【學(xué)位級(jí)別】:博士
【學(xué)位授予年份】:2018
【分類號(hào)】:TP391.41;TP183
【圖文】:
(a) 圖 2.6 (a) 深度信念網(wǎng)Fig. 2.6 (a) Deep Brief N2.4.2 卷積神經(jīng)網(wǎng)絡(luò)卷積神經(jīng)網(wǎng)絡(luò)是 LeCun 等人[123]在于手寫數(shù)字識(shí)別,圖 2.7 顯示了兩階段① 局部感知野:由于圖像相鄰像部感知野來(lái)捕捉像素間相關(guān)信息,即接;逐層傳遞到深層,網(wǎng)絡(luò)可以學(xué)習(xí)② 權(quán)值共享:為了避免全鏈接方了權(quán)值共享策略,每一層的所有神經(jīng)取圖像的一類特征,則多種卷積濾波于兩方面,一方面減少模型參數(shù)、加速③ 特征池化層:采用池化層可以
本文編號(hào):2792385
【學(xué)位授予單位】:重慶大學(xué)
【學(xué)位級(jí)別】:博士
【學(xué)位授予年份】:2018
【分類號(hào)】:TP391.41;TP183
【圖文】:
(a) 圖 2.6 (a) 深度信念網(wǎng)Fig. 2.6 (a) Deep Brief N2.4.2 卷積神經(jīng)網(wǎng)絡(luò)卷積神經(jīng)網(wǎng)絡(luò)是 LeCun 等人[123]在于手寫數(shù)字識(shí)別,圖 2.7 顯示了兩階段① 局部感知野:由于圖像相鄰像部感知野來(lái)捕捉像素間相關(guān)信息,即接;逐層傳遞到深層,網(wǎng)絡(luò)可以學(xué)習(xí)② 權(quán)值共享:為了避免全鏈接方了權(quán)值共享策略,每一層的所有神經(jīng)取圖像的一類特征,則多種卷積濾波于兩方面,一方面減少模型參數(shù)、加速③ 特征池化層:采用池化層可以
【參考文獻(xiàn)】
相關(guān)期刊論文 前1條
1 江悅;王潤(rùn)生;王程;;采用上下文金字塔特征的場(chǎng)景分類[J];計(jì)算機(jī)輔助設(shè)計(jì)與圖形學(xué)學(xué)報(bào);2010年08期
相關(guān)博士學(xué)位論文 前4條
1 鄢萌;軟件倉(cāng)庫(kù)的主題挖掘及其在軟件維護(hù)中的應(yīng)用研究[D];重慶大學(xué);2017年
2 蘇煜;融合全局和局部特征的人臉識(shí)別[D];哈爾濱工業(yè)大學(xué);2009年
3 鄧偉洪;高精度人臉識(shí)別算法研究[D];北京郵電大學(xué);2009年
4 山世光;人臉識(shí)別中若干關(guān)鍵問(wèn)題的研究[D];中國(guó)科學(xué)院研究生院(計(jì)算技術(shù)研究所);2004年
本文編號(hào):2792385
本文鏈接:http://sikaile.net/kejilunwen/zidonghuakongzhilunwen/2792385.html
最近更新
教材專著