非可控條件下人臉識(shí)別中的若干問(wèn)題研究
發(fā)布時(shí)間:2017-06-10 16:02
本文關(guān)鍵詞:非可控條件下人臉識(shí)別中的若干問(wèn)題研究,由筆耕文化傳播整理發(fā)布。
【摘要】:人臉識(shí)別是圖像處理、模式識(shí)別、機(jī)器學(xué)習(xí)等領(lǐng)域的經(jīng)典問(wèn)題。盡管目前已取得豐碩的研究成果,但當(dāng)前的人臉識(shí)別技術(shù)都具有如下限定:(1)可控的圖像采樣環(huán)境;(2)被識(shí)別對(duì)象的主動(dòng)配合。這些限定成為人臉識(shí)別技術(shù)發(fā)展和推廣的最大障礙。然而,隨著智能視頻分析、人臉匹配、人臉圖像搜索等應(yīng)用需求的增長(zhǎng),人們對(duì)非限定條件下的人臉識(shí)別技術(shù)的需求日益增長(zhǎng)。但是,非可控條件下的姿態(tài)、光照、表情和遮擋等復(fù)雜干擾因素可能導(dǎo)致人臉圖像的類(lèi)內(nèi)變化遠(yuǎn)大于類(lèi)間變化,這使人臉識(shí)別精度急劇下降而不能滿足實(shí)際應(yīng)用需求。本文以減少非可控條件下復(fù)雜干擾的影響為目標(biāo),圍繞人臉識(shí)別系統(tǒng)中的人臉圖像預(yù)處理、特征提取、相似性度量和判別分類(lèi)等關(guān)鍵步驟展開(kāi)研究,根據(jù)人臉識(shí)別任務(wù)的特點(diǎn),針對(duì)每個(gè)關(guān)鍵步驟,提出減少?gòu)?fù)雜干擾影響的解決方法。本文的主要貢獻(xiàn)如下:(1)提出了基于人臉圖像預(yù)評(píng)估的自適應(yīng)人臉驗(yàn)證方法。該方法首先按照預(yù)定義區(qū)域?qū)⑷四槍?duì)分割成多個(gè)圖像對(duì)。然后通過(guò)評(píng)估人臉對(duì)在關(guān)鍵點(diǎn)的圖像梯度差異,自適應(yīng)地選擇人臉區(qū)域上的圖像對(duì)。最后聯(lián)合選出的圖像對(duì)驗(yàn)證人臉對(duì)是否匹配。為了選擇圖像對(duì),提出了三種圖像對(duì)的可靠性評(píng)估方法:基于異常差異檢測(cè)的方法、基于支持向量回歸機(jī)的方法、基于堆棧自編碼深度網(wǎng)絡(luò)的方法。它們分別適用于對(duì)驗(yàn)證速度和驗(yàn)證精度要求不同的情形。實(shí)驗(yàn)表明,該人臉驗(yàn)證方法可以根據(jù)輸入人臉對(duì)的遮擋、表情等視覺(jué)干擾條件差異,自適應(yīng)地選擇受干擾影響較小的人臉區(qū)域驗(yàn)證該人臉對(duì)。與僅使用全臉的方法和直接聯(lián)合多人臉部件的方法相比,它可以有效減少局部干擾的影響。(2)提出了基于特征池化學(xué)習(xí)的高層人臉特征提取方法。首先提出一種新穎的特征池化學(xué)習(xí)算法。針對(duì)當(dāng)前特征池化方法無(wú)法描述人臉結(jié)構(gòu)信息且無(wú)法有效抑制局部噪音特征碼,引入池化權(quán)重向量和線性變換矩陣兩個(gè)模型參數(shù),基于Sum-Pooling定義新穎的池化操作。并設(shè)計(jì)一個(gè)交替迭代優(yōu)化算法學(xué)習(xí)該池化操作的模型參數(shù),通過(guò)學(xué)習(xí)池化操作實(shí)現(xiàn)學(xué)習(xí)人臉高層特征。然后,將提出的特征池化學(xué)習(xí)算法應(yīng)用于采用稀疏編碼方法提取的局部特征,在不同大小的人臉圖像塊上學(xué)習(xí)人臉高層特征。最后聯(lián)合所有圖像塊的高層特征形成人臉高層特征表達(dá)。實(shí)驗(yàn)表明,該方法可以提取不同層次的人臉結(jié)構(gòu)高層特征,同時(shí)也可以有效地抑制局部噪音特征碼。而且,提取的特征向量是低維的。(3)提出了基于視覺(jué)條件差異自適應(yīng)調(diào)整的距離度量學(xué)習(xí)算法。首先利用人臉對(duì)齊檢測(cè)的關(guān)鍵點(diǎn)位置關(guān)系和關(guān)鍵點(diǎn)上的局部特征,計(jì)算一對(duì)人臉關(guān)于姿態(tài)、表情、遮擋、光照的視覺(jué)條件差異。將這種與身份信息無(wú)關(guān)的視覺(jué)條件差異引入到特征空間的距離度量中,聯(lián)合馬氏距離定義新穎的距離度量。然后設(shè)計(jì)度量學(xué)習(xí)算法學(xué)習(xí)定義的新距離,并采用增廣拉格朗日方法求解相應(yīng)優(yōu)化問(wèn)題。優(yōu)化過(guò)程同時(shí)學(xué)習(xí)特征空間中的馬氏距離、視覺(jué)差異條件對(duì)馬氏距離的影響及相應(yīng)的調(diào)整規(guī)則。實(shí)驗(yàn)表明,在測(cè)試階段,對(duì)于一對(duì)人臉圖像,學(xué)習(xí)的距離度量能夠根據(jù)它們的視覺(jué)條件差異,自適應(yīng)地調(diào)整它們的特征向量計(jì)算的距離,從而有效地減小復(fù)雜干擾導(dǎo)致的類(lèi)內(nèi)變化。(4)提出了基于優(yōu)化訓(xùn)練和組織多分類(lèi)器的人臉驗(yàn)證方法。首先提出一種視覺(jué)一致性度量方法。然后分割成對(duì)的訓(xùn)練人臉圖像,并利用視覺(jué)一致性度量方法優(yōu)化組織分割的子圖對(duì),形成在不同人臉區(qū)域上、不同視覺(jué)一致性條件下的訓(xùn)練子集。接著融合多特征在每個(gè)子集上訓(xùn)練支持向量機(jī)分類(lèi)器。每個(gè)分類(lèi)器保存著特定人臉區(qū)域、特定視覺(jué)一致性條件下的分類(lèi)規(guī)則。在測(cè)試階段,根據(jù)一對(duì)人臉在全臉和人臉部件上的視覺(jué)一致性度量結(jié)果,自適應(yīng)地選擇分類(lèi)器并優(yōu)化組織它們執(zhí)行判別。實(shí)驗(yàn)表明,該方法能夠根據(jù)一對(duì)人臉在全臉和部件上的視覺(jué)干擾條件差異,自適應(yīng)地調(diào)整分類(lèi)判別規(guī)則驗(yàn)證該對(duì)人臉是否匹配,從而有效地減少?gòu)?fù)雜干擾的影響。
【關(guān)鍵詞】:支持向量回歸 深度自編碼網(wǎng)絡(luò) 特征池化學(xué)習(xí) 距離度量學(xué)習(xí) 多分類(lèi)器
【學(xué)位授予單位】:電子科技大學(xué)
【學(xué)位級(jí)別】:博士
【學(xué)位授予年份】:2015
【分類(lèi)號(hào)】:TP391.41
【目錄】:
- 摘要5-7
- ABSTRACT7-13
- 縮略詞表13-15
- 主要符號(hào)表15-17
- 第一章 緒論17-34
- 1.1 研究背景及意義17-19
- 1.2 研究現(xiàn)狀及存在的問(wèn)題19-29
- 1.2.1 概述19-20
- 1.2.2 人臉圖像預(yù)處理20-22
- 1.2.3 人臉特征提取22-25
- 1.2.4 人臉特征向量的距離度量25-27
- 1.2.5 判別分類(lèi)27-29
- 1.3 本文研究?jī)?nèi)容及創(chuàng)新點(diǎn)29-32
- 1.3.1 研究?jī)?nèi)容29-30
- 1.3.2 創(chuàng)新點(diǎn)30-32
- 1.4 本文的基本組織結(jié)構(gòu)32-34
- 第二章 基于人臉圖像預(yù)評(píng)估的自適應(yīng)人臉驗(yàn)證34-62
- 2.1 研究現(xiàn)狀及問(wèn)題形成34-36
- 2.2 預(yù)備知識(shí)36-39
- 2.2.1 主要概念與相關(guān)標(biāo)記36-37
- 2.2.2 關(guān)鍵點(diǎn)局部特征描述和圖像對(duì)關(guān)鍵點(diǎn)差異向量描述37-39
- 2.3 基于異常差異檢測(cè)的人臉區(qū)域選擇方法39-42
- 2.3.1 異常差異檢測(cè)和圖像對(duì)可靠性評(píng)估39-41
- 2.3.2 基于異常差異檢測(cè)的人臉區(qū)域選擇41-42
- 2.4 基于SVR的人臉區(qū)域選擇方法42-46
- 2.4.1 基于圖像對(duì)相似分的可靠性定義42-43
- 2.4.2 模型構(gòu)建與學(xué)習(xí)43-44
- 2.4.3 基于概率模型的區(qū)域選擇方法44-46
- 2.5 基于SAE的人臉區(qū)域選擇方法46-52
- 2.5.1 深度模型選擇47-48
- 2.5.2 深度網(wǎng)絡(luò)設(shè)計(jì)與訓(xùn)練48-51
- 2.5.3 基于SAE評(píng)估模型的區(qū)域選擇方法51-52
- 2.6 實(shí)驗(yàn)52-60
- 2.6.1 實(shí)驗(yàn)設(shè)置53-54
- 2.6.2 評(píng)估全臉和局部人臉54-55
- 2.6.3 分析與驗(yàn)證本工作提出的方法55-59
- 2.6.4 分析所提方法對(duì)視覺(jué)干擾條件差異的魯棒性59-60
- 2.7 本章小結(jié)60-62
- 第三章 基于特征池化學(xué)習(xí)的高層人臉特征表達(dá)62-87
- 3.1 研究現(xiàn)狀及問(wèn)題形成62-65
- 3.2 基于特征池化學(xué)習(xí)的高層人臉特征提取方法65-68
- 3.2.1 標(biāo)記與定義65-66
- 3.2.2 基于特征池化學(xué)習(xí)提取人臉高層特征的基本流程66-68
- 3.3 特征池化學(xué)習(xí)68-75
- 3.3.1 問(wèn)題形式化69-70
- 3.3.2 優(yōu)化與求解70-73
- 3.3.3 討論與分析73-75
- 3.4 實(shí)驗(yàn)75-85
- 3.4.1 人臉身份識(shí)別實(shí)驗(yàn)75-82
- 3.4.1.1 實(shí)驗(yàn)設(shè)置75-76
- 3.4.1.2 與經(jīng)典池化方法的比較76-79
- 3.4.1.3 對(duì)池化區(qū)域的分析79-80
- 3.4.1.4 與最近提出的池化學(xué)習(xí)算法比較80-82
- 3.4.2 人臉驗(yàn)證實(shí)驗(yàn)82-85
- 3.4.2.1 實(shí)驗(yàn)設(shè)置82
- 3.4.2.2 在非可控條件下評(píng)估學(xué)習(xí)的人臉高層特征82-84
- 3.4.2.3 學(xué)習(xí)的人臉高層特征與其它技術(shù)相聯(lián)合84-85
- 3.5 本章小結(jié)85-87
- 第四章 基于距離度量學(xué)習(xí)自適應(yīng)評(píng)估人臉相似性87-113
- 4.1 研究現(xiàn)狀及問(wèn)題形成87-89
- 4.2 基于視覺(jué)條件差異自適應(yīng)調(diào)整的距離度量學(xué)習(xí)89-96
- 4.2.1 距離度量定義89-90
- 4.2.2 形式化描述90-91
- 4.2.3 算法設(shè)計(jì)與求解91-93
- 4.2.4 算法討論與分析93-96
- 4.3 視覺(jué)條件差異評(píng)估96-102
- 4.3.1 概述96-97
- 4.3.2 基于形狀模型的視覺(jué)條件差異評(píng)估97-101
- 4.3.3 基于參照集方法的視覺(jué)條件差異評(píng)估101-102
- 4.4 實(shí)驗(yàn)102-111
- 4.4.1 人臉驗(yàn)證102-110
- 4.4.1.1 實(shí)驗(yàn)設(shè)置102-104
- 4.4.1.2 參數(shù)分析與模型分析104-107
- 4.4.1.3 比較實(shí)驗(yàn)107-110
- 4.4.2 人臉身份識(shí)別110-111
- 4.4.2.1 實(shí)驗(yàn)設(shè)置110
- 4.4.2.2 比較實(shí)驗(yàn)110-111
- 4.5 本章小結(jié)111-113
- 第五章 基于優(yōu)化訓(xùn)練和組織多分類(lèi)器的人臉驗(yàn)證113-136
- 5.1 研究現(xiàn)狀及問(wèn)題形成113-115
- 5.2 所提方法概述115-116
- 5.3 基于概率表達(dá)的視覺(jué)一致性度量116-118
- 5.4 基于VCM優(yōu)化訓(xùn)練多分類(lèi)器118-123
- 5.4.1 圖像對(duì)的多距離向量表達(dá)119-120
- 5.4.2 分組訓(xùn)練樣本和訓(xùn)練分類(lèi)器120-123
- 5.5 基于VCM優(yōu)化組織多分類(lèi)器執(zhí)行判別123-128
- 5.5.1 根據(jù)VCM計(jì)算分類(lèi)器決策分123
- 5.5.2 優(yōu)化組織多分類(lèi)器123-126
- 5.5.3 討論與分析126-128
- 5.6 實(shí)驗(yàn)128-134
- 5.6.1 實(shí)驗(yàn)設(shè)置128-129
- 5.6.2 評(píng)估圖像對(duì)的多距離向量表達(dá)129-130
- 5.6.3 分析基于VCM訓(xùn)練分類(lèi)器的貢獻(xiàn)130-132
- 5.6.4 評(píng)估優(yōu)化組織多分類(lèi)器的方案132-133
- 5.6.5 與當(dāng)前方法的比較133-134
- 5.7 本章小結(jié)134-136
- 第六章 總結(jié)和展望136-140
- 6.1 本學(xué)位論文的主要工作136-137
- 6.2 主要特色和創(chuàng)新點(diǎn)137-138
- 6.3 工作展望138-140
- 致謝140-141
- 參考文獻(xiàn)141-155
- 攻博期間取得的研究成果155-156
本文關(guān)鍵詞:非可控條件下人臉識(shí)別中的若干問(wèn)題研究,由筆耕文化傳播整理發(fā)布。
,本文編號(hào):439025
本文鏈接:http://sikaile.net/shoufeilunwen/xxkjbs/439025.html
最近更新
教材專(zhuān)著