基于Gabor變換和LBP相結(jié)合的人臉識(shí)別算法的研究
第一章 緒論
1.1 人臉識(shí)別技術(shù)的研究背景
隨著現(xiàn)代智能信息技術(shù)的發(fā)展,計(jì)算機(jī)及互聯(lián)網(wǎng)技術(shù)越來(lái)越發(fā)達(dá),人們面對(duì)的信息安全性方面的挑戰(zhàn)也愈加強(qiáng)烈。怎樣使身份得到準(zhǔn)確、迅速的鑒別和確認(rèn)已經(jīng)成為社會(huì)急需解決的問(wèn)題[1]。個(gè)人證件或密碼是目前社會(huì)上主要應(yīng)用的身份鑒別方法,經(jīng)過(guò)長(zhǎng)時(shí)間的實(shí)踐得知,證件的遺失及密碼的丟失已經(jīng)嚴(yán)重威脅到人們?nèi)粘I钆c工作的信息安全。為尋求安全性更高的身份識(shí)別方法,研究人員通過(guò)人體特征不可復(fù)制這一特性將生物特性識(shí)別應(yīng)用于身份識(shí)別中。隨后,生物特征識(shí)別方法迅速發(fā)展并得到應(yīng)用,與過(guò)去常用的密碼及證件識(shí)別方法相比,其在身份識(shí)別應(yīng)用中具有快速準(zhǔn)確、安全、不可復(fù)制、不易偽造等諸多優(yōu)點(diǎn)[2]。眾所周知,生物特征(如指紋、基因、輪廓、語(yǔ)音等)是一個(gè)人獨(dú)特的特征,具有唯一性,按照此生物特征,現(xiàn)階段基于計(jì)算機(jī)基礎(chǔ)已經(jīng)開(kāi)發(fā)設(shè)計(jì)出諸多技術(shù)手段,用來(lái)對(duì)人體身份進(jìn)行識(shí)別,包括語(yǔ)音識(shí)別技術(shù)等,此方面的識(shí)別技術(shù)已經(jīng)得到認(rèn)可并受到廣泛應(yīng)用[3]。在以上的人體特征識(shí)別技術(shù)中,由于交互更加友好、使用時(shí)無(wú)心理障礙等優(yōu)勢(shì),人臉識(shí)別技術(shù)廣受用戶(hù)好評(píng),其次,人們還可以利用對(duì)人臉表情進(jìn)行分析可以獲得與其他識(shí)別方法難以獲取的信息[4]。除此之外,其還具有識(shí)別時(shí)的無(wú)接觸性、無(wú)強(qiáng)制性、無(wú)侵犯性等優(yōu)勢(shì),且人臉相比人體其他部位來(lái)說(shuō)更容易產(chǎn)生記憶。所以對(duì)人臉識(shí)別技術(shù)具有非常重要的研究意義,其也是目前身份識(shí)別、圖像處理等學(xué)科的研究熱點(diǎn)方向[5]。 對(duì)人臉識(shí)別技術(shù)進(jìn)行探索具有重要科學(xué)價(jià)值,主要體現(xiàn)在:首先,對(duì)人臉識(shí)別技術(shù)研究可以使人類(lèi)視覺(jué)系統(tǒng)的認(rèn)識(shí)得到深化;其次,對(duì)其研究可為人工智能應(yīng)用提供依據(jù)。所以,能夠在計(jì)算機(jī)上建立相應(yīng)的人臉識(shí)別系統(tǒng),對(duì)人臉圖像的識(shí)別有著巨大的應(yīng)用價(jià)值和應(yīng)用前景[6]。
.........
1.2 人臉識(shí)別算法的國(guó)內(nèi)外研究現(xiàn)狀
現(xiàn)階段,關(guān)于人臉識(shí)別技術(shù)國(guó)際上越來(lái)越多的國(guó)家組織開(kāi)始研究,主要包括歐美、日本等國(guó)家和地區(qū),其中對(duì)人臉識(shí)別技術(shù)的研究較為領(lǐng)先的有美國(guó) MIT 的媒體實(shí)驗(yàn)室,CMU 的人機(jī)交互研究機(jī)構(gòu),微軟研究中心,英國(guó)的劍橋工學(xué)院等機(jī)構(gòu)。自上世紀(jì) 90 年代來(lái),人臉識(shí)別技術(shù)隨著高速計(jì)算機(jī)的發(fā)展已經(jīng)跨入了機(jī)器自動(dòng)識(shí)別階段。 在人臉識(shí)別方面,國(guó)外大部分大學(xué)已經(jīng)取得了一定成果,涉及領(lǐng)域較為廣泛[7],其中,基于心理學(xué)層面來(lái)對(duì)人臉機(jī)理進(jìn)行探索,(如美國(guó)德克薩斯大學(xué)達(dá)拉斯分校的 Abdi和 Toole 小組[8],研究的主要內(nèi)容是人類(lèi)怎樣感知到人臉),有研究大腦對(duì)人臉識(shí)別中作用的(斯特靈大學(xué)的 Bruce 教授和格拉斯哥大學(xué)的 Burton 教授,主要對(duì)大腦對(duì)人臉識(shí)別的影響進(jìn)行研究,進(jìn)一步構(gòu)建了人臉認(rèn)知的兩大功能模型),有通過(guò)視覺(jué)機(jī)理研究人臉識(shí)別,還有學(xué)者從生理學(xué)角度對(duì)人類(lèi)視覺(jué)系統(tǒng)進(jìn)行研究(以荷蘭羅寧根大學(xué)的 Petkov小組為代表)。其他更多數(shù)的研究人員則把他們的研究重點(diǎn)放在了通過(guò)輸入圖像進(jìn)行智能人臉識(shí)別上。 隨著人臉識(shí)別技術(shù)的不斷發(fā)展,目前此技術(shù)在國(guó)際的研究主要分為下面幾個(gè)方向: (1)以幾何特征為基礎(chǔ)的人臉識(shí)別,目前以 MIT 的 Brunelli 和 Poggio 研究組為代表[9],其將改進(jìn)積分投影法應(yīng)用于人臉識(shí)別技術(shù),將 35 維人臉特征矢量采用歐氏距離表示。 (2)以模版匹配為基礎(chǔ)的人臉識(shí)別,目前以哈佛大學(xué) Smith-Kettlewell 眼睛研究中心為代表,將眼睛與嘴巴的輪廓利用彈性模版提取,并利用活動(dòng)輪廓模版將眉毛、下巴、鼻孔等描述出來(lái)。 (3)以 K-L 變換為基礎(chǔ)的人臉識(shí)別,目前以 MIT 的 Pentland 小組為代表[10],還出現(xiàn)了基于此類(lèi)的各種改進(jìn)技術(shù),例如耶魯大學(xué)的 Fisher 方法。
..........
第二章 經(jīng)典的人臉識(shí)別系統(tǒng)介紹
2.1 人臉圖像預(yù)處理
人臉識(shí)別技術(shù)具有很大的實(shí)踐意義,它主要以實(shí)際應(yīng)用為基礎(chǔ),利用人臉數(shù)據(jù)庫(kù)檢測(cè)對(duì)比識(shí)別算法的功能性,由此為算法的深入探討與研究提供可靠依據(jù),F(xiàn)今,國(guó)際上使用較為廣泛的人臉數(shù)據(jù)庫(kù)類(lèi)型較多,但是不管哪種類(lèi)型的人臉數(shù)據(jù)庫(kù)均有著基本相同的特性,如成像條件、數(shù)據(jù)規(guī)模、臉部圖像尺寸、樣本復(fù)雜程度等[16]。下表列出了部分通用人臉數(shù)據(jù)庫(kù)。該研究是基于 MATLAB2013a 完成的,并分別使用 Yale 人臉識(shí)數(shù)據(jù)庫(kù)、ORL 人臉識(shí)數(shù)據(jù)庫(kù)、FERET 人臉識(shí)數(shù)據(jù)庫(kù)模擬開(kāi)發(fā)人臉識(shí)別程序。并基于各種算法進(jìn)行 MATLAB運(yùn)算系統(tǒng)模擬,進(jìn)而求得各個(gè)算法的對(duì)于人臉的識(shí)別率、運(yùn)行速度及抗干擾能力,并在此基礎(chǔ)上分析、研究識(shí)別算法的性能及優(yōu)缺點(diǎn)。下文將重點(diǎn)闡述 Yale 人臉識(shí)數(shù)據(jù)庫(kù)、ORL 人臉識(shí)數(shù)據(jù)庫(kù)與 FERET 人臉識(shí)數(shù)據(jù)庫(kù)。它主要由 AT&T 研究中心(劍橋大學(xué))開(kāi)發(fā),該實(shí)驗(yàn)隨機(jī)抽取了四十名志愿者,每人采集十張圖片(尺寸為92?112),共計(jì)四百?gòu),每個(gè)志愿者的所有圖片需保證面部表情、角度等特征不同。耶魯大學(xué)的計(jì)算機(jī)視覺(jué)和控制研究機(jī)構(gòu)研發(fā)出 Yale 人臉數(shù)據(jù)庫(kù),該實(shí)驗(yàn)隨機(jī)抽取了十五名志愿者,每個(gè)志愿者采集十一張照片(尺寸為100?100),共計(jì)一百六十五張。需確保每個(gè)志愿者的所有圖片光照、表情等特征的不同。美國(guó)軍主數(shù)據(jù)庫(kù)項(xiàng)目中心研發(fā)出的 FERET 人臉識(shí)別系統(tǒng),隨機(jī)抽取二百名志愿者,每名志愿者采集七張照片(尺寸為128?128),共計(jì)一千四百?gòu)堈掌,每個(gè)志愿者的所有圖片需保證面部表情、角度等特征不同。因美國(guó)軍方數(shù)據(jù)庫(kù)統(tǒng)計(jì)的面部特征豐富,所以普遍用于人臉識(shí)別程序的模擬檢測(cè)中。
..........
2.2 基于主成分分析法的人臉特征提取
人臉識(shí)別主要應(yīng)用高維識(shí)別方式,學(xué)者 Sirovich&Kirby 于一九八七年提出 K-L 變換方法,以減小人臉識(shí)別的維度[25]。指出將人臉圖像以具有特征矢量的線性組合方式進(jìn)行反映。具體操作如下:把人臉圖像當(dāng)作高維向量,并通過(guò) K-L 變換來(lái)組建臉部特征空間,然后把初始圖像放在特征空間中一一投影,進(jìn)而得到相應(yīng)的圖像特征描述。二十世紀(jì)九十年代初,學(xué)者 Matthew Turk 基于 K-L 變換理論將“特征臉”引入人臉識(shí)別系統(tǒng),并成功在人臉識(shí)別系統(tǒng)中應(yīng)用 PCA 方法(主成分分析法)。它不僅能夠?qū)?shù)據(jù)進(jìn)行分類(lèi)處理,而且可以降低圖像的高維,大體思路為在數(shù)據(jù)空間中制定二維坐標(biāo)系,把高維向量投影至坐標(biāo)系上。它的優(yōu)點(diǎn)為實(shí)現(xiàn)了各種類(lèi)型的數(shù)據(jù)向量間的互換,可對(duì)數(shù)據(jù)進(jìn)類(lèi)別劃分,并刪除多余無(wú)用的坐標(biāo)空間,進(jìn)而縮小數(shù)據(jù)存儲(chǔ)量,并起到了降維作用 由人臉空間至特征空間的映射,即所謂的特征提取。而所謂的映射原則即為特征空間能夠?qū)?shù)據(jù)的重要分類(lèi)信息保留,但相較于原始數(shù)據(jù)空間,特征空間的維數(shù)很低。基于映射原則的 K-L 變換算法能夠?qū)?shù)據(jù)進(jìn)行分類(lèi)與壓縮。
..........
第三章 Gabor 小波和 LBP 的基本原理 ........ 23
3.1Gabor 小波 ....... 23
3.1.1 Gabor 小波變換知識(shí)介紹 ........ 23
3.1.2 2D-Gabor 小波變換原理 .......... 24
3.1.3 基于 Gabor 變換的人臉特征提取 .... 27
3.2 局部二值模式(LBP)基本原理 ...... 29
3.3 本章小結(jié) ......... 36
第四章 基于 2D-Gabor 小波和均勻模式 LBP 結(jié)合的特征提取算法 ..... 37
4.1 2D-Gabor 小波和均勻模式 LBP 相結(jié)合算法的介紹 .......... 37
4.2 2D-Gabor 小波和均勻模式 LBP 相結(jié)合的算法流程 .......... 37
4.3 實(shí)驗(yàn)結(jié)果與分析 ..... 40
4.4 本章小結(jié) ......... 48
第五章 總結(jié)及展望 .... 49
5.1 工作總結(jié) ......... 49
5.2 研究展望 ......... 49
第四章 基于 2D-Gabor 小波和均勻模式 LBP 結(jié)合的特征提取算法
4.1 2D-Gabor 小波和均勻模式 LBP 相結(jié)合算法的介紹
在人臉識(shí)別研究過(guò)程中,特征提取方法對(duì)識(shí)別結(jié)果有著重大且至關(guān)重要的作用,尋找一種不但可以反映圖像整體特征性信息,而且可以兼顧圖像局部特征信息的特征提取方法是現(xiàn)今人臉識(shí)別技術(shù)研究的關(guān)鍵。由于圖像細(xì)節(jié)信息的缺乏能夠降低特征提取的識(shí)別率,但是細(xì)節(jié)信息過(guò)多又會(huì)加大圖像維數(shù),進(jìn)而造成樣本量大、過(guò)于散亂、類(lèi)與類(lèi)之間界線不清,無(wú)法有效進(jìn)行特征歸類(lèi)。所以該論文例用 2D-Gabor 小波對(duì)原始圖像進(jìn)行特征提取,包括多角度特征提取與多尺度特征提取,以有效降低光照、旋轉(zhuǎn)等對(duì)圖像提取的干擾性,得到的圖像可利用 LBP 算法進(jìn)行編碼、組建直方圖,由此對(duì)圖像細(xì)節(jié)信息進(jìn)行充分的表現(xiàn),而后使用 PCA 方法琮降低圖像維數(shù)。 LBP 運(yùn)算過(guò)程中通過(guò)灰度對(duì)比對(duì)最后的提取值進(jìn)行選定,位置相近的兩個(gè)編碼具有一定的關(guān)聯(lián)性,會(huì)受到噪聲干擾的影響,若先用 2D-Gabor 小波對(duì)圖像進(jìn)行特征提取便可克服這一問(wèn)題。運(yùn)用 2D-Gabor 小波來(lái)過(guò)濾圖像,臉部圖像卷積時(shí)至少使用兩個(gè)以上的通道,使提取的細(xì)節(jié)特征更加完善、有用,增強(qiáng)圖像細(xì)節(jié)抗干擾能力。 2D-Gabor 小波可以增強(qiáng)抗干擾能力,同時(shí)可能對(duì)多個(gè)尺度、方向的特征信息進(jìn)行提取,針對(duì)局部紋理的提取,LBP 算法可以較好的表現(xiàn)出圖像的局部特征,同時(shí)能夠有效的減少維數(shù),所以運(yùn)用 2D-Gabor 小波過(guò)濾圖像后,可使用 LBP 算法對(duì)其編碼,可以有效彌補(bǔ) Gabor 小波提取算法的不足。
總結(jié)
目前,在人臉識(shí)別領(lǐng)域,圖像數(shù)據(jù)的分類(lèi)與特征提取有著十分重要的意義,臉部圖像特征的提取算法為核心技術(shù),直接關(guān)系著系統(tǒng)識(shí)別的正確率,2D-Gabor 小波對(duì)外界干擾如光照、姿態(tài)、表情等變化具有較強(qiáng)的魯棒性。但其同時(shí)也存在諸多問(wèn)題。本文采用 Gabor 小波和 LBP 相結(jié)合的特征提取方式來(lái)分析人臉識(shí)別技術(shù),并研發(fā)出基于 Gabor算法與均勻模式 LBP 算子的特征提取算法。能夠大幅提升人臉識(shí)別系統(tǒng)識(shí)別的速度與正確率,有效縮減了數(shù)據(jù)量,并且與多種通用人臉數(shù)據(jù)庫(kù)相兼容。 本文內(nèi)容工作如下所示:
1.首先,對(duì)人臉識(shí)別技術(shù)的研究背景和意義進(jìn)行了介紹。然后闡述了現(xiàn)有的國(guó)內(nèi)外人臉識(shí)別算法,并逐一闡述了它們的優(yōu)缺點(diǎn)。接著指出該課題研究時(shí)所用的新型算法,并對(duì)課題的核心內(nèi)容與論述順序進(jìn)行了闡述。
2.從以下幾點(diǎn)對(duì)應(yīng)用較為廣泛人臉識(shí)別程序進(jìn)行分析:一,人臉數(shù)據(jù)庫(kù);二,圖像的預(yù)處理;三,分類(lèi)器的研究設(shè)計(jì);四,主要的人臉識(shí)別技術(shù):在主成分分析原理的基礎(chǔ)上,對(duì)人臉識(shí)別算法進(jìn)行實(shí)驗(yàn)仿真。
3. Gabor 變換,該部分主要論述了核方程及濾波裝置組參數(shù)的確定;并對(duì)詳細(xì)論述了在 Gabor 小波變換基礎(chǔ)上實(shí)現(xiàn)的人臉特征提取法。局部二值模式(LBP),包括:LBP算子介紹、和均勻模式 LBP 算法;
4.重點(diǎn)對(duì)本文使用的人臉特征提取算法進(jìn)行闡述。對(duì)在 2D-Gabor 小波算法與均勻模式下 LBP 算子的基礎(chǔ)上實(shí)現(xiàn)的人臉特征提取算法進(jìn)行了詳細(xì)的論述,后將其應(yīng)用于不同的人臉數(shù)據(jù)庫(kù)進(jìn)行理論研究與模擬實(shí)驗(yàn),同時(shí)把它和傳統(tǒng)的特征提取算法進(jìn)行對(duì)比論述,,以驗(yàn)證它的可行性與有效性。
.........
參考文獻(xiàn)(略)
本文編號(hào):84490
本文鏈接:http://sikaile.net/wenshubaike/lwfw/84490.html