基于遮擋檢測與恢復(fù)的稀疏表示魯棒人臉識別算法研究
第 1 章 緒 論
1.1 課題背景及意義
二十一世紀(jì)是一個信息膨脹的時代,處于這個信息時代,計(jì)算機(jī)技術(shù)與信息技術(shù)飛速發(fā)展,我們頻繁利用各種媒體形式傳輸、交流和處理各種圖像、音頻、視頻等信息,因此需要為這些信息自動歸類處理建立系統(tǒng),相對于文字信息,圖像信息表現(xiàn)內(nèi)容更多,并且更加直觀、具體,同樣大小文字信息和圖像信息,后者所包含信息量遠(yuǎn)遠(yuǎn)超過前者,圖像成為我們獲取信息的重要途徑,對圖像分析、加工和處理也成為信息時代熱門研究。圖像識別技術(shù)是人工智能一個重要領(lǐng)域,在現(xiàn)代信息社會,隨著信息安全需求快速增長,圖像識別技術(shù)成為廣受關(guān)注的新興科學(xué)技術(shù),根據(jù)觀測到的圖像,利用現(xiàn)代信息處理技術(shù)與計(jì)算機(jī)技術(shù)對圖像信息進(jìn)行人類模擬和實(shí)現(xiàn),圖像識別過程可分為信息獲取、圖像預(yù)處理、圖像分割、特征提取、分類決策和輸出結(jié)果。一般情況下,獲取到原始目標(biāo)圖像由于受到一些隨機(jī)干擾或條件限制等影響造成圖像質(zhì)量下降,不能直接在圖像識別過程中使用,而需要在圖像識別之前對其進(jìn)行過濾噪聲、矯正灰度等預(yù)處理操作,常見預(yù)處理操作有平滑、中值濾波、邊緣檢測和梯度算子等;凈化處理后圖像進(jìn)行圖像分割,是將整個原始圖像分為若干個有意義、具有獨(dú)特性質(zhì)圖像子區(qū)域,是圖像處理技術(shù)關(guān)鍵步驟,現(xiàn)有圖像分割方法有閾值分割、區(qū)域分割、邊緣分割以及基于特定理論分割方法;圖像分割處理后對每個圖像子區(qū)域進(jìn)行特征提取,經(jīng)典特征提取方法有 Fourier 變換法、Gabor 小波變換法、最小二乘法、邊界方向直方圖法、基于 Tamura 紋理特征的紋理特征提取等;最后用設(shè)計(jì)的分類器依據(jù)提取特征對原始圖像進(jìn)行分類識別。隨著人工智能和計(jì)算機(jī)視覺不斷發(fā)展,圖像識別技術(shù)應(yīng)用越來越廣泛,例如軍事領(lǐng)域、公安偵查領(lǐng)域、臨床生物醫(yī)學(xué)領(lǐng)域、機(jī)器視覺領(lǐng)域、遙感衛(wèi)星領(lǐng)域、通訊領(lǐng)域等,圖像識別技術(shù)主要分為手寫文字圖像識別、指紋圖像識別、掌紋圖像識別、人臉圖像識別、虹膜圖像識別、條碼及二維碼圖像識別、遙感衛(wèi)星云圖識別等。其中人臉圖像識別技術(shù)隨著計(jì)算機(jī)技術(shù)發(fā)展得到很大提高,涉及計(jì)算機(jī)視覺、現(xiàn)代圖像處理、模式識別及應(yīng)用、機(jī)器學(xué)習(xí)等多種學(xué)科,人臉識別系統(tǒng)是一種高普遍性、可非接觸時采集的重要生物特征,應(yīng)用廣泛,可用于安全驗(yàn)證系統(tǒng)、銀行、醫(yī)學(xué)、公司打卡、檔案管理等系統(tǒng)中,與傳統(tǒng)指紋識別、虹膜識別等其他人體特征進(jìn)行識別相比,人臉識別技術(shù)更加友好、便利和精準(zhǔn),使用戶無任何心理障礙,已被用戶認(rèn)可與接受。近年來圖像識別研究表明,稀疏表示理論廣泛應(yīng)用于信號處理領(lǐng)域,也因其較好抗干擾能力和魯棒性被用于圖像識別,成為圖像識別技術(shù)熱門研究。
..........
1.2 國內(nèi)外研究現(xiàn)狀
人臉圖像是一種很常見視覺模式,人臉圖像視覺信息在社會生活中有重要意義和作用,自動人臉識別(Automatic Face Recognition, AFR)[1]是指能對人臉圖像自動進(jìn)行處理分析,從而獲得對應(yīng)識別信息,在公共安全、執(zhí)法、門禁、信息安全等領(lǐng)域應(yīng)用前景廣泛,自動人臉識別在未來社會生活中會與人們?nèi)粘I钕⑾⑾嚓P(guān),應(yīng)用會更加廣泛,可能會在交通、家居、國防、通信等多個行業(yè)領(lǐng)域發(fā)展。上個世紀(jì)六十年代開始,人臉識別系統(tǒng)得到國外一些公司青睞,美國、德國等發(fā)達(dá)國家某些公司看準(zhǔn)其應(yīng)用前景廣闊,與高效技術(shù)合作或動用大量人力物力獨(dú)立研發(fā),開發(fā)研制了多個人臉識別系統(tǒng)。人臉識別系統(tǒng)輸入圖像一般有正面、一定角度傾斜和側(cè)面三種情況,在實(shí)際生活中,對正面人臉圖像處理與研究最常見,其發(fā)展可分為三個階段[2],上個世紀(jì)五六十年代,Bertillon、Allen 和 Parke 等對人臉?biāo)枰娌刻卣鬟M(jìn)行研究,最初人臉識別工作不能自動完成識別,主要是人工操作完成,其中在 Bertillon開發(fā)的識別系統(tǒng)中,將輸入人臉圖像用一條簡單數(shù)據(jù)代碼表示,實(shí)現(xiàn)圖像向數(shù)據(jù)轉(zhuǎn)換,Allen 和 Parke 對 Bertillon 識別系統(tǒng)進(jìn)行改進(jìn),對人臉圖像進(jìn)行逼真設(shè)計(jì)描寫并用計(jì)算機(jī)實(shí)現(xiàn),首次提出能保留圖像信息灰度人臉圖像模型;隨著科技飛速發(fā)展,人臉識別技術(shù)進(jìn)入人機(jī)交互階段,提取正面人臉圖像幾何特征向量,人機(jī)交互是從人適應(yīng)計(jì)算機(jī)到計(jì)算機(jī)不斷適應(yīng)人的過程;近年來自動人臉識別的出現(xiàn)是人臉識別里程碑,多種人臉識別系統(tǒng)開發(fā)和越來越多相關(guān)文獻(xiàn)發(fā)表表明已經(jīng)進(jìn)入真正人臉識別技術(shù)階段,隨著計(jì)算機(jī)快速發(fā)展,人臉識別技術(shù)研究成為熱門課題,一些經(jīng)典算法如特征臉、子空間算法及神經(jīng)網(wǎng)絡(luò)識別算法等在該時期提出,且在實(shí)際中得到廣泛應(yīng)用,比如考勤門禁、安防、醫(yī)用等。
.........
第 2 章 理論基礎(chǔ)
2.1 引言
本章首先介紹稀疏表示分類算法,并對魯棒稀疏表示以及分塊稀疏表示進(jìn)行分析描述,然后對圖像處理中的特征提取做簡單介紹,主要介紹局部二值模式(LBP)及直方圖相交法。
.......
2.2 稀疏表示分類算法
信號稀疏表示是用盡可能少非零系數(shù)表示信號主要信息,從而使信號處理求解更加簡單,在樣本足夠多訓(xùn)練樣本空間中,對于某個類別的樣本對象,可以由訓(xùn)練樣本空間中的樣本子集近似線性表示,此時的表示系數(shù)是稀疏的,即絕大多數(shù)元素都為 0,稀疏表示模型可以抽象成一個線性方程組,設(shè)訓(xùn)練樣本集中共有C 個類,每個類有 n 個樣本,在人臉識別技術(shù)實(shí)際應(yīng)用中,人臉圖像往往難以避免有意識或無意識的遮擋或損壞,通常情況下,圖像遮擋區(qū)域意味著部分信息損失,這將影響人臉識別算法的性能和精度,魯棒稀疏表示分類將有效解決遮擋或損壞人臉識別問題,一般稀疏表示分類識別算法是用圖像整個全局信息,實(shí)際情況下,人臉圖像有光照變化、表情變化、姿態(tài)變化、遮擋或損壞等影響,局部信息有很大的不同,會導(dǎo)致全局信息的誤差變大,將每個樣本圖像重新采樣,裁剪成實(shí)驗(yàn)需要的大小,然后分成尺寸大小為 p?q 的子塊。如圖 2-3 所示,將大小為90?84像素的樣本圖像分割成 9 個同樣大小的圖像子塊,每個子塊的大小為30?28 像素,其中,圖像子塊 2 是由圖像子塊 1 形成的矩形框向右平移 28 個像素所得,圖像子塊 4 同樣由圖像子塊 1 形成的矩形框向下平移 30 個像素所得,其余圖像子塊依次類推。
........
第 3 章 基于多樣表示加權(quán)融合的動態(tài)字典人臉識別..........17
3.1 引言.... 17
3.2 遮擋消除......17
3.2.1 遮擋檢測.........18
3.2.2 動態(tài)字典.........19
3.3 多樣表示......20
3.4 實(shí)驗(yàn)仿真研究....... 22
3.4.1 AR 數(shù)據(jù)庫.......22
3.4.2 ORL 數(shù)據(jù)庫.... 23
3.4.3 Extended Yale B 數(shù)據(jù)庫.....24
3.5 本章小結(jié)......25
第 4 章基于遮擋重建的單演二值編碼人臉識別........27
4.1 引言.... 27
4.2 人臉圖像遮擋重建..........27
4.3 單演二值編碼....... 29
4.3.1 單演信號表示..........29
4.3.2 單演信號局部變化二值編碼.....31
4.3.3 單演信號局部強(qiáng)度二值編碼.....32
4.3.4 MBP 直方圖....32
4.4 實(shí)驗(yàn)仿真研究....... 33
第 5 章 基于局部相似度統(tǒng)計(jì)人臉識別.....39
5.1 引言.... 39
5.2 局部相似度統(tǒng)計(jì)分類.....40
5.3 實(shí)驗(yàn)仿真研究....... 42
5.4 本章小結(jié)......47
第 5 章 基于局部相似度統(tǒng)計(jì)人臉識別
5.1 引言
人臉識別技術(shù)是一種同時具有高精度和低干擾性的生物識別技術(shù),在信息安全、智能卡、訪問控制、門禁以及執(zhí)法監(jiān)控等社會應(yīng)用中具有潛在發(fā)展[51]。近 20 年在學(xué)術(shù)及工業(yè)應(yīng)用方面對人臉識別技術(shù)的關(guān)注顯著增加,同時也提出了很多種人臉識別方法,大多都是利用人臉圖像的整體屬性和全局信息,對人臉圖像的輪廓、膚色等特征進(jìn)行分析,對于受控條件下的人臉識別有效果明顯,但在實(shí)際中很多人臉圖像是在不受控制的情況下采集的,這對于人臉識別系統(tǒng)仍然有待研究。不受控制條件下的人臉圖像,如表情變化、局部遮擋或偽裝(由于太陽鏡、圍巾、或其他遮擋或偽裝情況等),會對人臉識別安全系統(tǒng)產(chǎn)生極大的挑戰(zhàn),相對于人臉圖像中遮擋區(qū)域,無遮擋區(qū)域具有更重要的信息,可以忽略遮擋區(qū)域或不重要特征變化的信息對人臉識別的干擾,只利用無遮擋局部人臉信息的相似度進(jìn)行分類識別,更具魯棒性。近年來,基于局部信息分析的圖像識別方法,如 Gabor 小波變換,局部二值模式、局部相似度等,廣泛用于人臉圖像識別[52]。Gabor 小波變換方法是對人臉圖像的特定部位、頻率成分和紋理方向等特征進(jìn)行提取,放大人臉圖像中五官等對分類識別的作用;LBP 是一種灰度尺度不變的紋理算子,通過對局部區(qū)域灰度值進(jìn)行二值編碼來反映該局部區(qū)域的紋理信息;而局部相似度則是通過相似度大小對人臉圖像直接得到局部人臉信息。相對于全局信息人臉識別,局部相似度統(tǒng)計(jì)方法對光照、遮擋等具有不敏感的特性,分塊后每個區(qū)域像素信息少,有效提高運(yùn)算速度,且能有效提高對遮擋等的魯棒性。在局部相似度統(tǒng)計(jì)方法中,首先將人臉圖像進(jìn)行等大小、不重疊分塊,然后對同一位置的子塊進(jìn)行相似度計(jì)算即計(jì)算兩個子塊圖像的歐氏距離,針對同一人臉圖像的子塊相似度進(jìn)行排序,只取有效子塊(即相似度較大的子塊)的相似度疊加得到一個綜合相似度,最后進(jìn)行統(tǒng)計(jì)分類,測試圖像和與之綜合相似度最大的人臉圖像屬于同類。當(dāng)人臉圖像具有遮擋等因素時,被污損的局部子塊與訓(xùn)練集樣本同一位置的子塊的相似度大小相近,且比無污損子塊的相似度小,會影響最終人臉分類識別性能,而只取相似度較大的子塊作為有效子塊進(jìn)行相似度疊加,則忽略了有污子塊對整體人臉識別的影響,更具魯棒性,且分類方法很直觀,易實(shí)現(xiàn)。
結(jié) 論
基于稀疏表示的人臉識別技術(shù)在近年來得到研究人員的廣泛關(guān)注,本文在有遮擋或損壞的條件下,對動態(tài)字典學(xué)習(xí)、遮擋重建、加權(quán)融合、局部特征提取、分塊局部統(tǒng)計(jì)等算法做了研究,同時融合現(xiàn)有相關(guān)論文算法并改進(jìn),取得了一定的研究成果:
(1) 基于多樣表示加權(quán)融合的動態(tài)字典人臉識別,首先提出了一種基于動態(tài)字典的人臉識別,利用下采樣的魯棒稀疏表示檢測遮擋區(qū)域,將所有樣本相應(yīng)區(qū)域消除生成動態(tài)字典,然后進(jìn)行稀疏表示人臉識別,對于動態(tài)字典人臉識別算法消除遮擋區(qū)域后人臉信息減少,提出基于多樣表示加權(quán)融合的動態(tài)字典人臉識別算法,加強(qiáng)每個原始樣本圖像中中等強(qiáng)度像素的重要性,同時減弱其他像素的影響,生成樣本圖像新的表示,并與原始樣本圖像進(jìn)行加權(quán)融合生成新的樣本集,利用動態(tài)字典進(jìn)行分類識別。實(shí)驗(yàn)表明,該算法對遮擋或損壞條件下人臉識別效果更顯著,具更高精度。
(2) 基于遮擋重建的單演二值編碼人臉識別,在人臉圖像有遮擋或損壞的條件下,局部遮擋區(qū)域?qū)θ四樧R別形成很大的干擾,對人臉識別性能有很大的影響,因此要對遮擋或損壞區(qū)域進(jìn)行一定的處理,,首先進(jìn)行遮擋區(qū)域檢測重建,最大程度降低遮擋或損壞區(qū)域?qū)θ四樧R別的影響,對重建后的人臉圖像提取單演信號局部特征,生成人臉圖像局部變化特征和局部強(qiáng)度特征,具體分為局部幅值、局部方向、局部相位三種信號,并進(jìn)行二值編碼,將其串聯(lián)組合進(jìn)行人臉識別。實(shí)驗(yàn)表明,該算法具有更魯棒、更精確的識別性能。
.........
參考文獻(xiàn)(略)
本文編號:369821
本文鏈接:http://sikaile.net/wenshubaike/caipu/369821.html