人臉圖像識別關(guān)鍵技術(shù)的研究
本文關(guān)鍵詞:人臉圖像識別關(guān)鍵技術(shù)的研究
更多相關(guān)文章: 人臉圖像識別 Gabor濾波 局部二值模式 特征向量 局部紋理主導(dǎo)方向
【摘要】:機(jī)器擁有理解人類情感、感知外部世界的能力一直是人類追求的目標(biāo)。蒸汽機(jī)革命使機(jī)器代替了人的手工勞動,解放了人的四肢;電氣革命以及近代的信息革命使得人類可以利用機(jī)器增強(qiáng)自身的視覺和聽覺能力,同時(shí)一些簡單而又冗長的計(jì)算也可由機(jī)器來完成。如今,如何使機(jī)器像人一樣擁有感知、理解和判斷的能力,代替人完成一些重復(fù)、繁瑣的腦力勞動,從而使人能夠抽出時(shí)間做一些更有意義的事情,就成了現(xiàn)代人工智能技術(shù)要解決的課題。人臉圖像識別,是指通過對人臉圖像或圖像序列的分析,機(jī)器判斷出圖像上人的身份、性別、年齡以及面部表情等特征的過程,是建立在概率論、最優(yōu)化技術(shù)、信息論、深度學(xué)習(xí)以及流型學(xué)習(xí)等學(xué)科基礎(chǔ)之上的實(shí)踐性很強(qiáng)的一門學(xué)科,是當(dāng)前計(jì)算機(jī)視覺研究領(lǐng)域的一個(gè)非;钴S的分支。本文對人臉身份識別和人臉表情識別兩個(gè)課題進(jìn)行了深入的研究,提出了三個(gè)新的算法。其中前兩個(gè)算法圍繞著如何提高人臉身份識別的性能一復(fù)雜度比,分別從人臉圖像上局部二值模式LBP出現(xiàn)的概率和圖像紋理的主導(dǎo)方向兩個(gè)角度進(jìn)行展開,而第三個(gè)算法為采用ADABOOST從一系列由局部紋理主導(dǎo)方向分布特征所構(gòu)成的弱分類器中訓(xùn)練出高性能的人臉表情識別分類器。本文的主要?jiǎng)?chuàng)新及貢獻(xiàn)如下:1.數(shù)碼相機(jī)和智能手機(jī)等移動終端的出現(xiàn),使得圖像的采集變成了一項(xiàng)非常容易的事情。由于移動終端等嵌入式設(shè)備的計(jì)算和存儲能力有限,要在移動終端實(shí)現(xiàn)人臉圖像識別,需要將采集到的圖像通過網(wǎng)絡(luò)發(fā)送到服務(wù)器端,在服務(wù)器端進(jìn)行識別后再將識別的結(jié)果返回移動終端。然而圖像的數(shù)據(jù)量很大,而壓縮后的圖像會造成特征紋理的損失,同時(shí)無線傳輸?shù)挠邢迬捯矔斐尚盘枌?shí)時(shí)傳輸?shù)钠款i。第3章提出了一種網(wǎng)絡(luò)環(huán)境下在移動終端上進(jìn)行人臉圖像識別的新的算法,該算法采用維數(shù)較小的可變長占主導(dǎo)作用的特征向量VLDF作為人臉圖像的特征表示。具體來講,移動終端負(fù)責(zé)圖像的采集、Gabor變換、LBP特征提取、可變長直方圖特征求取等硬件電路能夠完成的工作;所采集的人臉圖像的VLDF特征發(fā)送到服務(wù)器端后,服務(wù)器端將其與圖像庫中已知身份的人臉圖像的VLDF特征進(jìn)行比對,計(jì)算二者之間的距離。最后將距離最小的圖像庫中的人的身份作為被測人臉圖像的人的身份發(fā)給移動終端,完成人臉圖像的識別。從試驗(yàn)中獲得數(shù)據(jù)得知,雖然理論上有256種模式類型,但80%的像素點(diǎn)的模式集中在平均約9種起主導(dǎo)作用的模式類型上,僅占通常采用的Uniform LBP特征的特征向量長度的1/6。在FERET人臉圖像數(shù)據(jù)庫上的實(shí)驗(yàn)結(jié)果表明,論文提出的基于VLDF算法的性能要優(yōu)于PCA、Fisherface、LBP以及Gabor-M+FLDA。尤其是在對存在亮度變化的人臉圖像的識別性能方面,其識別率達(dá)到了0.9381,遠(yuǎn)遠(yuǎn)地高于上述四種算法.2.第4章采用局部Gabor主導(dǎo)方向模式LGDDP特征作為人臉圖像的特征表示,并應(yīng)用該特征表示構(gòu)建了一種新的人臉圖像識別算法。該算法充分利用了Gabor算子和LBP算子在捕捉圖像紋理結(jié)構(gòu)特征上的互補(bǔ)性。人臉圖像首先進(jìn)行Gabor濾波,得到多個(gè)尺度和多個(gè)方向的濾波輸出;接著每一像素周圍的8鄰接像素中最大和第二大的兩個(gè)像素相對于中心像素的方向被編碼成LGDDP。利用LGDDP獲得圖像的空間直方圖向量,并采用加權(quán)空間直方圖相似度度量進(jìn)行人臉圖像識別。相比目前已發(fā)表的人臉圖像識別算法,該算法具有較高的準(zhǔn)確率和較低的運(yùn)算復(fù)雜度。3.人臉表情是人內(nèi)心世界的反映。通過識別人臉表情,機(jī)器可以獲知人對某一事件的看法及其精神狀態(tài)。如了解課堂上學(xué)生對老師授課的感興趣的程度、了解司機(jī)駕駛時(shí)是否處于疲勞狀態(tài)、觀眾(顧客)對某一廣告(商品)的感興趣程度等等,因而自動人臉表情識別具有非常重要的實(shí)用價(jià)值。當(dāng)前的人臉表情識別的研究所利用的特征可分為基于人臉容貌的特征和基于臉部器官兒何位置的特征,研究的內(nèi)容可分為單幅人臉表情圖像和包含表情開始到表情高潮再到表情結(jié)束的圖像序列。第5章提出了一種基于單幀圖像的人臉表情識別算法,該算法結(jié)合了人臉圖像的幾何特征和容貌特征,在提取了人臉不同部位基準(zhǔn)點(diǎn)附近的紋理特征并構(gòu)建各自的分類器之后,采用ADABOOST的方法將多個(gè)分類器進(jìn)行組合,從而實(shí)現(xiàn)高性能的人臉表情分類識別。算法主要的優(yōu)點(diǎn)有:1)分別計(jì)算兩眼、鼻尖和嘴角區(qū)域的特征,將這些區(qū)域的特征向量進(jìn)行連接并構(gòu)成最終的特征向量。相比提取整個(gè)人臉容貌的特征,這種特征向量能夠有效地提高算法對不同臉型的魯棒性;2)采用Gabor濾波提取圖像各個(gè)尺度和方向的紋理信息,提取紋理的局部主導(dǎo)方向分布特征LTDD來構(gòu)造各個(gè)區(qū)域的分類器;3).采用ADABOOST方法從所構(gòu)造的多個(gè)分類器中挑選出性能較好的一些分類器,賦予他們合適的權(quán)值并進(jìn)行組合,從而構(gòu)造出高性能的人臉表情分類器。通過在Cohn-Kanade人臉數(shù)據(jù)庫上的實(shí)驗(yàn)驗(yàn)證了該表情分類識別算法的有效性。
【學(xué)位授予單位】:北京郵電大學(xué)
【學(xué)位級別】:博士
【學(xué)位授予年份】:2015
【分類號】:TP391.41
【相似文獻(xiàn)】
中國期刊全文數(shù)據(jù)庫 前10條
1 陳寧;;交通中的圖像識別應(yīng)用[J];軟件工程師;2012年04期
2 殷曉磊;;海訊圖像識別 連結(jié)“天”與“地”——專訪上海亮風(fēng)臺(上海)信息科技有限公司聯(lián)合創(chuàng)始人廖春元[J];上海信息化;2013年06期
3 高巖,蔡韓輝,丁智,鄭根福,謝駿;圖像識別中的小內(nèi)孔問題[J];大連輕工業(yè)學(xué)院學(xué)報(bào);2000年04期
4 丁國芳,譚兆信,湯庸,章云;圖像識別的一個(gè)綜合網(wǎng)絡(luò)模型及其應(yīng)用[J];貴州工業(yè)大學(xué)學(xué)報(bào)(自然科學(xué)版);2002年04期
5 張曉春,劉巖;基于計(jì)算機(jī)圖像識別的表面裂紋檢測方法[J];重型機(jī)械;2003年05期
6 張艷輝 ,孫以材;圖像識別在四探針測試技術(shù)中的應(yīng)用[J];電子產(chǎn)品世界;2004年03期
7 趙新子,吳巍,司秀麗,袁洪印;玉米種子活力圖像識別與處理技術(shù)研究[J];吉林農(nóng)業(yè)大學(xué)學(xué)報(bào);2004年05期
8 司秀麗;吳巍;趙新子;彭占武;袁洪印;;玉米種子純度的計(jì)算機(jī)圖像識別[J];吉林農(nóng)業(yè)大學(xué)學(xué)報(bào);2005年06期
9 馬仲智;;基于單片機(jī)的圖像識別模組的研究[J];科技信息(科學(xué)教研);2007年18期
10 王方永;王克如;王崇桃;李少昆;朱玉;陳兵;明博;潘文超;;基于圖像識別的棉花水分狀況診斷研究[J];石河子大學(xué)學(xué)報(bào)(自然科學(xué)版);2007年04期
中國重要會議論文全文數(shù)據(jù)庫 前10條
1 高曉丁;左賀;高鵬;;基于圖像識別的多套色印花對花定位技術(shù)研究[A];佶龍杯第四屆全國印花學(xué)術(shù)研討會論文集[C];2009年
2 郭艷;王萍;朱國;;基于圖像識別的射擊自動報(bào)靶系統(tǒng)[A];計(jì)算機(jī)技術(shù)與應(yīng)用進(jìn)展·2007——全國第18屆計(jì)算機(jī)技術(shù)與應(yīng)用(CACIS)學(xué)術(shù)會議論文集[C];2007年
3 姜洪臣;任曉磊;趙耀宏;徐波;;基于音頻語譜圖像識別的廣告檢索[A];第十一屆全國人機(jī)語音通訊學(xué)術(shù)會議論文集(二)[C];2011年
4 姜洪臣;任曉磊;趙耀宏;徐波;;基于音頻語譜圖像識別的廣告檢索技術(shù)[A];第十一屆全國人機(jī)語音通訊學(xué)術(shù)會議論文集(一)[C];2011年
5 劉翠響;孫以材;張艷;于明;;基于三控制要素的多項(xiàng)式模糊擬合在人臉圖像識別中的應(yīng)用[A];第25屆中國控制會議論文集(下冊)[C];2006年
6 林達(dá)宜;邱利松;張莎;;物聯(lián)網(wǎng)發(fā)展與圖像識別[A];2012全國無線及移動通信學(xué)術(shù)大會論文集(上)[C];2012年
7 王利強(qiáng);張紅梅;;儲糧害蟲圖像識別知識庫研究[A];計(jì)算機(jī)研究新進(jìn)展(2010)——河南省計(jì)算機(jī)學(xué)會2010年學(xué)術(shù)年會論文集[C];2010年
8 俞建榮;卜凡亮;李文力;陸曉軍;;流化床氣泡運(yùn)動的圖像識別與分析[A];第三屆全國信息獲取與處理學(xué)術(shù)會議論文集[C];2005年
9 李靈;;情景智能圖像識別和數(shù)字化處理技術(shù)在型式評價(jià)試驗(yàn)中的運(yùn)用[A];2013年江蘇省計(jì)量測試學(xué)會學(xué)術(shù)會議論文集[C];2013年
10 于麗穎;;圖像識別方法技術(shù)分析與應(yīng)用[A];第24屆全國煤礦自動化與信息化學(xué)術(shù)會議暨第6屆中國煤礦信息化與自動化高層論壇論文集[C];2014年
中國重要報(bào)紙全文數(shù)據(jù)庫 前10條
1 記者 鄭曉春;以開發(fā)出計(jì)算機(jī)圖像識別新技術(shù)[N];科技日報(bào);2007年
2 沈曉光邋編譯;半導(dǎo)體技術(shù)向低耗能發(fā)展[N];中國電子報(bào);2008年
3 記者 李紅;法研究出圖像識別軟件[N];科技日報(bào);2000年
4 海言;慧視:讓電腦“識文斷字”[N];科技日報(bào);2007年
5 田夢;PDF圖像識別助推電子政務(wù)[N];計(jì)算機(jī)世界;2007年
6 比爾·蓋茨;軟件邊界不斷改變令人興奮[N];中國電子報(bào);2008年
7 宋輝;擺脫束縛慧視展現(xiàn)新的生活體驗(yàn)[N];中國企業(yè)報(bào);2004年
8 本報(bào)記者 湯銘;認(rèn)知計(jì)算,未來計(jì)算[N];計(jì)算機(jī)世界;2013年
9 馮遜;埃及金字塔人類史上最大的謎[N];大眾科技報(bào);2010年
10 本報(bào)記者 楊學(xué)聰 閆靜;觸碰“最未來”的生活[N];經(jīng)濟(jì)日報(bào);2014年
中國博士學(xué)位論文全文數(shù)據(jù)庫 前10條
1 劉軍;人臉圖像識別關(guān)鍵技術(shù)的研究[D];北京郵電大學(xué);2015年
2 王宇新;基于特征分布的圖像識別方法研究與應(yīng)用[D];大連理工大學(xué);2012年
3 陳健美;基于密度聚類和多特征融合的醫(yī)學(xué)圖像識別研究[D];江蘇大學(xué);2008年
4 冉瑞生;一些矩陣計(jì)算問題及其在圖像識別中的應(yīng)用研究[D];電子科技大學(xué);2006年
5 李雅梅;南宋川南墓葬石刻藝術(shù)與計(jì)算機(jī)圖像識別應(yīng)用的研究[D];重慶大學(xué);2008年
6 侯書東;基于相關(guān)投影分析的特征提取研究及在圖像識別中的應(yīng)用[D];南京理工大學(xué);2012年
7 吳萌;多尺度表達(dá)和正則化方法在圖像識別中的研究與應(yīng)用[D];上海交通大學(xué);2014年
8 謝鉉洋;SARS醫(yī)學(xué)圖像識別與輔助診斷研究[D];中國科學(xué)技術(shù)大學(xué);2006年
9 孫權(quán)森;基于相關(guān)投影分析的特征抽取與圖像識別研究[D];南京理工大學(xué);2006年
10 翟俊海;基于小波變換和模糊粗糙集技術(shù)的圖像識別[D];河北大學(xué);2010年
中國碩士學(xué)位論文全文數(shù)據(jù)庫 前10條
1 王明靜;蟻群算法在圖像識別中的應(yīng)用研究[D];西安石油大學(xué);2015年
2 劉宜闊;熱光關(guān)聯(lián)圖像識別的研究[D];河北大學(xué);2015年
3 田湘源;基于圖像識別的中國畫真?zhèn)舞b別方法研究[D];西安建筑科技大學(xué);2015年
4 任皓;基于圖像識別的PCB焊接質(zhì)量檢測技術(shù)的研究[D];天津理工大學(xué);2015年
5 王倩;基于圖像識別的油畫真?zhèn)舞b別方法研究[D];西安建筑科技大學(xué);2015年
6 余征;基于Hadoop的人臉圖像識別并行處理方法研究與實(shí)現(xiàn)[D];西南交通大學(xué);2015年
7 馬爽;基于圖像識別的教室照明節(jié)能系統(tǒng)的技術(shù)研究[D];沈陽理工大學(xué);2015年
8 李義;基于相關(guān)學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)的圖像識別方法研究[D];哈爾濱工業(yè)大學(xué);2015年
9 李東;基于群智能算法優(yōu)化的超聲乳腺腫瘤圖像識別[D];第四軍醫(yī)大學(xué);2015年
10 林開彬;基于圖像識別的無紙化閱卷空白題識別技術(shù)研究[D];貴州師范大學(xué);2015年
,本文編號:1205723
本文鏈接:http://sikaile.net/shoufeilunwen/xxkjbs/1205723.html