基于卷積神經(jīng)網(wǎng)絡(luò)的人臉表情識(shí)別研究
發(fā)布時(shí)間:2020-04-19 01:53
【摘要】:由于人機(jī)交互研究的不斷深入以及巨大的應(yīng)用前景,對(duì)人臉面部表情進(jìn)行識(shí)別和分析已成為計(jì)算機(jī)視覺(jué)中非常重要、活躍和流行的課題。在過(guò)去幾年中,深度學(xué)習(xí)在許多應(yīng)用領(lǐng)域均取得了突破性成果,包括語(yǔ)音識(shí)別、圖像理解、自然語(yǔ)言處理等。與傳統(tǒng)方法用人工提取圖像的幾何、紋理特征不同,本文使用深度學(xué)習(xí)的卷積神經(jīng)網(wǎng)絡(luò)方法自動(dòng)提取人臉圖像特征,對(duì)人臉表情識(shí)別問(wèn)題進(jìn)行了研究,具體研究?jī)?nèi)容包括以下幾點(diǎn):1.盡管卷積神經(jīng)網(wǎng)絡(luò)已經(jīng)被用于許多計(jì)算機(jī)視覺(jué)任務(wù)并表現(xiàn)出色,但是現(xiàn)有的網(wǎng)絡(luò)結(jié)構(gòu)對(duì)全連接層的關(guān)注卻很少?紤]到全連接層在不同尺度下的特征提取能力不同,本文對(duì)傳統(tǒng)的單通道全連接層進(jìn)行改進(jìn),設(shè)計(jì)了一種新的雙通道卷積神經(jīng)網(wǎng)絡(luò),不僅提高了網(wǎng)絡(luò)性能,而且增強(qiáng)了網(wǎng)絡(luò)的特征表達(dá)能力。使用傳統(tǒng)特征提取方法易出現(xiàn)識(shí)別錯(cuò)誤率高,對(duì)光照、姿態(tài)和遮擋變化容忍度差等問(wèn)題,本文設(shè)計(jì)的雙通道卷積神經(jīng)網(wǎng)絡(luò)模型能有效解決這些缺點(diǎn)。2.傳統(tǒng)的激活函數(shù)都只能擬合二維函數(shù),Maxout卻可以擬合任意維度的函數(shù),為了能夠更精確地表達(dá)高維特征信息,在全連接層用Maxout激活函數(shù)代替?zhèn)鹘y(tǒng)的ReLU激活函數(shù);與傳統(tǒng)的激活函數(shù)相比,Maxout激活函數(shù)的輸出具有非稀疏性,將其與Dropout技術(shù)結(jié)合使用,Dropout用在Maxout網(wǎng)絡(luò)層的后面,優(yōu)化了網(wǎng)絡(luò)內(nèi)部結(jié)構(gòu)。3.理想的面部表情特征具有比最小的類間距離更小的最大類內(nèi)距離,但現(xiàn)有算法很少能有效地實(shí)現(xiàn)這一標(biāo)準(zhǔn)。本文在模型訓(xùn)練過(guò)程中使用A-Softmax損失,通過(guò)操縱特征面產(chǎn)生角度間隔,使用角度作為距離度量,將角度距離和學(xué)習(xí)到的特征相結(jié)合,增強(qiáng)了對(duì)不同面部表情特征的辨別能力。4.設(shè)計(jì)并實(shí)現(xiàn)了人臉動(dòng)態(tài)表情識(shí)別系統(tǒng),并使用不同卷積神經(jīng)網(wǎng)絡(luò)模型進(jìn)行了動(dòng)態(tài)表情識(shí)別實(shí)驗(yàn),結(jié)果表明,雙通道卷積神經(jīng)網(wǎng)絡(luò)具有較好的識(shí)別準(zhǔn)確度和實(shí)時(shí)性,可應(yīng)用于實(shí)時(shí)的人臉表情識(shí)別。
【圖文】:
圖 2-1 神經(jīng)元模型 2-1 中,單個(gè)神經(jīng)元與其它若干個(gè)神經(jīng)元進(jìn)行連接,并接收經(jīng)元傳遞過(guò)來(lái)的信號(hào)作為輸入信號(hào),這些輸入信號(hào)通過(guò)帶權(quán)之間進(jìn)行傳遞,,神經(jīng)元將接收到的輸入信號(hào)的總輸入值與該比較,并通過(guò)“激活函數(shù)”處理從而產(chǎn)生神經(jīng)元的輸出。將元按照一定的層次結(jié)構(gòu)進(jìn)行連接,就得到了神經(jīng)網(wǎng)絡(luò)。知機(jī)模型機(jī)一共由兩層神經(jīng)元構(gòu)成,如圖 2-2 所示,輸入層神經(jīng)元接并將接收到的輸入信號(hào)傳遞給輸出層的神經(jīng)元,公式(2-1)出層的神經(jīng)元進(jìn)行激活處理。y f ( )(2-1)i i w x (2-2)w i n以及閾值 可通過(guò)學(xué)習(xí)得
圖 2-2 兩個(gè)輸入神經(jīng)元的感知機(jī)模型層神經(jīng)元1x 、2x 接收來(lái)自外界的輸入信神經(jīng)元,因?yàn)楦兄獧C(jī)只激活輸出層神能力非常有限,F(xiàn)實(shí)應(yīng)用中,更多的稱多層感知機(jī)(Multilayer Perception,間的神經(jīng)元被稱為隱層或隱含層,隱層的神經(jīng)元僅與其下一層的神經(jīng)元完接。MLP 的輸入層神經(jīng)元接收外部輸收的信號(hào),最后輸出層神經(jīng)元輸出最終模型本結(jié)構(gòu)包含三種不同類型的結(jié)構(gòu)層,分2-3 所示:
【學(xué)位授予單位】:長(zhǎng)春工業(yè)大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2019
【分類號(hào)】:TP391.41;TP183
本文編號(hào):2632792
【圖文】:
圖 2-1 神經(jīng)元模型 2-1 中,單個(gè)神經(jīng)元與其它若干個(gè)神經(jīng)元進(jìn)行連接,并接收經(jīng)元傳遞過(guò)來(lái)的信號(hào)作為輸入信號(hào),這些輸入信號(hào)通過(guò)帶權(quán)之間進(jìn)行傳遞,,神經(jīng)元將接收到的輸入信號(hào)的總輸入值與該比較,并通過(guò)“激活函數(shù)”處理從而產(chǎn)生神經(jīng)元的輸出。將元按照一定的層次結(jié)構(gòu)進(jìn)行連接,就得到了神經(jīng)網(wǎng)絡(luò)。知機(jī)模型機(jī)一共由兩層神經(jīng)元構(gòu)成,如圖 2-2 所示,輸入層神經(jīng)元接并將接收到的輸入信號(hào)傳遞給輸出層的神經(jīng)元,公式(2-1)出層的神經(jīng)元進(jìn)行激活處理。y f ( )(2-1)i i w x (2-2)w i n以及閾值 可通過(guò)學(xué)習(xí)得
圖 2-2 兩個(gè)輸入神經(jīng)元的感知機(jī)模型層神經(jīng)元1x 、2x 接收來(lái)自外界的輸入信神經(jīng)元,因?yàn)楦兄獧C(jī)只激活輸出層神能力非常有限,F(xiàn)實(shí)應(yīng)用中,更多的稱多層感知機(jī)(Multilayer Perception,間的神經(jīng)元被稱為隱層或隱含層,隱層的神經(jīng)元僅與其下一層的神經(jīng)元完接。MLP 的輸入層神經(jīng)元接收外部輸收的信號(hào),最后輸出層神經(jīng)元輸出最終模型本結(jié)構(gòu)包含三種不同類型的結(jié)構(gòu)層,分2-3 所示:
【學(xué)位授予單位】:長(zhǎng)春工業(yè)大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2019
【分類號(hào)】:TP391.41;TP183
【參考文獻(xiàn)】
相關(guān)期刊論文 前5條
1 童瑩;;基于空間多尺度HOG特征的人臉表情識(shí)別方法[J];計(jì)算機(jī)工程與設(shè)計(jì);2014年11期
2 余凱;賈磊;陳雨強(qiáng);徐偉;;深度學(xué)習(xí)的昨天、今天和明天[J];計(jì)算機(jī)研究與發(fā)展;2013年09期
3 龔劬;葉劍英;華桃桃;;結(jié)合改進(jìn)的LBP和LDP的人臉表情識(shí)別[J];計(jì)算機(jī)工程與應(yīng)用;2013年22期
4 譚琨;杜培軍;;基于徑向基函數(shù)神經(jīng)網(wǎng)絡(luò)的高光譜遙感圖像分類[J];光譜學(xué)與光譜分析;2008年09期
5 唐京海;張有為;;基于FLD特征提取的SVM人臉表情識(shí)別方法[J];計(jì)算機(jī)工程與應(yīng)用;2006年11期
本文編號(hào):2632792
本文鏈接:http://sikaile.net/kejilunwen/zidonghuakongzhilunwen/2632792.html
最近更新
教材專著