魯棒微表情關(guān)鍵點(diǎn)定位及特征提取算法研究
發(fā)布時(shí)間:2021-07-30 19:44
微表情是一種特殊的面部微小動(dòng)作,通常是人們?cè)谀承┉h(huán)境下試圖隱藏而不由自主發(fā)生的一種短暫情感,可以作為判斷情緒的重要依據(jù)。相關(guān)研究是情感計(jì)算領(lǐng)域的重要研究方向,且具有廣泛的應(yīng)用前景。持續(xù)時(shí)間短、變化強(qiáng)度低、局部不對(duì)稱以及環(huán)境因素等影響,使得微表情的檢測(cè)和識(shí)別變得非常困難。為此,本文提出了魯棒微表情關(guān)鍵點(diǎn)定位及特征提取算法,并應(yīng)用于人臉微表情識(shí)別。論文工作如下:(1)研究分析了三種基于深度學(xué)習(xí)的人臉關(guān)鍵點(diǎn)定位網(wǎng)絡(luò)模型,即精細(xì)化卷積神經(jīng)網(wǎng)絡(luò)(Coarse to Fine CNN)、多任務(wù)卷積神經(jīng)網(wǎng)絡(luò)(Multi-Task CNN)以及風(fēng)格聚合網(wǎng)絡(luò)(Style Aggregated Network,SAN)。在300W數(shù)據(jù)集和真實(shí)環(huán)境下的對(duì)比實(shí)驗(yàn)表明,與其它兩種網(wǎng)絡(luò)模型相比,SAN模型對(duì)環(huán)境及姿態(tài)變化具有更強(qiáng)的魯棒性。因此本文選定基于SAN的人臉關(guān)鍵點(diǎn)定位算法用于本文所提的微表情特征提取與識(shí)別算法。(2)提出了一種樣本分布均衡約束的微表情特征提取與識(shí)別算法。微表情很難被捕捉和模仿,因此現(xiàn)有相關(guān)數(shù)據(jù)集均存在樣本分布不均衡的問(wèn)題并影響模型訓(xùn)練的效果。為解決這一問(wèn)題,本文設(shè)計(jì)了一種樣本分布均衡損失,...
【文章來(lái)源】:北京交通大學(xué)北京市 211工程院校 教育部直屬院校
【文章頁(yè)數(shù)】:68 頁(yè)
【學(xué)位級(jí)別】:碩士
【部分圖文】:
圖1-3FER2013數(shù)據(jù)集中常見(jiàn)的宏觀表情(摘自[11])??Figure?1-3?Macro?expressions?common?in?FER2013?dataset?(Copied?from?lll])??
2.1.2網(wǎng)絡(luò)結(jié)構(gòu)??該系統(tǒng)的每一級(jí)網(wǎng)絡(luò)都是深度卷積神經(jīng)網(wǎng)絡(luò),網(wǎng)絡(luò)的輸入為原始像素,對(duì)期??望點(diǎn)的坐標(biāo)執(zhí)行回歸訓(xùn)練。如圖2-2所示,是典型的深度神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu)單元。??conv.?conv.??夢(mèng)?56?conv.?unshared??....■????6〇?60?8〇??40??1?20?20?40?fully??maxp.?maxp.?niaxp.?connected??圖2-2典型的深度神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu)單元??Figure?2-2?Structural?unit?of?a?typical?deep?neural?network??該網(wǎng)絡(luò)由三個(gè)卷積層,一個(gè)非共享卷積層和全連接層組成。每個(gè)卷積層使用??不同的濾波器得到不同的輸出響應(yīng)。設(shè)/'為第?個(gè)卷積層的輸入,計(jì)算出該層輸出:??hj-\?w,-]?c,-\??=|?tanh(XIZC^.-?*Ky^Bk)\?(2-1)??jc=〇?產(chǎn)?〇?r=〇??其中,I表示卷積層的輸入,F和B是可調(diào)參數(shù)。卷積層之后跟著最大池化層,在??池化之前,每個(gè)卷積層濾波之后的激活函數(shù)采用雙曲正切絕對(duì)值函數(shù),其為網(wǎng)絡(luò)??提供很好的非線性擬合的能力。網(wǎng)絡(luò)采用無(wú)重疊的最大池化:??7,,從=!粻(wèi)?</C—’?+#?)?(?2-2?)??盡管池化層會(huì)丟失一些信息,但是對(duì)于整個(gè)網(wǎng)絡(luò)而言,池化帶來(lái)的穩(wěn)健性能??夠較好地補(bǔ)償這種損失
—.—_?Sr??圖2-1精細(xì)化卷積神經(jīng)網(wǎng)絡(luò)的系統(tǒng)架構(gòu)??Figure?2-1?The?system?architecture?of?Coarse?to?Fine?CNN??2.1.2網(wǎng)絡(luò)結(jié)構(gòu)??該系統(tǒng)的每一級(jí)網(wǎng)絡(luò)都是深度卷積神經(jīng)網(wǎng)絡(luò),網(wǎng)絡(luò)的輸入為原始像素,對(duì)期??望點(diǎn)的坐標(biāo)執(zhí)行回歸訓(xùn)練。如圖2-2所示,是典型的深度神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu)單元。??conv.?conv.??夢(mèng)?56?conv.?unshared??....■????6〇?60?8〇??40??1?20?20?40?fully??maxp.?maxp.?niaxp.?connected??圖2-2典型的深度神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu)單元??Figure?2-2?Structural?unit?of?a?typical?deep?neural?network??該網(wǎng)絡(luò)由三個(gè)卷積層,一個(gè)非共享卷積層和全連接層組成。每個(gè)卷積層使用??不同的濾波器得到不同的輸出響應(yīng)。設(shè)/'為第?個(gè)卷積層的輸入,計(jì)算出該層輸出:??hj-\?w,-]?c,-\??=|?tanh(XIZC^.-?*Ky^Bk)\?(2-1)??jc=〇?產(chǎn)?〇?r=〇??其中,I表示卷積層的輸入,F和B是可調(diào)參數(shù)。卷積層之后跟著最大池化層,在??池化之前,每個(gè)卷積層濾波之后的激活函數(shù)采用雙曲正切絕對(duì)值函數(shù),其為網(wǎng)絡(luò)??提供很好的非線性擬合的能力。網(wǎng)絡(luò)采用無(wú)重疊的最大池化:??7
【參考文獻(xiàn)】:
期刊論文
[1]人臉微表情識(shí)別綜述[J]. 徐峰,張軍平. 自動(dòng)化學(xué)報(bào). 2017(03)
[2]光流模值估計(jì)的微表情捕捉[J]. 姜波,解侖,劉欣,韓晶,王志良. 浙江大學(xué)學(xué)報(bào)(工學(xué)版). 2017(03)
[3]微表情研究及其應(yīng)用[J]. 吳奇,申尋兵,傅小蘭. 心理科學(xué)進(jìn)展. 2010(09)
碩士論文
[1]微表情特征提取算法研究[D]. 馬浩原.北京交通大學(xué) 2018
[2]基于深度學(xué)習(xí)的微表情特征提取算法設(shè)計(jì)與實(shí)現(xiàn)[D]. 楊雪.北京交通大學(xué) 2017
[3]基于深度學(xué)習(xí)的魯棒表情關(guān)鍵點(diǎn)定位算法設(shè)計(jì)與實(shí)現(xiàn)[D]. 彭營(yíng)營(yíng).北京交通大學(xué) 2017
[4]微表情識(shí)別的理論和方法研究[D]. 劉宇灝.東南大學(xué) 2016
本文編號(hào):3312013
【文章來(lái)源】:北京交通大學(xué)北京市 211工程院校 教育部直屬院校
【文章頁(yè)數(shù)】:68 頁(yè)
【學(xué)位級(jí)別】:碩士
【部分圖文】:
圖1-3FER2013數(shù)據(jù)集中常見(jiàn)的宏觀表情(摘自[11])??Figure?1-3?Macro?expressions?common?in?FER2013?dataset?(Copied?from?lll])??
2.1.2網(wǎng)絡(luò)結(jié)構(gòu)??該系統(tǒng)的每一級(jí)網(wǎng)絡(luò)都是深度卷積神經(jīng)網(wǎng)絡(luò),網(wǎng)絡(luò)的輸入為原始像素,對(duì)期??望點(diǎn)的坐標(biāo)執(zhí)行回歸訓(xùn)練。如圖2-2所示,是典型的深度神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu)單元。??conv.?conv.??夢(mèng)?56?conv.?unshared??....■????6〇?60?8〇??40??1?20?20?40?fully??maxp.?maxp.?niaxp.?connected??圖2-2典型的深度神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu)單元??Figure?2-2?Structural?unit?of?a?typical?deep?neural?network??該網(wǎng)絡(luò)由三個(gè)卷積層,一個(gè)非共享卷積層和全連接層組成。每個(gè)卷積層使用??不同的濾波器得到不同的輸出響應(yīng)。設(shè)/'為第?個(gè)卷積層的輸入,計(jì)算出該層輸出:??hj-\?w,-]?c,-\??=|?tanh(XIZC^.-?*Ky^Bk)\?(2-1)??jc=〇?產(chǎn)?〇?r=〇??其中,I表示卷積層的輸入,F和B是可調(diào)參數(shù)。卷積層之后跟著最大池化層,在??池化之前,每個(gè)卷積層濾波之后的激活函數(shù)采用雙曲正切絕對(duì)值函數(shù),其為網(wǎng)絡(luò)??提供很好的非線性擬合的能力。網(wǎng)絡(luò)采用無(wú)重疊的最大池化:??7,,從=!粻(wèi)?</C—’?+#?)?(?2-2?)??盡管池化層會(huì)丟失一些信息,但是對(duì)于整個(gè)網(wǎng)絡(luò)而言,池化帶來(lái)的穩(wěn)健性能??夠較好地補(bǔ)償這種損失
—.—_?Sr??圖2-1精細(xì)化卷積神經(jīng)網(wǎng)絡(luò)的系統(tǒng)架構(gòu)??Figure?2-1?The?system?architecture?of?Coarse?to?Fine?CNN??2.1.2網(wǎng)絡(luò)結(jié)構(gòu)??該系統(tǒng)的每一級(jí)網(wǎng)絡(luò)都是深度卷積神經(jīng)網(wǎng)絡(luò),網(wǎng)絡(luò)的輸入為原始像素,對(duì)期??望點(diǎn)的坐標(biāo)執(zhí)行回歸訓(xùn)練。如圖2-2所示,是典型的深度神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu)單元。??conv.?conv.??夢(mèng)?56?conv.?unshared??....■????6〇?60?8〇??40??1?20?20?40?fully??maxp.?maxp.?niaxp.?connected??圖2-2典型的深度神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu)單元??Figure?2-2?Structural?unit?of?a?typical?deep?neural?network??該網(wǎng)絡(luò)由三個(gè)卷積層,一個(gè)非共享卷積層和全連接層組成。每個(gè)卷積層使用??不同的濾波器得到不同的輸出響應(yīng)。設(shè)/'為第?個(gè)卷積層的輸入,計(jì)算出該層輸出:??hj-\?w,-]?c,-\??=|?tanh(XIZC^.-?*Ky^Bk)\?(2-1)??jc=〇?產(chǎn)?〇?r=〇??其中,I表示卷積層的輸入,F和B是可調(diào)參數(shù)。卷積層之后跟著最大池化層,在??池化之前,每個(gè)卷積層濾波之后的激活函數(shù)采用雙曲正切絕對(duì)值函數(shù),其為網(wǎng)絡(luò)??提供很好的非線性擬合的能力。網(wǎng)絡(luò)采用無(wú)重疊的最大池化:??7
【參考文獻(xiàn)】:
期刊論文
[1]人臉微表情識(shí)別綜述[J]. 徐峰,張軍平. 自動(dòng)化學(xué)報(bào). 2017(03)
[2]光流模值估計(jì)的微表情捕捉[J]. 姜波,解侖,劉欣,韓晶,王志良. 浙江大學(xué)學(xué)報(bào)(工學(xué)版). 2017(03)
[3]微表情研究及其應(yīng)用[J]. 吳奇,申尋兵,傅小蘭. 心理科學(xué)進(jìn)展. 2010(09)
碩士論文
[1]微表情特征提取算法研究[D]. 馬浩原.北京交通大學(xué) 2018
[2]基于深度學(xué)習(xí)的微表情特征提取算法設(shè)計(jì)與實(shí)現(xiàn)[D]. 楊雪.北京交通大學(xué) 2017
[3]基于深度學(xué)習(xí)的魯棒表情關(guān)鍵點(diǎn)定位算法設(shè)計(jì)與實(shí)現(xiàn)[D]. 彭營(yíng)營(yíng).北京交通大學(xué) 2017
[4]微表情識(shí)別的理論和方法研究[D]. 劉宇灝.東南大學(xué) 2016
本文編號(hào):3312013
本文鏈接:http://sikaile.net/kejilunwen/zidonghuakongzhilunwen/3312013.html
最近更新
教材專著