魯棒微表情關鍵點定位及特征提取算法研究
發(fā)布時間:2021-07-30 19:44
微表情是一種特殊的面部微小動作,通常是人們在某些環(huán)境下試圖隱藏而不由自主發(fā)生的一種短暫情感,可以作為判斷情緒的重要依據(jù)。相關研究是情感計算領域的重要研究方向,且具有廣泛的應用前景。持續(xù)時間短、變化強度低、局部不對稱以及環(huán)境因素等影響,使得微表情的檢測和識別變得非常困難。為此,本文提出了魯棒微表情關鍵點定位及特征提取算法,并應用于人臉微表情識別。論文工作如下:(1)研究分析了三種基于深度學習的人臉關鍵點定位網絡模型,即精細化卷積神經網絡(Coarse to Fine CNN)、多任務卷積神經網絡(Multi-Task CNN)以及風格聚合網絡(Style Aggregated Network,SAN)。在300W數(shù)據(jù)集和真實環(huán)境下的對比實驗表明,與其它兩種網絡模型相比,SAN模型對環(huán)境及姿態(tài)變化具有更強的魯棒性。因此本文選定基于SAN的人臉關鍵點定位算法用于本文所提的微表情特征提取與識別算法。(2)提出了一種樣本分布均衡約束的微表情特征提取與識別算法。微表情很難被捕捉和模仿,因此現(xiàn)有相關數(shù)據(jù)集均存在樣本分布不均衡的問題并影響模型訓練的效果。為解決這一問題,本文設計了一種樣本分布均衡損失,...
【文章來源】:北京交通大學北京市 211工程院校 教育部直屬院校
【文章頁數(shù)】:68 頁
【學位級別】:碩士
【部分圖文】:
圖1-3FER2013數(shù)據(jù)集中常見的宏觀表情(摘自[11])??Figure?1-3?Macro?expressions?common?in?FER2013?dataset?(Copied?from?lll])??
2.1.2網絡結構??該系統(tǒng)的每一級網絡都是深度卷積神經網絡,網絡的輸入為原始像素,對期??望點的坐標執(zhí)行回歸訓練。如圖2-2所示,是典型的深度神經網絡的結構單元。??conv.?conv.??夢?56?conv.?unshared??....■????6〇?60?8〇??40??1?20?20?40?fully??maxp.?maxp.?niaxp.?connected??圖2-2典型的深度神經網絡的結構單元??Figure?2-2?Structural?unit?of?a?typical?deep?neural?network??該網絡由三個卷積層,一個非共享卷積層和全連接層組成。每個卷積層使用??不同的濾波器得到不同的輸出響應。設/'為第?個卷積層的輸入,計算出該層輸出:??hj-\?w,-]?c,-\??=|?tanh(XIZC^.-?*Ky^Bk)\?(2-1)??jc=〇?產?〇?r=〇??其中,I表示卷積層的輸入,F和B是可調參數(shù)。卷積層之后跟著最大池化層,在??池化之前,每個卷積層濾波之后的激活函數(shù)采用雙曲正切絕對值函數(shù),其為網絡??提供很好的非線性擬合的能力。網絡采用無重疊的最大池化:??7,,從=!粻?</C—’?+#?)?(?2-2?)??盡管池化層會丟失一些信息,但是對于整個網絡而言,池化帶來的穩(wěn)健性能??夠較好地補償這種損失
—.—_?Sr??圖2-1精細化卷積神經網絡的系統(tǒng)架構??Figure?2-1?The?system?architecture?of?Coarse?to?Fine?CNN??2.1.2網絡結構??該系統(tǒng)的每一級網絡都是深度卷積神經網絡,網絡的輸入為原始像素,對期??望點的坐標執(zhí)行回歸訓練。如圖2-2所示,是典型的深度神經網絡的結構單元。??conv.?conv.??夢?56?conv.?unshared??....■????6〇?60?8〇??40??1?20?20?40?fully??maxp.?maxp.?niaxp.?connected??圖2-2典型的深度神經網絡的結構單元??Figure?2-2?Structural?unit?of?a?typical?deep?neural?network??該網絡由三個卷積層,一個非共享卷積層和全連接層組成。每個卷積層使用??不同的濾波器得到不同的輸出響應。設/'為第?個卷積層的輸入,計算出該層輸出:??hj-\?w,-]?c,-\??=|?tanh(XIZC^.-?*Ky^Bk)\?(2-1)??jc=〇?產?〇?r=〇??其中,I表示卷積層的輸入,F和B是可調參數(shù)。卷積層之后跟著最大池化層,在??池化之前,每個卷積層濾波之后的激活函數(shù)采用雙曲正切絕對值函數(shù),其為網絡??提供很好的非線性擬合的能力。網絡采用無重疊的最大池化:??7
【參考文獻】:
期刊論文
[1]人臉微表情識別綜述[J]. 徐峰,張軍平. 自動化學報. 2017(03)
[2]光流模值估計的微表情捕捉[J]. 姜波,解侖,劉欣,韓晶,王志良. 浙江大學學報(工學版). 2017(03)
[3]微表情研究及其應用[J]. 吳奇,申尋兵,傅小蘭. 心理科學進展. 2010(09)
碩士論文
[1]微表情特征提取算法研究[D]. 馬浩原.北京交通大學 2018
[2]基于深度學習的微表情特征提取算法設計與實現(xiàn)[D]. 楊雪.北京交通大學 2017
[3]基于深度學習的魯棒表情關鍵點定位算法設計與實現(xiàn)[D]. 彭營營.北京交通大學 2017
[4]微表情識別的理論和方法研究[D]. 劉宇灝.東南大學 2016
本文編號:3312013
【文章來源】:北京交通大學北京市 211工程院校 教育部直屬院校
【文章頁數(shù)】:68 頁
【學位級別】:碩士
【部分圖文】:
圖1-3FER2013數(shù)據(jù)集中常見的宏觀表情(摘自[11])??Figure?1-3?Macro?expressions?common?in?FER2013?dataset?(Copied?from?lll])??
2.1.2網絡結構??該系統(tǒng)的每一級網絡都是深度卷積神經網絡,網絡的輸入為原始像素,對期??望點的坐標執(zhí)行回歸訓練。如圖2-2所示,是典型的深度神經網絡的結構單元。??conv.?conv.??夢?56?conv.?unshared??....■????6〇?60?8〇??40??1?20?20?40?fully??maxp.?maxp.?niaxp.?connected??圖2-2典型的深度神經網絡的結構單元??Figure?2-2?Structural?unit?of?a?typical?deep?neural?network??該網絡由三個卷積層,一個非共享卷積層和全連接層組成。每個卷積層使用??不同的濾波器得到不同的輸出響應。設/'為第?個卷積層的輸入,計算出該層輸出:??hj-\?w,-]?c,-\??=|?tanh(XIZC^.-?*Ky^Bk)\?(2-1)??jc=〇?產?〇?r=〇??其中,I表示卷積層的輸入,F和B是可調參數(shù)。卷積層之后跟著最大池化層,在??池化之前,每個卷積層濾波之后的激活函數(shù)采用雙曲正切絕對值函數(shù),其為網絡??提供很好的非線性擬合的能力。網絡采用無重疊的最大池化:??7,,從=!粻?</C—’?+#?)?(?2-2?)??盡管池化層會丟失一些信息,但是對于整個網絡而言,池化帶來的穩(wěn)健性能??夠較好地補償這種損失
—.—_?Sr??圖2-1精細化卷積神經網絡的系統(tǒng)架構??Figure?2-1?The?system?architecture?of?Coarse?to?Fine?CNN??2.1.2網絡結構??該系統(tǒng)的每一級網絡都是深度卷積神經網絡,網絡的輸入為原始像素,對期??望點的坐標執(zhí)行回歸訓練。如圖2-2所示,是典型的深度神經網絡的結構單元。??conv.?conv.??夢?56?conv.?unshared??....■????6〇?60?8〇??40??1?20?20?40?fully??maxp.?maxp.?niaxp.?connected??圖2-2典型的深度神經網絡的結構單元??Figure?2-2?Structural?unit?of?a?typical?deep?neural?network??該網絡由三個卷積層,一個非共享卷積層和全連接層組成。每個卷積層使用??不同的濾波器得到不同的輸出響應。設/'為第?個卷積層的輸入,計算出該層輸出:??hj-\?w,-]?c,-\??=|?tanh(XIZC^.-?*Ky^Bk)\?(2-1)??jc=〇?產?〇?r=〇??其中,I表示卷積層的輸入,F和B是可調參數(shù)。卷積層之后跟著最大池化層,在??池化之前,每個卷積層濾波之后的激活函數(shù)采用雙曲正切絕對值函數(shù),其為網絡??提供很好的非線性擬合的能力。網絡采用無重疊的最大池化:??7
【參考文獻】:
期刊論文
[1]人臉微表情識別綜述[J]. 徐峰,張軍平. 自動化學報. 2017(03)
[2]光流模值估計的微表情捕捉[J]. 姜波,解侖,劉欣,韓晶,王志良. 浙江大學學報(工學版). 2017(03)
[3]微表情研究及其應用[J]. 吳奇,申尋兵,傅小蘭. 心理科學進展. 2010(09)
碩士論文
[1]微表情特征提取算法研究[D]. 馬浩原.北京交通大學 2018
[2]基于深度學習的微表情特征提取算法設計與實現(xiàn)[D]. 楊雪.北京交通大學 2017
[3]基于深度學習的魯棒表情關鍵點定位算法設計與實現(xiàn)[D]. 彭營營.北京交通大學 2017
[4]微表情識別的理論和方法研究[D]. 劉宇灝.東南大學 2016
本文編號:3312013
本文鏈接:http://sikaile.net/kejilunwen/zidonghuakongzhilunwen/3312013.html
最近更新
教材專著