基于生成對(duì)抗網(wǎng)絡(luò)的面部表情識(shí)別研究
發(fā)布時(shí)間:2020-07-16 08:21
【摘要】:面部表情識(shí)別技術(shù)使得計(jì)算機(jī)能夠感知并識(shí)別人類的情感,在人機(jī)交互、計(jì)算機(jī)視覺、認(rèn)知科學(xué)等領(lǐng)域有著非常重要的意義。近幾年,隨著深度學(xué)習(xí)和圖像處理技術(shù)的飛速發(fā)展,基于深度學(xué)習(xí)的方法已經(jīng)在圖像識(shí)別領(lǐng)域取得了突破性進(jìn)展。然而面部表情數(shù)據(jù)的匱乏制約了深度神經(jīng)網(wǎng)絡(luò)的表達(dá)能力。本文基于生成對(duì)抗網(wǎng)絡(luò)開展面部表情識(shí)別的研究工作,從數(shù)據(jù)增強(qiáng)和模型優(yōu)化兩方面提高模型在面部表情識(shí)別上的識(shí)別率和泛化能力。在數(shù)據(jù)增強(qiáng)方面:針對(duì)主流標(biāo)準(zhǔn)表情庫(kù)CK+,設(shè)計(jì)了基于生成對(duì)抗網(wǎng)絡(luò)的靜態(tài)圖像增強(qiáng)方法,在StarGAN的基礎(chǔ)上改進(jìn)重構(gòu)誤差,利用深度可分離卷積融合圖像信息和類別信息,實(shí)現(xiàn)多風(fēng)格面部表情圖像的轉(zhuǎn)換。利用生成器將自然表情下的面部圖像生成同一人其它表情的面部圖像,從而擴(kuò)充數(shù)據(jù)集的數(shù)量。與傳統(tǒng)基于圖像空間變換和像素值變換的數(shù)據(jù)增強(qiáng)方法相比,本文方法能夠生成配對(duì)型數(shù)據(jù),使得模型更加關(guān)注不同表情之間的差異而非不同人之間的差異,增強(qiáng)了模型對(duì)表情特征的表達(dá)能力。同時(shí),本文方法對(duì)解決數(shù)據(jù)量不平衡的問題也有一定的借鑒作用。在模型優(yōu)化方面:充分考慮生成對(duì)抗網(wǎng)絡(luò)中判別器對(duì)表情分類的作用,提取訓(xùn)練好的判別器模型用作表情分類器,并在擴(kuò)充后的CK+數(shù)據(jù)集上進(jìn)行微調(diào)。這種方法的優(yōu)點(diǎn)在于不需要重新設(shè)計(jì)和訓(xùn)練一個(gè)分類模型。受興趣區(qū)域(Region of interest,ROI)的啟發(fā),將人臉區(qū)域劃分為左眼、右眼、鼻子和嘴巴四個(gè)興趣區(qū)域并利用深度可分離卷積將興趣區(qū)域和原圖像在特征層進(jìn)行融合,加強(qiáng)網(wǎng)絡(luò)對(duì)興趣區(qū)域的關(guān)注度。在CK+和JAFFE表情庫(kù)上,通過多組對(duì)比實(shí)驗(yàn)驗(yàn)證了本文數(shù)據(jù)增強(qiáng)和模型優(yōu)化方法的有效性。
【學(xué)位授予單位】:合肥工業(yè)大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2019
【分類號(hào)】:TP391.41;TP18
【圖文】:
從最鄰近的幾個(gè)樣本中隨機(jī)選擇一個(gè)合成新樣數(shù)的角度來緩解數(shù)據(jù)量不平衡,他們?cè)谟?jì)算分類誤差時(shí)對(duì)值,樣本少的權(quán)值大,使得網(wǎng)絡(luò)更關(guān)注樣本少的類別。經(jīng)網(wǎng)絡(luò)神經(jīng)網(wǎng)絡(luò)的發(fā)展經(jīng)網(wǎng)絡(luò)起源于神經(jīng)生理學(xué)家 Warren Mcculloch 和數(shù)學(xué)家 W的 MP(mindlike machine)模型[33],如圖 2.1 所示。該模型結(jié)構(gòu)單元,它接受多個(gè)輸入并返回一個(gè)輸出,每個(gè)輸入都有引入非線性因素,也就是常說的激活函數(shù)。1958 年,Rose的基礎(chǔ)上提出了單層感知機(jī),其包含多個(gè)輸出,每個(gè)輸出知機(jī)無法解決類似異或的線性不可分問題,后來的研究人員加入了一層或多層處理單元構(gòu)成了多層感知機(jī),也就是較絡(luò),如圖 2.2 所示。
合肥工業(yè)大學(xué)碩士學(xué)位論文ception 系列、MobileNet、Xception 等[38-42],圖 2.3 展示了經(jīng)。從 AlexNet 到 Xception,CNN 模型的層數(shù)越來越多,參少,應(yīng)用的場(chǎng)景也越來越廣。
12圖 2.3 經(jīng)典 CNN 年表Fig 2.3 Classic CNN chronology2.2.2 卷積神經(jīng)網(wǎng)絡(luò)的特點(diǎn)相較于全連接神經(jīng)網(wǎng)絡(luò),卷積神經(jīng)網(wǎng)絡(luò)具有更少的參數(shù)和更深的網(wǎng)絡(luò)結(jié)構(gòu),這意味著卷積神經(jīng)網(wǎng)絡(luò)能夠挖掘到更深層次的信息。這歸功于卷積神經(jīng)網(wǎng)絡(luò)的兩大特點(diǎn):局部感知和權(quán)值共享。
本文編號(hào):2757759
【學(xué)位授予單位】:合肥工業(yè)大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2019
【分類號(hào)】:TP391.41;TP18
【圖文】:
從最鄰近的幾個(gè)樣本中隨機(jī)選擇一個(gè)合成新樣數(shù)的角度來緩解數(shù)據(jù)量不平衡,他們?cè)谟?jì)算分類誤差時(shí)對(duì)值,樣本少的權(quán)值大,使得網(wǎng)絡(luò)更關(guān)注樣本少的類別。經(jīng)網(wǎng)絡(luò)神經(jīng)網(wǎng)絡(luò)的發(fā)展經(jīng)網(wǎng)絡(luò)起源于神經(jīng)生理學(xué)家 Warren Mcculloch 和數(shù)學(xué)家 W的 MP(mindlike machine)模型[33],如圖 2.1 所示。該模型結(jié)構(gòu)單元,它接受多個(gè)輸入并返回一個(gè)輸出,每個(gè)輸入都有引入非線性因素,也就是常說的激活函數(shù)。1958 年,Rose的基礎(chǔ)上提出了單層感知機(jī),其包含多個(gè)輸出,每個(gè)輸出知機(jī)無法解決類似異或的線性不可分問題,后來的研究人員加入了一層或多層處理單元構(gòu)成了多層感知機(jī),也就是較絡(luò),如圖 2.2 所示。
合肥工業(yè)大學(xué)碩士學(xué)位論文ception 系列、MobileNet、Xception 等[38-42],圖 2.3 展示了經(jīng)。從 AlexNet 到 Xception,CNN 模型的層數(shù)越來越多,參少,應(yīng)用的場(chǎng)景也越來越廣。
12圖 2.3 經(jīng)典 CNN 年表Fig 2.3 Classic CNN chronology2.2.2 卷積神經(jīng)網(wǎng)絡(luò)的特點(diǎn)相較于全連接神經(jīng)網(wǎng)絡(luò),卷積神經(jīng)網(wǎng)絡(luò)具有更少的參數(shù)和更深的網(wǎng)絡(luò)結(jié)構(gòu),這意味著卷積神經(jīng)網(wǎng)絡(luò)能夠挖掘到更深層次的信息。這歸功于卷積神經(jīng)網(wǎng)絡(luò)的兩大特點(diǎn):局部感知和權(quán)值共享。
【參考文獻(xiàn)】
相關(guān)期刊論文 前1條
1 羅可,林睦綱,郗東妹;數(shù)據(jù)挖掘中分類算法綜述[J];計(jì)算機(jī)工程;2005年01期
相關(guān)碩士學(xué)位論文 前1條
1 吳證;人臉特征點(diǎn)定位研究及應(yīng)用[D];上海交通大學(xué);2007年
本文編號(hào):2757759
本文鏈接:http://sikaile.net/kejilunwen/zidonghuakongzhilunwen/2757759.html
最近更新
教材專著