基于小尺度核卷積的人臉表情識(shí)別研究
發(fā)布時(shí)間:2021-09-04 06:44
人臉表情作為一種傳達(dá)情緒狀態(tài)和意圖的主要形式,在人際關(guān)系中提供了重要的非語(yǔ)言交際線索。隨著人工智能和機(jī)器學(xué)習(xí)等技術(shù)的興起,現(xiàn)有的人機(jī)交互方式已經(jīng)無(wú)法滿足人類的需求,使機(jī)器具備精確辨別人類情緒的能力逐漸成為計(jì)算機(jī)視覺(jué)等領(lǐng)域的熱點(diǎn)研究問(wèn)題。受光照、角度等客觀條件影響,人臉面部表情難以達(dá)到特征統(tǒng)一,給計(jì)算機(jī)識(shí)別情緒帶來(lái)了巨大挑戰(zhàn),因此,構(gòu)建具有準(zhǔn)確表情分類能力、學(xué)習(xí)不同表情特征的機(jī)器模型對(duì)實(shí)現(xiàn)自然人機(jī)交互具有重要研究意義。隨著深度學(xué)習(xí)方法在計(jì)算機(jī)視覺(jué)領(lǐng)域的廣泛應(yīng)用,使現(xiàn)有的面部表情識(shí)別模型效果得到了顯著提高,但仍存在網(wǎng)絡(luò)泛化能力不強(qiáng)、模型結(jié)構(gòu)復(fù)雜導(dǎo)致網(wǎng)絡(luò)計(jì)算量大、表情識(shí)別效果不夠理想等問(wèn)題,針對(duì)這些問(wèn)題,本文提出一種基于小尺度核卷積的人臉表情識(shí)別方法,通過(guò)設(shè)計(jì)多層小尺度核卷積塊提取面部表情特征,對(duì)樣本數(shù)據(jù)進(jìn)行訓(xùn)練測(cè)試優(yōu)化特征提取網(wǎng)絡(luò)模型,使用Softmax分類器實(shí)現(xiàn)表情分類,并對(duì)方法性能進(jìn)行實(shí)驗(yàn)驗(yàn)證,證明算法的有效性。本文的研究工作主要包括以下幾個(gè)方面:1)采用數(shù)據(jù)增強(qiáng)變換等方法來(lái)增強(qiáng)網(wǎng)絡(luò)模型的泛化能力,降低人臉表情圖像的多樣化影響,在圖像預(yù)處理階段采用人臉檢測(cè)和數(shù)據(jù)增強(qiáng)兩種手段,擴(kuò)充樣本數(shù)...
【文章來(lái)源】:華中師范大學(xué)湖北省 211工程院校 教育部直屬院校
【文章頁(yè)數(shù)】:67 頁(yè)
【學(xué)位級(jí)別】:碩士
【部分圖文】:
圖1.1人臉表情識(shí)別研究進(jìn)程??
宄表情識(shí)別,下面將對(duì)深度置信網(wǎng)絡(luò)、深度自編碼網(wǎng)??絡(luò)、循環(huán)神經(jīng)網(wǎng)絡(luò)和卷積神經(jīng)網(wǎng)絡(luò)四種應(yīng)用于表情識(shí)別的深度學(xué)習(xí)技術(shù)進(jìn)行詳細(xì)介??紹與分析。??2.?3.1基于深度置信網(wǎng)絡(luò)的人臉表情識(shí)別??深度置信網(wǎng)絡(luò)(〇££?8£1丨£【仏飲〇也,08>〇由沌加〇11教授率先[37]提出,將無(wú)監(jiān)??督學(xué)習(xí)和有監(jiān)督學(xué)習(xí)相結(jié)合,建立一個(gè)觀察數(shù)據(jù)和標(biāo)簽的聯(lián)合分布,得到一個(gè)用于??學(xué)習(xí)提取深層次訓(xùn)練特征的概率生成模型。傳統(tǒng)的深度置信網(wǎng)絡(luò)由若干層受限玻爾??茲曼機(jī)(RBM)?M構(gòu)建而成。深度置信網(wǎng)絡(luò)的結(jié)構(gòu)圖如圖2.2所示。??,/?\?,??、'、??輸出數(shù)據(jù)?|?標(biāo)準(zhǔn)標(biāo)注信息??、??y?V?J??Bp「―??二??^2?|?j;反向傳播??「!?-?*? ̄? ̄?K,-?1? ̄?1??參參??????魯)I?I??I??:?",?I?I??RBM???[!?1?I??%?!!?微調(diào)?I??r?-?-j????1--,??|?(籲魯籲??????籲f?丨|??l_—二一丨??RBM?!?%?1?I?微調(diào)????t_?k_?!??(?輸入數(shù)據(jù)??圖2.2?DBN基本結(jié)構(gòu)圖??如圖2.2所示,該模型通過(guò)多層受限玻爾茲曼機(jī)自動(dòng)學(xué)習(xí)特征。其中,RBM[38]??是可見(jiàn)單元層(顯層)和隱藏單元層(隱層)組成的兩層生成隨機(jī)模型,訓(xùn)練數(shù)據(jù)??由顯層輸入,隱層則作為特征檢測(cè)器。訓(xùn)練過(guò)程中,前一個(gè)RBM的輸出層(隱層)??11??
碩士學(xué)位論文??y?MASTER?STHESIS??特征,再通過(guò)DBN網(wǎng)絡(luò)訓(xùn)練,得到更高層次的表情特征。??2.3.2基于深度自動(dòng)編碼器的人臉表情識(shí)別??深度自動(dòng)編碼器(DeepAuto-Encoder,DAE)?最早用以學(xué)習(xí)有效的降維編碼??而產(chǎn)生,與經(jīng)過(guò)大量訓(xùn)練可以預(yù)測(cè)目標(biāo)值的網(wǎng)絡(luò)相反,DAE通過(guò)最小化重構(gòu)誤差來(lái)??優(yōu)化其輸入,其基本結(jié)構(gòu)如圖2.3所示。??輸入層?輸出層??I?I?I??編碼器?解碼器??圖2.3?DAE網(wǎng)絡(luò)基本結(jié)構(gòu)圖??DAE網(wǎng)絡(luò)為對(duì)稱結(jié)構(gòu),由輸入層、隱藏層和輸出層組成。數(shù)據(jù)從輸入層輸入,??經(jīng)過(guò)編碼器編碼即數(shù)據(jù)降維到達(dá)隱藏層,然后通過(guò)隱藏層作用生成與原輸入節(jié)點(diǎn)相??同的輸出節(jié)點(diǎn),類似于解碼器運(yùn)算。深度自動(dòng)編碼網(wǎng)絡(luò)的編碼、解碼過(guò)程可用公式??(2.3)、(2.4)來(lái)進(jìn)行描述。??h?=?f(x)=s/{Wx+bi)?(2.3)??少=g(辦)=?(■?+辦2)?(2.4)??其中,A為隱藏節(jié)點(diǎn)數(shù)值,;c為輸入值,:v為輸出值,函數(shù)/表示從輸入層到??隱藏層的編碼過(guò)程,函數(shù)g表示從隱藏層到輸出層的解碼過(guò)程,灰為編碼器權(quán)值,??釅為解碼器權(quán)值,為編碼器偏置值,62為解碼器偏置值,&為編碼器激活函數(shù),??13??
【參考文獻(xiàn)】:
期刊論文
[1]基于域適應(yīng)卷積神經(jīng)網(wǎng)絡(luò)的人臉表情識(shí)別[J]. 亢潔,李佳偉,楊思力. 計(jì)算機(jī)工程. 2019(12)
[2]基于多特征融合密集殘差CNN的人臉表情識(shí)別[J]. 馬中啟,朱好生,楊海仕,王琪,胡燕海. 計(jì)算機(jī)應(yīng)用與軟件. 2019(07)
[3]基于人臉?lè)指畹膹?fù)雜環(huán)境下表情識(shí)別實(shí)時(shí)框架[J]. 呂誨,童倩倩,袁志勇. 計(jì)算機(jī)工程與應(yīng)用. 2020(12)
[4]基于多尺度核特征卷積神經(jīng)網(wǎng)絡(luò)的實(shí)時(shí)人臉表情識(shí)別[J]. 李旻擇,李小霞,王學(xué)淵,孫維. 計(jì)算機(jī)應(yīng)用. 2019(09)
[5]基于改進(jìn)的深度殘差網(wǎng)絡(luò)的表情識(shí)別研究[J]. 何俊,劉躍,李倡洪,沈津銘,李帥,王京威. 計(jì)算機(jī)應(yīng)用研究. 2020(05)
[6]基于跨連接LeNet-5網(wǎng)絡(luò)的面部表情識(shí)別[J]. 李勇,林小竹,蔣夢(mèng)瑩. 自動(dòng)化學(xué)報(bào). 2018(01)
[7]人臉表情識(shí)別的研究進(jìn)展[J]. 蔣斌,賈克斌,楊國(guó)勝. 計(jì)算機(jī)科學(xué). 2011(04)
[8]人臉表情識(shí)別方法綜述[J]. 王志良,陳鋒軍,薛為民. 計(jì)算機(jī)應(yīng)用與軟件. 2003(12)
碩士論文
[1]基于2D-FrFT多階次特征融合的人臉表情識(shí)別技術(shù)[D]. 張嗣思.鄭州大學(xué) 2011
本文編號(hào):3382776
【文章來(lái)源】:華中師范大學(xué)湖北省 211工程院校 教育部直屬院校
【文章頁(yè)數(shù)】:67 頁(yè)
【學(xué)位級(jí)別】:碩士
【部分圖文】:
圖1.1人臉表情識(shí)別研究進(jìn)程??
宄表情識(shí)別,下面將對(duì)深度置信網(wǎng)絡(luò)、深度自編碼網(wǎng)??絡(luò)、循環(huán)神經(jīng)網(wǎng)絡(luò)和卷積神經(jīng)網(wǎng)絡(luò)四種應(yīng)用于表情識(shí)別的深度學(xué)習(xí)技術(shù)進(jìn)行詳細(xì)介??紹與分析。??2.?3.1基于深度置信網(wǎng)絡(luò)的人臉表情識(shí)別??深度置信網(wǎng)絡(luò)(〇££?8£1丨£【仏飲〇也,08>〇由沌加〇11教授率先[37]提出,將無(wú)監(jiān)??督學(xué)習(xí)和有監(jiān)督學(xué)習(xí)相結(jié)合,建立一個(gè)觀察數(shù)據(jù)和標(biāo)簽的聯(lián)合分布,得到一個(gè)用于??學(xué)習(xí)提取深層次訓(xùn)練特征的概率生成模型。傳統(tǒng)的深度置信網(wǎng)絡(luò)由若干層受限玻爾??茲曼機(jī)(RBM)?M構(gòu)建而成。深度置信網(wǎng)絡(luò)的結(jié)構(gòu)圖如圖2.2所示。??,/?\?,??、'、??輸出數(shù)據(jù)?|?標(biāo)準(zhǔn)標(biāo)注信息??、??y?V?J??Bp「―??二??^2?|?j;反向傳播??「!?-?*? ̄? ̄?K,-?1? ̄?1??參參??????魯)I?I??I??:?",?I?I??RBM???[!?1?I??%?!!?微調(diào)?I??r?-?-j????1--,??|?(籲魯籲??????籲f?丨|??l_—二一丨??RBM?!?%?1?I?微調(diào)????t_?k_?!??(?輸入數(shù)據(jù)??圖2.2?DBN基本結(jié)構(gòu)圖??如圖2.2所示,該模型通過(guò)多層受限玻爾茲曼機(jī)自動(dòng)學(xué)習(xí)特征。其中,RBM[38]??是可見(jiàn)單元層(顯層)和隱藏單元層(隱層)組成的兩層生成隨機(jī)模型,訓(xùn)練數(shù)據(jù)??由顯層輸入,隱層則作為特征檢測(cè)器。訓(xùn)練過(guò)程中,前一個(gè)RBM的輸出層(隱層)??11??
碩士學(xué)位論文??y?MASTER?STHESIS??特征,再通過(guò)DBN網(wǎng)絡(luò)訓(xùn)練,得到更高層次的表情特征。??2.3.2基于深度自動(dòng)編碼器的人臉表情識(shí)別??深度自動(dòng)編碼器(DeepAuto-Encoder,DAE)?最早用以學(xué)習(xí)有效的降維編碼??而產(chǎn)生,與經(jīng)過(guò)大量訓(xùn)練可以預(yù)測(cè)目標(biāo)值的網(wǎng)絡(luò)相反,DAE通過(guò)最小化重構(gòu)誤差來(lái)??優(yōu)化其輸入,其基本結(jié)構(gòu)如圖2.3所示。??輸入層?輸出層??I?I?I??編碼器?解碼器??圖2.3?DAE網(wǎng)絡(luò)基本結(jié)構(gòu)圖??DAE網(wǎng)絡(luò)為對(duì)稱結(jié)構(gòu),由輸入層、隱藏層和輸出層組成。數(shù)據(jù)從輸入層輸入,??經(jīng)過(guò)編碼器編碼即數(shù)據(jù)降維到達(dá)隱藏層,然后通過(guò)隱藏層作用生成與原輸入節(jié)點(diǎn)相??同的輸出節(jié)點(diǎn),類似于解碼器運(yùn)算。深度自動(dòng)編碼網(wǎng)絡(luò)的編碼、解碼過(guò)程可用公式??(2.3)、(2.4)來(lái)進(jìn)行描述。??h?=?f(x)=s/{Wx+bi)?(2.3)??少=g(辦)=?(■?+辦2)?(2.4)??其中,A為隱藏節(jié)點(diǎn)數(shù)值,;c為輸入值,:v為輸出值,函數(shù)/表示從輸入層到??隱藏層的編碼過(guò)程,函數(shù)g表示從隱藏層到輸出層的解碼過(guò)程,灰為編碼器權(quán)值,??釅為解碼器權(quán)值,為編碼器偏置值,62為解碼器偏置值,&為編碼器激活函數(shù),??13??
【參考文獻(xiàn)】:
期刊論文
[1]基于域適應(yīng)卷積神經(jīng)網(wǎng)絡(luò)的人臉表情識(shí)別[J]. 亢潔,李佳偉,楊思力. 計(jì)算機(jī)工程. 2019(12)
[2]基于多特征融合密集殘差CNN的人臉表情識(shí)別[J]. 馬中啟,朱好生,楊海仕,王琪,胡燕海. 計(jì)算機(jī)應(yīng)用與軟件. 2019(07)
[3]基于人臉?lè)指畹膹?fù)雜環(huán)境下表情識(shí)別實(shí)時(shí)框架[J]. 呂誨,童倩倩,袁志勇. 計(jì)算機(jī)工程與應(yīng)用. 2020(12)
[4]基于多尺度核特征卷積神經(jīng)網(wǎng)絡(luò)的實(shí)時(shí)人臉表情識(shí)別[J]. 李旻擇,李小霞,王學(xué)淵,孫維. 計(jì)算機(jī)應(yīng)用. 2019(09)
[5]基于改進(jìn)的深度殘差網(wǎng)絡(luò)的表情識(shí)別研究[J]. 何俊,劉躍,李倡洪,沈津銘,李帥,王京威. 計(jì)算機(jī)應(yīng)用研究. 2020(05)
[6]基于跨連接LeNet-5網(wǎng)絡(luò)的面部表情識(shí)別[J]. 李勇,林小竹,蔣夢(mèng)瑩. 自動(dòng)化學(xué)報(bào). 2018(01)
[7]人臉表情識(shí)別的研究進(jìn)展[J]. 蔣斌,賈克斌,楊國(guó)勝. 計(jì)算機(jī)科學(xué). 2011(04)
[8]人臉表情識(shí)別方法綜述[J]. 王志良,陳鋒軍,薛為民. 計(jì)算機(jī)應(yīng)用與軟件. 2003(12)
碩士論文
[1]基于2D-FrFT多階次特征融合的人臉表情識(shí)別技術(shù)[D]. 張嗣思.鄭州大學(xué) 2011
本文編號(hào):3382776
本文鏈接:http://sikaile.net/kejilunwen/shengwushengchang/3382776.html
最近更新
教材專著