基于小尺度核卷積的人臉表情識別研究
發(fā)布時間:2021-09-04 06:44
人臉表情作為一種傳達情緒狀態(tài)和意圖的主要形式,在人際關(guān)系中提供了重要的非語言交際線索。隨著人工智能和機器學(xué)習(xí)等技術(shù)的興起,現(xiàn)有的人機交互方式已經(jīng)無法滿足人類的需求,使機器具備精確辨別人類情緒的能力逐漸成為計算機視覺等領(lǐng)域的熱點研究問題。受光照、角度等客觀條件影響,人臉面部表情難以達到特征統(tǒng)一,給計算機識別情緒帶來了巨大挑戰(zhàn),因此,構(gòu)建具有準(zhǔn)確表情分類能力、學(xué)習(xí)不同表情特征的機器模型對實現(xiàn)自然人機交互具有重要研究意義。隨著深度學(xué)習(xí)方法在計算機視覺領(lǐng)域的廣泛應(yīng)用,使現(xiàn)有的面部表情識別模型效果得到了顯著提高,但仍存在網(wǎng)絡(luò)泛化能力不強、模型結(jié)構(gòu)復(fù)雜導(dǎo)致網(wǎng)絡(luò)計算量大、表情識別效果不夠理想等問題,針對這些問題,本文提出一種基于小尺度核卷積的人臉表情識別方法,通過設(shè)計多層小尺度核卷積塊提取面部表情特征,對樣本數(shù)據(jù)進行訓(xùn)練測試優(yōu)化特征提取網(wǎng)絡(luò)模型,使用Softmax分類器實現(xiàn)表情分類,并對方法性能進行實驗驗證,證明算法的有效性。本文的研究工作主要包括以下幾個方面:1)采用數(shù)據(jù)增強變換等方法來增強網(wǎng)絡(luò)模型的泛化能力,降低人臉表情圖像的多樣化影響,在圖像預(yù)處理階段采用人臉檢測和數(shù)據(jù)增強兩種手段,擴充樣本數(shù)...
【文章來源】:華中師范大學(xué)湖北省 211工程院校 教育部直屬院校
【文章頁數(shù)】:67 頁
【學(xué)位級別】:碩士
【部分圖文】:
圖1.1人臉表情識別研究進程??
宄表情識別,下面將對深度置信網(wǎng)絡(luò)、深度自編碼網(wǎng)??絡(luò)、循環(huán)神經(jīng)網(wǎng)絡(luò)和卷積神經(jīng)網(wǎng)絡(luò)四種應(yīng)用于表情識別的深度學(xué)習(xí)技術(shù)進行詳細介??紹與分析。??2.?3.1基于深度置信網(wǎng)絡(luò)的人臉表情識別??深度置信網(wǎng)絡(luò)(〇££?8£1丨£【仏飲〇也,08>〇由沌加〇11教授率先[37]提出,將無監(jiān)??督學(xué)習(xí)和有監(jiān)督學(xué)習(xí)相結(jié)合,建立一個觀察數(shù)據(jù)和標(biāo)簽的聯(lián)合分布,得到一個用于??學(xué)習(xí)提取深層次訓(xùn)練特征的概率生成模型。傳統(tǒng)的深度置信網(wǎng)絡(luò)由若干層受限玻爾??茲曼機(RBM)?M構(gòu)建而成。深度置信網(wǎng)絡(luò)的結(jié)構(gòu)圖如圖2.2所示。??,/?\?,??、'、??輸出數(shù)據(jù)?|?標(biāo)準(zhǔn)標(biāo)注信息??、??y?V?J??Bp「―??二??^2?|?j;反向傳播??「!?-?*? ̄? ̄?K,-?1? ̄?1??參參??????魯)I?I??I??:?",?I?I??RBM???[!?1?I??%?!!?微調(diào)?I??r?-?-j????1--,??|?(籲魯籲??????籲f?丨|??l_—二一丨??RBM?!?%?1?I?微調(diào)????t_?k_?!??(?輸入數(shù)據(jù)??圖2.2?DBN基本結(jié)構(gòu)圖??如圖2.2所示,該模型通過多層受限玻爾茲曼機自動學(xué)習(xí)特征。其中,RBM[38]??是可見單元層(顯層)和隱藏單元層(隱層)組成的兩層生成隨機模型,訓(xùn)練數(shù)據(jù)??由顯層輸入,隱層則作為特征檢測器。訓(xùn)練過程中,前一個RBM的輸出層(隱層)??11??
碩士學(xué)位論文??y?MASTER?STHESIS??特征,再通過DBN網(wǎng)絡(luò)訓(xùn)練,得到更高層次的表情特征。??2.3.2基于深度自動編碼器的人臉表情識別??深度自動編碼器(DeepAuto-Encoder,DAE)?最早用以學(xué)習(xí)有效的降維編碼??而產(chǎn)生,與經(jīng)過大量訓(xùn)練可以預(yù)測目標(biāo)值的網(wǎng)絡(luò)相反,DAE通過最小化重構(gòu)誤差來??優(yōu)化其輸入,其基本結(jié)構(gòu)如圖2.3所示。??輸入層?輸出層??I?I?I??編碼器?解碼器??圖2.3?DAE網(wǎng)絡(luò)基本結(jié)構(gòu)圖??DAE網(wǎng)絡(luò)為對稱結(jié)構(gòu),由輸入層、隱藏層和輸出層組成。數(shù)據(jù)從輸入層輸入,??經(jīng)過編碼器編碼即數(shù)據(jù)降維到達隱藏層,然后通過隱藏層作用生成與原輸入節(jié)點相??同的輸出節(jié)點,類似于解碼器運算。深度自動編碼網(wǎng)絡(luò)的編碼、解碼過程可用公式??(2.3)、(2.4)來進行描述。??h?=?f(x)=s/{Wx+bi)?(2.3)??少=g(辦)=?(■?+辦2)?(2.4)??其中,A為隱藏節(jié)點數(shù)值,;c為輸入值,:v為輸出值,函數(shù)/表示從輸入層到??隱藏層的編碼過程,函數(shù)g表示從隱藏層到輸出層的解碼過程,灰為編碼器權(quán)值,??釅為解碼器權(quán)值,為編碼器偏置值,62為解碼器偏置值,&為編碼器激活函數(shù),??13??
【參考文獻】:
期刊論文
[1]基于域適應(yīng)卷積神經(jīng)網(wǎng)絡(luò)的人臉表情識別[J]. 亢潔,李佳偉,楊思力. 計算機工程. 2019(12)
[2]基于多特征融合密集殘差CNN的人臉表情識別[J]. 馬中啟,朱好生,楊海仕,王琪,胡燕海. 計算機應(yīng)用與軟件. 2019(07)
[3]基于人臉分割的復(fù)雜環(huán)境下表情識別實時框架[J]. 呂誨,童倩倩,袁志勇. 計算機工程與應(yīng)用. 2020(12)
[4]基于多尺度核特征卷積神經(jīng)網(wǎng)絡(luò)的實時人臉表情識別[J]. 李旻擇,李小霞,王學(xué)淵,孫維. 計算機應(yīng)用. 2019(09)
[5]基于改進的深度殘差網(wǎng)絡(luò)的表情識別研究[J]. 何俊,劉躍,李倡洪,沈津銘,李帥,王京威. 計算機應(yīng)用研究. 2020(05)
[6]基于跨連接LeNet-5網(wǎng)絡(luò)的面部表情識別[J]. 李勇,林小竹,蔣夢瑩. 自動化學(xué)報. 2018(01)
[7]人臉表情識別的研究進展[J]. 蔣斌,賈克斌,楊國勝. 計算機科學(xué). 2011(04)
[8]人臉表情識別方法綜述[J]. 王志良,陳鋒軍,薛為民. 計算機應(yīng)用與軟件. 2003(12)
碩士論文
[1]基于2D-FrFT多階次特征融合的人臉表情識別技術(shù)[D]. 張嗣思.鄭州大學(xué) 2011
本文編號:3382776
【文章來源】:華中師范大學(xué)湖北省 211工程院校 教育部直屬院校
【文章頁數(shù)】:67 頁
【學(xué)位級別】:碩士
【部分圖文】:
圖1.1人臉表情識別研究進程??
宄表情識別,下面將對深度置信網(wǎng)絡(luò)、深度自編碼網(wǎng)??絡(luò)、循環(huán)神經(jīng)網(wǎng)絡(luò)和卷積神經(jīng)網(wǎng)絡(luò)四種應(yīng)用于表情識別的深度學(xué)習(xí)技術(shù)進行詳細介??紹與分析。??2.?3.1基于深度置信網(wǎng)絡(luò)的人臉表情識別??深度置信網(wǎng)絡(luò)(〇££?8£1丨£【仏飲〇也,08>〇由沌加〇11教授率先[37]提出,將無監(jiān)??督學(xué)習(xí)和有監(jiān)督學(xué)習(xí)相結(jié)合,建立一個觀察數(shù)據(jù)和標(biāo)簽的聯(lián)合分布,得到一個用于??學(xué)習(xí)提取深層次訓(xùn)練特征的概率生成模型。傳統(tǒng)的深度置信網(wǎng)絡(luò)由若干層受限玻爾??茲曼機(RBM)?M構(gòu)建而成。深度置信網(wǎng)絡(luò)的結(jié)構(gòu)圖如圖2.2所示。??,/?\?,??、'、??輸出數(shù)據(jù)?|?標(biāo)準(zhǔn)標(biāo)注信息??、??y?V?J??Bp「―??二??^2?|?j;反向傳播??「!?-?*? ̄? ̄?K,-?1? ̄?1??參參??????魯)I?I??I??:?",?I?I??RBM???[!?1?I??%?!!?微調(diào)?I??r?-?-j????1--,??|?(籲魯籲??????籲f?丨|??l_—二一丨??RBM?!?%?1?I?微調(diào)????t_?k_?!??(?輸入數(shù)據(jù)??圖2.2?DBN基本結(jié)構(gòu)圖??如圖2.2所示,該模型通過多層受限玻爾茲曼機自動學(xué)習(xí)特征。其中,RBM[38]??是可見單元層(顯層)和隱藏單元層(隱層)組成的兩層生成隨機模型,訓(xùn)練數(shù)據(jù)??由顯層輸入,隱層則作為特征檢測器。訓(xùn)練過程中,前一個RBM的輸出層(隱層)??11??
碩士學(xué)位論文??y?MASTER?STHESIS??特征,再通過DBN網(wǎng)絡(luò)訓(xùn)練,得到更高層次的表情特征。??2.3.2基于深度自動編碼器的人臉表情識別??深度自動編碼器(DeepAuto-Encoder,DAE)?最早用以學(xué)習(xí)有效的降維編碼??而產(chǎn)生,與經(jīng)過大量訓(xùn)練可以預(yù)測目標(biāo)值的網(wǎng)絡(luò)相反,DAE通過最小化重構(gòu)誤差來??優(yōu)化其輸入,其基本結(jié)構(gòu)如圖2.3所示。??輸入層?輸出層??I?I?I??編碼器?解碼器??圖2.3?DAE網(wǎng)絡(luò)基本結(jié)構(gòu)圖??DAE網(wǎng)絡(luò)為對稱結(jié)構(gòu),由輸入層、隱藏層和輸出層組成。數(shù)據(jù)從輸入層輸入,??經(jīng)過編碼器編碼即數(shù)據(jù)降維到達隱藏層,然后通過隱藏層作用生成與原輸入節(jié)點相??同的輸出節(jié)點,類似于解碼器運算。深度自動編碼網(wǎng)絡(luò)的編碼、解碼過程可用公式??(2.3)、(2.4)來進行描述。??h?=?f(x)=s/{Wx+bi)?(2.3)??少=g(辦)=?(■?+辦2)?(2.4)??其中,A為隱藏節(jié)點數(shù)值,;c為輸入值,:v為輸出值,函數(shù)/表示從輸入層到??隱藏層的編碼過程,函數(shù)g表示從隱藏層到輸出層的解碼過程,灰為編碼器權(quán)值,??釅為解碼器權(quán)值,為編碼器偏置值,62為解碼器偏置值,&為編碼器激活函數(shù),??13??
【參考文獻】:
期刊論文
[1]基于域適應(yīng)卷積神經(jīng)網(wǎng)絡(luò)的人臉表情識別[J]. 亢潔,李佳偉,楊思力. 計算機工程. 2019(12)
[2]基于多特征融合密集殘差CNN的人臉表情識別[J]. 馬中啟,朱好生,楊海仕,王琪,胡燕海. 計算機應(yīng)用與軟件. 2019(07)
[3]基于人臉分割的復(fù)雜環(huán)境下表情識別實時框架[J]. 呂誨,童倩倩,袁志勇. 計算機工程與應(yīng)用. 2020(12)
[4]基于多尺度核特征卷積神經(jīng)網(wǎng)絡(luò)的實時人臉表情識別[J]. 李旻擇,李小霞,王學(xué)淵,孫維. 計算機應(yīng)用. 2019(09)
[5]基于改進的深度殘差網(wǎng)絡(luò)的表情識別研究[J]. 何俊,劉躍,李倡洪,沈津銘,李帥,王京威. 計算機應(yīng)用研究. 2020(05)
[6]基于跨連接LeNet-5網(wǎng)絡(luò)的面部表情識別[J]. 李勇,林小竹,蔣夢瑩. 自動化學(xué)報. 2018(01)
[7]人臉表情識別的研究進展[J]. 蔣斌,賈克斌,楊國勝. 計算機科學(xué). 2011(04)
[8]人臉表情識別方法綜述[J]. 王志良,陳鋒軍,薛為民. 計算機應(yīng)用與軟件. 2003(12)
碩士論文
[1]基于2D-FrFT多階次特征融合的人臉表情識別技術(shù)[D]. 張嗣思.鄭州大學(xué) 2011
本文編號:3382776
本文鏈接:http://sikaile.net/kejilunwen/shengwushengchang/3382776.html
最近更新
教材專著