基于優(yōu)化卷積神經(jīng)網(wǎng)絡(luò)的表情識別算法研究
發(fā)布時間:2021-01-04 13:43
近年來,人工智能及其相關(guān)學(xué)科的發(fā)展比較迅速,人們也逐漸感受到了人工智能為生活帶來的歡樂與便利,與此同時對人機交互的需求日益增長。人臉表情識別技術(shù)的提出將有利于提高人機交互的擬人化程度。研究發(fā)現(xiàn),在某些領(lǐng)域內(nèi)用卷積神經(jīng)網(wǎng)絡(luò)算法提取圖像特征比其他傳統(tǒng)方法更加有效,所以許多研究者也嘗試將卷積神經(jīng)網(wǎng)絡(luò)應(yīng)用于表情識別領(lǐng)域中。但卷積神經(jīng)網(wǎng)絡(luò)也存在著一些不可忽視的缺點,淺層卷積神經(jīng)網(wǎng)絡(luò)由于層數(shù)較少,在樣本數(shù)量有限的情況下提取圖像特征的能力也非常有限,并且樣本數(shù)據(jù)在特征提取過程中也容易受到光照、尺寸、遮擋等外界因素影響。因此本文提出基于改進VGG的卷積神經(jīng)網(wǎng)絡(luò)模型以及結(jié)合Gabor與卷積神經(jīng)網(wǎng)絡(luò)的表情識別算法來解決以上問題。深度卷積神經(jīng)網(wǎng)絡(luò)基于一種深層非線性的網(wǎng)絡(luò)結(jié)構(gòu),完成圖像更深層特征的提取,展現(xiàn)了強大的從圖像中學(xué)習(xí)特征的能力。為了實現(xiàn)通常條件下表情圖像的準確分類,提出了基于改進VGG-19卷積神經(jīng)網(wǎng)絡(luò)的表情識別模型。由于大多數(shù)用于面部表情識別的表情數(shù)據(jù)庫缺乏足夠的數(shù)據(jù)來從頭開始訓(xùn)練整個網(wǎng)絡(luò),本文采用了遷移學(xué)習(xí)技術(shù)來克服圖像數(shù)量不足的問題。并通過優(yōu)化網(wǎng)絡(luò)結(jié)構(gòu)來適當(dāng)減少網(wǎng)絡(luò)參數(shù),防止訓(xùn)練過程中產(chǎn)生過擬...
【文章來源】:哈爾濱師范大學(xué)黑龍江省
【文章頁數(shù)】:61 頁
【學(xué)位級別】:碩士
【部分圖文】:
LBP值的計算過程
哈爾濱師范大學(xué)碩士學(xué)位論文10形算子,其中R表示圓形結(jié)構(gòu)的半徑,P記為在圓形領(lǐng)域的采樣點數(shù)量。圖2-3展示了不同尺度上的圓形LBP算子,由圖可以看出改進后算法的靈活性。LBP圓形算子的計算公式如下,并用LBPP,R表示:為::,=:=0:1g:g2:(23)還有一種LBP旋轉(zhuǎn)不變模式算子,如圖2-4所示,圖中的8種不同LBP算子的值碼都是(00000001)2。旋轉(zhuǎn)不變模式主要解決了之前的LBP模式中只具有灰度不變屬性,讓LBP的魯棒性變強。圖2-3幾種圓形模式的LBP算子Figure2-3LBPoperatorsofseveralcircularpatterns圖2-4旋轉(zhuǎn)不變模式的LBP算子Figure2-4LBPoperatorofrotationinvariantpatterns2.3.2Gabor特征Gabor特征也是一種可以用來描述圖像紋理信息的特征。我們發(fā)現(xiàn)Gabor濾波器的頻率和方向與人類視覺皮層里的簡單細胞的視覺刺激響應(yīng)非常相似,特別適合于圖像的紋理表示與判別。其中,Gabor小波有較好的方向選擇和尺度選擇特性,并且對光照的適應(yīng)性較強,不易受光照變化的影響。將多通道濾波方法應(yīng)用于Gabor小波變換,每個通道中的頻域均不相同,因此可以得到不同粒度的圖像特征。
哈爾濱師范大學(xué)碩士學(xué)位論文10形算子,其中R表示圓形結(jié)構(gòu)的半徑,P記為在圓形領(lǐng)域的采樣點數(shù)量。圖2-3展示了不同尺度上的圓形LBP算子,由圖可以看出改進后算法的靈活性。LBP圓形算子的計算公式如下,并用LBPP,R表示:為::,=:=0:1g:g2:(23)還有一種LBP旋轉(zhuǎn)不變模式算子,如圖2-4所示,圖中的8種不同LBP算子的值碼都是(00000001)2。旋轉(zhuǎn)不變模式主要解決了之前的LBP模式中只具有灰度不變屬性,讓LBP的魯棒性變強。圖2-3幾種圓形模式的LBP算子Figure2-3LBPoperatorsofseveralcircularpatterns圖2-4旋轉(zhuǎn)不變模式的LBP算子Figure2-4LBPoperatorofrotationinvariantpatterns2.3.2Gabor特征Gabor特征也是一種可以用來描述圖像紋理信息的特征。我們發(fā)現(xiàn)Gabor濾波器的頻率和方向與人類視覺皮層里的簡單細胞的視覺刺激響應(yīng)非常相似,特別適合于圖像的紋理表示與判別。其中,Gabor小波有較好的方向選擇和尺度選擇特性,并且對光照的適應(yīng)性較強,不易受光照變化的影響。將多通道濾波方法應(yīng)用于Gabor小波變換,每個通道中的頻域均不相同,因此可以得到不同粒度的圖像特征。
【參考文獻】:
期刊論文
[1]基于VGG-NET的特征融合面部表情識別[J]. 李校林,鈕海濤. 計算機工程與科學(xué). 2020(03)
[2]基于多特征融合卷積神經(jīng)網(wǎng)絡(luò)的人臉表情識別[J]. 王建霞,陳慧萍,李佳澤,張曉明. 河北科技大學(xué)學(xué)報. 2019(06)
[3]構(gòu)建并行卷積神經(jīng)網(wǎng)絡(luò)的表情識別算法[J]. 徐琳琳,張樹美,趙俊莉. 中國圖象圖形學(xué)報. 2019(02)
[4]基于多特征與卷積神經(jīng)網(wǎng)絡(luò)的人臉表情識別[J]. 于明,安夢濤,劉依. 科學(xué)技術(shù)與工程. 2018(13)
[5]基于全采樣和L1范數(shù)降采樣的卷積神經(jīng)網(wǎng)絡(luò)圖像分類方法[J]. 宋婷婷,徐世許. 軟件. 2018(02)
[6]不同池化模型的卷積神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)性能研究[J]. 劉萬軍,梁雪劍,曲海成. 中國圖象圖形學(xué)報. 2016(09)
[7]基于卷積神經(jīng)網(wǎng)絡(luò)的人臉識別方法[J]. 陳耀丹,王連明. 東北師大學(xué)報(自然科學(xué)版). 2016(02)
[8]圖像理解中的卷積神經(jīng)網(wǎng)絡(luò)[J]. 常亮,鄧小明,周明全,武仲科,袁野,楊碩,王宏安. 自動化學(xué)報. 2016(09)
[9]神經(jīng)網(wǎng)絡(luò)七十年:回顧與展望[J]. 焦李成,楊淑媛,劉芳,王士剛,馮志璽. 計算機學(xué)報. 2016(08)
[10]ARIMA與RBF復(fù)合模型在設(shè)備運行狀態(tài)趨勢預(yù)測中的應(yīng)用[J]. 王吉芳,費仁元,徐小力,劉鑫. 機械傳動. 2011(09)
碩士論文
[1]基于卷積神經(jīng)網(wǎng)絡(luò)的人臉面部表情識別方法研究[D]. 張璐璐.河北科技大學(xué) 2019
[2]基于卷積神經(jīng)網(wǎng)絡(luò)的靜態(tài)面部表情識別研究[D]. 呂曼.合肥工業(yè)大學(xué) 2018
本文編號:2956864
【文章來源】:哈爾濱師范大學(xué)黑龍江省
【文章頁數(shù)】:61 頁
【學(xué)位級別】:碩士
【部分圖文】:
LBP值的計算過程
哈爾濱師范大學(xué)碩士學(xué)位論文10形算子,其中R表示圓形結(jié)構(gòu)的半徑,P記為在圓形領(lǐng)域的采樣點數(shù)量。圖2-3展示了不同尺度上的圓形LBP算子,由圖可以看出改進后算法的靈活性。LBP圓形算子的計算公式如下,并用LBPP,R表示:為::,=:=0:1g:g2:(23)還有一種LBP旋轉(zhuǎn)不變模式算子,如圖2-4所示,圖中的8種不同LBP算子的值碼都是(00000001)2。旋轉(zhuǎn)不變模式主要解決了之前的LBP模式中只具有灰度不變屬性,讓LBP的魯棒性變強。圖2-3幾種圓形模式的LBP算子Figure2-3LBPoperatorsofseveralcircularpatterns圖2-4旋轉(zhuǎn)不變模式的LBP算子Figure2-4LBPoperatorofrotationinvariantpatterns2.3.2Gabor特征Gabor特征也是一種可以用來描述圖像紋理信息的特征。我們發(fā)現(xiàn)Gabor濾波器的頻率和方向與人類視覺皮層里的簡單細胞的視覺刺激響應(yīng)非常相似,特別適合于圖像的紋理表示與判別。其中,Gabor小波有較好的方向選擇和尺度選擇特性,并且對光照的適應(yīng)性較強,不易受光照變化的影響。將多通道濾波方法應(yīng)用于Gabor小波變換,每個通道中的頻域均不相同,因此可以得到不同粒度的圖像特征。
哈爾濱師范大學(xué)碩士學(xué)位論文10形算子,其中R表示圓形結(jié)構(gòu)的半徑,P記為在圓形領(lǐng)域的采樣點數(shù)量。圖2-3展示了不同尺度上的圓形LBP算子,由圖可以看出改進后算法的靈活性。LBP圓形算子的計算公式如下,并用LBPP,R表示:為::,=:=0:1g:g2:(23)還有一種LBP旋轉(zhuǎn)不變模式算子,如圖2-4所示,圖中的8種不同LBP算子的值碼都是(00000001)2。旋轉(zhuǎn)不變模式主要解決了之前的LBP模式中只具有灰度不變屬性,讓LBP的魯棒性變強。圖2-3幾種圓形模式的LBP算子Figure2-3LBPoperatorsofseveralcircularpatterns圖2-4旋轉(zhuǎn)不變模式的LBP算子Figure2-4LBPoperatorofrotationinvariantpatterns2.3.2Gabor特征Gabor特征也是一種可以用來描述圖像紋理信息的特征。我們發(fā)現(xiàn)Gabor濾波器的頻率和方向與人類視覺皮層里的簡單細胞的視覺刺激響應(yīng)非常相似,特別適合于圖像的紋理表示與判別。其中,Gabor小波有較好的方向選擇和尺度選擇特性,并且對光照的適應(yīng)性較強,不易受光照變化的影響。將多通道濾波方法應(yīng)用于Gabor小波變換,每個通道中的頻域均不相同,因此可以得到不同粒度的圖像特征。
【參考文獻】:
期刊論文
[1]基于VGG-NET的特征融合面部表情識別[J]. 李校林,鈕海濤. 計算機工程與科學(xué). 2020(03)
[2]基于多特征融合卷積神經(jīng)網(wǎng)絡(luò)的人臉表情識別[J]. 王建霞,陳慧萍,李佳澤,張曉明. 河北科技大學(xué)學(xué)報. 2019(06)
[3]構(gòu)建并行卷積神經(jīng)網(wǎng)絡(luò)的表情識別算法[J]. 徐琳琳,張樹美,趙俊莉. 中國圖象圖形學(xué)報. 2019(02)
[4]基于多特征與卷積神經(jīng)網(wǎng)絡(luò)的人臉表情識別[J]. 于明,安夢濤,劉依. 科學(xué)技術(shù)與工程. 2018(13)
[5]基于全采樣和L1范數(shù)降采樣的卷積神經(jīng)網(wǎng)絡(luò)圖像分類方法[J]. 宋婷婷,徐世許. 軟件. 2018(02)
[6]不同池化模型的卷積神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)性能研究[J]. 劉萬軍,梁雪劍,曲海成. 中國圖象圖形學(xué)報. 2016(09)
[7]基于卷積神經(jīng)網(wǎng)絡(luò)的人臉識別方法[J]. 陳耀丹,王連明. 東北師大學(xué)報(自然科學(xué)版). 2016(02)
[8]圖像理解中的卷積神經(jīng)網(wǎng)絡(luò)[J]. 常亮,鄧小明,周明全,武仲科,袁野,楊碩,王宏安. 自動化學(xué)報. 2016(09)
[9]神經(jīng)網(wǎng)絡(luò)七十年:回顧與展望[J]. 焦李成,楊淑媛,劉芳,王士剛,馮志璽. 計算機學(xué)報. 2016(08)
[10]ARIMA與RBF復(fù)合模型在設(shè)備運行狀態(tài)趨勢預(yù)測中的應(yīng)用[J]. 王吉芳,費仁元,徐小力,劉鑫. 機械傳動. 2011(09)
碩士論文
[1]基于卷積神經(jīng)網(wǎng)絡(luò)的人臉面部表情識別方法研究[D]. 張璐璐.河北科技大學(xué) 2019
[2]基于卷積神經(jīng)網(wǎng)絡(luò)的靜態(tài)面部表情識別研究[D]. 呂曼.合肥工業(yè)大學(xué) 2018
本文編號:2956864
本文鏈接:http://sikaile.net/kejilunwen/zidonghuakongzhilunwen/2956864.html
最近更新
教材專著