基于優(yōu)化卷積神經(jīng)網(wǎng)絡(luò)的表情識(shí)別算法研究
發(fā)布時(shí)間:2021-01-04 13:43
近年來(lái),人工智能及其相關(guān)學(xué)科的發(fā)展比較迅速,人們也逐漸感受到了人工智能為生活帶來(lái)的歡樂(lè)與便利,與此同時(shí)對(duì)人機(jī)交互的需求日益增長(zhǎng)。人臉表情識(shí)別技術(shù)的提出將有利于提高人機(jī)交互的擬人化程度。研究發(fā)現(xiàn),在某些領(lǐng)域內(nèi)用卷積神經(jīng)網(wǎng)絡(luò)算法提取圖像特征比其他傳統(tǒng)方法更加有效,所以許多研究者也嘗試將卷積神經(jīng)網(wǎng)絡(luò)應(yīng)用于表情識(shí)別領(lǐng)域中。但卷積神經(jīng)網(wǎng)絡(luò)也存在著一些不可忽視的缺點(diǎn),淺層卷積神經(jīng)網(wǎng)絡(luò)由于層數(shù)較少,在樣本數(shù)量有限的情況下提取圖像特征的能力也非常有限,并且樣本數(shù)據(jù)在特征提取過(guò)程中也容易受到光照、尺寸、遮擋等外界因素影響。因此本文提出基于改進(jìn)VGG的卷積神經(jīng)網(wǎng)絡(luò)模型以及結(jié)合Gabor與卷積神經(jīng)網(wǎng)絡(luò)的表情識(shí)別算法來(lái)解決以上問(wèn)題。深度卷積神經(jīng)網(wǎng)絡(luò)基于一種深層非線性的網(wǎng)絡(luò)結(jié)構(gòu),完成圖像更深層特征的提取,展現(xiàn)了強(qiáng)大的從圖像中學(xué)習(xí)特征的能力。為了實(shí)現(xiàn)通常條件下表情圖像的準(zhǔn)確分類,提出了基于改進(jìn)VGG-19卷積神經(jīng)網(wǎng)絡(luò)的表情識(shí)別模型。由于大多數(shù)用于面部表情識(shí)別的表情數(shù)據(jù)庫(kù)缺乏足夠的數(shù)據(jù)來(lái)從頭開始訓(xùn)練整個(gè)網(wǎng)絡(luò),本文采用了遷移學(xué)習(xí)技術(shù)來(lái)克服圖像數(shù)量不足的問(wèn)題。并通過(guò)優(yōu)化網(wǎng)絡(luò)結(jié)構(gòu)來(lái)適當(dāng)減少網(wǎng)絡(luò)參數(shù),防止訓(xùn)練過(guò)程中產(chǎn)生過(guò)擬...
【文章來(lái)源】:哈爾濱師范大學(xué)黑龍江省
【文章頁(yè)數(shù)】:61 頁(yè)
【學(xué)位級(jí)別】:碩士
【部分圖文】:
LBP值的計(jì)算過(guò)程
哈爾濱師范大學(xué)碩士學(xué)位論文10形算子,其中R表示圓形結(jié)構(gòu)的半徑,P記為在圓形領(lǐng)域的采樣點(diǎn)數(shù)量。圖2-3展示了不同尺度上的圓形LBP算子,由圖可以看出改進(jìn)后算法的靈活性。LBP圓形算子的計(jì)算公式如下,并用LBPP,R表示:為::,=:=0:1g:g2:(23)還有一種LBP旋轉(zhuǎn)不變模式算子,如圖2-4所示,圖中的8種不同LBP算子的值碼都是(00000001)2。旋轉(zhuǎn)不變模式主要解決了之前的LBP模式中只具有灰度不變屬性,讓LBP的魯棒性變強(qiáng)。圖2-3幾種圓形模式的LBP算子Figure2-3LBPoperatorsofseveralcircularpatterns圖2-4旋轉(zhuǎn)不變模式的LBP算子Figure2-4LBPoperatorofrotationinvariantpatterns2.3.2Gabor特征Gabor特征也是一種可以用來(lái)描述圖像紋理信息的特征。我們發(fā)現(xiàn)Gabor濾波器的頻率和方向與人類視覺皮層里的簡(jiǎn)單細(xì)胞的視覺刺激響應(yīng)非常相似,特別適合于圖像的紋理表示與判別。其中,Gabor小波有較好的方向選擇和尺度選擇特性,并且對(duì)光照的適應(yīng)性較強(qiáng),不易受光照變化的影響。將多通道濾波方法應(yīng)用于Gabor小波變換,每個(gè)通道中的頻域均不相同,因此可以得到不同粒度的圖像特征。
哈爾濱師范大學(xué)碩士學(xué)位論文10形算子,其中R表示圓形結(jié)構(gòu)的半徑,P記為在圓形領(lǐng)域的采樣點(diǎn)數(shù)量。圖2-3展示了不同尺度上的圓形LBP算子,由圖可以看出改進(jìn)后算法的靈活性。LBP圓形算子的計(jì)算公式如下,并用LBPP,R表示:為::,=:=0:1g:g2:(23)還有一種LBP旋轉(zhuǎn)不變模式算子,如圖2-4所示,圖中的8種不同LBP算子的值碼都是(00000001)2。旋轉(zhuǎn)不變模式主要解決了之前的LBP模式中只具有灰度不變屬性,讓LBP的魯棒性變強(qiáng)。圖2-3幾種圓形模式的LBP算子Figure2-3LBPoperatorsofseveralcircularpatterns圖2-4旋轉(zhuǎn)不變模式的LBP算子Figure2-4LBPoperatorofrotationinvariantpatterns2.3.2Gabor特征Gabor特征也是一種可以用來(lái)描述圖像紋理信息的特征。我們發(fā)現(xiàn)Gabor濾波器的頻率和方向與人類視覺皮層里的簡(jiǎn)單細(xì)胞的視覺刺激響應(yīng)非常相似,特別適合于圖像的紋理表示與判別。其中,Gabor小波有較好的方向選擇和尺度選擇特性,并且對(duì)光照的適應(yīng)性較強(qiáng),不易受光照變化的影響。將多通道濾波方法應(yīng)用于Gabor小波變換,每個(gè)通道中的頻域均不相同,因此可以得到不同粒度的圖像特征。
【參考文獻(xiàn)】:
期刊論文
[1]基于VGG-NET的特征融合面部表情識(shí)別[J]. 李校林,鈕海濤. 計(jì)算機(jī)工程與科學(xué). 2020(03)
[2]基于多特征融合卷積神經(jīng)網(wǎng)絡(luò)的人臉表情識(shí)別[J]. 王建霞,陳慧萍,李佳澤,張曉明. 河北科技大學(xué)學(xué)報(bào). 2019(06)
[3]構(gòu)建并行卷積神經(jīng)網(wǎng)絡(luò)的表情識(shí)別算法[J]. 徐琳琳,張樹美,趙俊莉. 中國(guó)圖象圖形學(xué)報(bào). 2019(02)
[4]基于多特征與卷積神經(jīng)網(wǎng)絡(luò)的人臉表情識(shí)別[J]. 于明,安夢(mèng)濤,劉依. 科學(xué)技術(shù)與工程. 2018(13)
[5]基于全采樣和L1范數(shù)降采樣的卷積神經(jīng)網(wǎng)絡(luò)圖像分類方法[J]. 宋婷婷,徐世許. 軟件. 2018(02)
[6]不同池化模型的卷積神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)性能研究[J]. 劉萬(wàn)軍,梁雪劍,曲海成. 中國(guó)圖象圖形學(xué)報(bào). 2016(09)
[7]基于卷積神經(jīng)網(wǎng)絡(luò)的人臉識(shí)別方法[J]. 陳耀丹,王連明. 東北師大學(xué)報(bào)(自然科學(xué)版). 2016(02)
[8]圖像理解中的卷積神經(jīng)網(wǎng)絡(luò)[J]. 常亮,鄧小明,周明全,武仲科,袁野,楊碩,王宏安. 自動(dòng)化學(xué)報(bào). 2016(09)
[9]神經(jīng)網(wǎng)絡(luò)七十年:回顧與展望[J]. 焦李成,楊淑媛,劉芳,王士剛,馮志璽. 計(jì)算機(jī)學(xué)報(bào). 2016(08)
[10]ARIMA與RBF復(fù)合模型在設(shè)備運(yùn)行狀態(tài)趨勢(shì)預(yù)測(cè)中的應(yīng)用[J]. 王吉芳,費(fèi)仁元,徐小力,劉鑫. 機(jī)械傳動(dòng). 2011(09)
碩士論文
[1]基于卷積神經(jīng)網(wǎng)絡(luò)的人臉面部表情識(shí)別方法研究[D]. 張璐璐.河北科技大學(xué) 2019
[2]基于卷積神經(jīng)網(wǎng)絡(luò)的靜態(tài)面部表情識(shí)別研究[D]. 呂曼.合肥工業(yè)大學(xué) 2018
本文編號(hào):2956864
【文章來(lái)源】:哈爾濱師范大學(xué)黑龍江省
【文章頁(yè)數(shù)】:61 頁(yè)
【學(xué)位級(jí)別】:碩士
【部分圖文】:
LBP值的計(jì)算過(guò)程
哈爾濱師范大學(xué)碩士學(xué)位論文10形算子,其中R表示圓形結(jié)構(gòu)的半徑,P記為在圓形領(lǐng)域的采樣點(diǎn)數(shù)量。圖2-3展示了不同尺度上的圓形LBP算子,由圖可以看出改進(jìn)后算法的靈活性。LBP圓形算子的計(jì)算公式如下,并用LBPP,R表示:為::,=:=0:1g:g2:(23)還有一種LBP旋轉(zhuǎn)不變模式算子,如圖2-4所示,圖中的8種不同LBP算子的值碼都是(00000001)2。旋轉(zhuǎn)不變模式主要解決了之前的LBP模式中只具有灰度不變屬性,讓LBP的魯棒性變強(qiáng)。圖2-3幾種圓形模式的LBP算子Figure2-3LBPoperatorsofseveralcircularpatterns圖2-4旋轉(zhuǎn)不變模式的LBP算子Figure2-4LBPoperatorofrotationinvariantpatterns2.3.2Gabor特征Gabor特征也是一種可以用來(lái)描述圖像紋理信息的特征。我們發(fā)現(xiàn)Gabor濾波器的頻率和方向與人類視覺皮層里的簡(jiǎn)單細(xì)胞的視覺刺激響應(yīng)非常相似,特別適合于圖像的紋理表示與判別。其中,Gabor小波有較好的方向選擇和尺度選擇特性,并且對(duì)光照的適應(yīng)性較強(qiáng),不易受光照變化的影響。將多通道濾波方法應(yīng)用于Gabor小波變換,每個(gè)通道中的頻域均不相同,因此可以得到不同粒度的圖像特征。
哈爾濱師范大學(xué)碩士學(xué)位論文10形算子,其中R表示圓形結(jié)構(gòu)的半徑,P記為在圓形領(lǐng)域的采樣點(diǎn)數(shù)量。圖2-3展示了不同尺度上的圓形LBP算子,由圖可以看出改進(jìn)后算法的靈活性。LBP圓形算子的計(jì)算公式如下,并用LBPP,R表示:為::,=:=0:1g:g2:(23)還有一種LBP旋轉(zhuǎn)不變模式算子,如圖2-4所示,圖中的8種不同LBP算子的值碼都是(00000001)2。旋轉(zhuǎn)不變模式主要解決了之前的LBP模式中只具有灰度不變屬性,讓LBP的魯棒性變強(qiáng)。圖2-3幾種圓形模式的LBP算子Figure2-3LBPoperatorsofseveralcircularpatterns圖2-4旋轉(zhuǎn)不變模式的LBP算子Figure2-4LBPoperatorofrotationinvariantpatterns2.3.2Gabor特征Gabor特征也是一種可以用來(lái)描述圖像紋理信息的特征。我們發(fā)現(xiàn)Gabor濾波器的頻率和方向與人類視覺皮層里的簡(jiǎn)單細(xì)胞的視覺刺激響應(yīng)非常相似,特別適合于圖像的紋理表示與判別。其中,Gabor小波有較好的方向選擇和尺度選擇特性,并且對(duì)光照的適應(yīng)性較強(qiáng),不易受光照變化的影響。將多通道濾波方法應(yīng)用于Gabor小波變換,每個(gè)通道中的頻域均不相同,因此可以得到不同粒度的圖像特征。
【參考文獻(xiàn)】:
期刊論文
[1]基于VGG-NET的特征融合面部表情識(shí)別[J]. 李校林,鈕海濤. 計(jì)算機(jī)工程與科學(xué). 2020(03)
[2]基于多特征融合卷積神經(jīng)網(wǎng)絡(luò)的人臉表情識(shí)別[J]. 王建霞,陳慧萍,李佳澤,張曉明. 河北科技大學(xué)學(xué)報(bào). 2019(06)
[3]構(gòu)建并行卷積神經(jīng)網(wǎng)絡(luò)的表情識(shí)別算法[J]. 徐琳琳,張樹美,趙俊莉. 中國(guó)圖象圖形學(xué)報(bào). 2019(02)
[4]基于多特征與卷積神經(jīng)網(wǎng)絡(luò)的人臉表情識(shí)別[J]. 于明,安夢(mèng)濤,劉依. 科學(xué)技術(shù)與工程. 2018(13)
[5]基于全采樣和L1范數(shù)降采樣的卷積神經(jīng)網(wǎng)絡(luò)圖像分類方法[J]. 宋婷婷,徐世許. 軟件. 2018(02)
[6]不同池化模型的卷積神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)性能研究[J]. 劉萬(wàn)軍,梁雪劍,曲海成. 中國(guó)圖象圖形學(xué)報(bào). 2016(09)
[7]基于卷積神經(jīng)網(wǎng)絡(luò)的人臉識(shí)別方法[J]. 陳耀丹,王連明. 東北師大學(xué)報(bào)(自然科學(xué)版). 2016(02)
[8]圖像理解中的卷積神經(jīng)網(wǎng)絡(luò)[J]. 常亮,鄧小明,周明全,武仲科,袁野,楊碩,王宏安. 自動(dòng)化學(xué)報(bào). 2016(09)
[9]神經(jīng)網(wǎng)絡(luò)七十年:回顧與展望[J]. 焦李成,楊淑媛,劉芳,王士剛,馮志璽. 計(jì)算機(jī)學(xué)報(bào). 2016(08)
[10]ARIMA與RBF復(fù)合模型在設(shè)備運(yùn)行狀態(tài)趨勢(shì)預(yù)測(cè)中的應(yīng)用[J]. 王吉芳,費(fèi)仁元,徐小力,劉鑫. 機(jī)械傳動(dòng). 2011(09)
碩士論文
[1]基于卷積神經(jīng)網(wǎng)絡(luò)的人臉面部表情識(shí)別方法研究[D]. 張璐璐.河北科技大學(xué) 2019
[2]基于卷積神經(jīng)網(wǎng)絡(luò)的靜態(tài)面部表情識(shí)別研究[D]. 呂曼.合肥工業(yè)大學(xué) 2018
本文編號(hào):2956864
本文鏈接:http://sikaile.net/kejilunwen/zidonghuakongzhilunwen/2956864.html
最近更新
教材專著