基于深度神經(jīng)網(wǎng)絡(luò)的面部表情識(shí)別研究與實(shí)現(xiàn)
發(fā)布時(shí)間:2021-03-24 21:12
人臉表情識(shí)別一直以來(lái)都是計(jì)算機(jī)視覺(jué)和機(jī)器學(xué)習(xí)領(lǐng)域的研究熱點(diǎn)。因?yàn)槿祟?lèi)臉部的不同表情的差異非常細(xì)微,因此,讓計(jì)算機(jī)準(zhǔn)確的識(shí)別人臉面部表情是一項(xiàng)極具挑戰(zhàn)性的任務(wù)。此外,許多公開(kāi)的人臉面部表情識(shí)別算法對(duì)在非限制條件下采集到的人臉圖像識(shí)別效果不佳,其表情識(shí)別算法距離實(shí)際應(yīng)用仍有較大的差距。傳統(tǒng)的表情識(shí)別算法通常只是用到圖像的空間結(jié)構(gòu)信息,但是表情的變化是一個(gè)動(dòng)態(tài)的過(guò)程,它在變化的過(guò)程中具有非常明顯的動(dòng)作變化特征,也就是時(shí)序的信息,該信息一般使用多幀圖像,利用光流算法來(lái)進(jìn)行獲取,但是這種方法所需要的計(jì)算資源過(guò)大,算法較為復(fù)雜。針對(duì)上述問(wèn)題,本文采用基于深度時(shí)空信息融合的方法來(lái)提高人臉表情識(shí)別的正確率和魯棒性。本文的研究?jī)?nèi)容如下:(1)調(diào)研了常用的人臉表情特征提取算法和人臉表情分類(lèi)方法,并對(duì)經(jīng)典的人臉表情識(shí)別系統(tǒng)進(jìn)行了重現(xiàn),對(duì)比了各個(gè)識(shí)別系統(tǒng)的識(shí)別正確率,并分析了這些識(shí)別系統(tǒng)的優(yōu)劣;(2)提出了針對(duì)人臉表情識(shí)別的特征提取方法,由于近年來(lái),卷積神經(jīng)網(wǎng)絡(luò)在圖像識(shí)別領(lǐng)域取得了巨大的成功,本文將其引入到表情識(shí)別領(lǐng)域并取得了不錯(cuò)的效果;為了進(jìn)一步提高表情識(shí)別的正確率,本文在利用表情圖像的空間特征之外,又介紹...
【文章來(lái)源】:南京郵電大學(xué)江蘇省
【文章頁(yè)數(shù)】:66 頁(yè)
【學(xué)位級(jí)別】:碩士
【部分圖文】:
通過(guò)KL變換之后的人臉圖像
圖 2.3 LBP 編碼過(guò)程示意圖LBP 特征值的定義,如公式 2.1 所示: 7i 01, 0s 2 s0, elseii cxLBP p p x (2.1其中,cP 表示中心像素點(diǎn)的灰度值,iP 表示其他像素點(diǎn)的灰度值。由于上述原理中,LBP 算子限定在一個(gè)固定的窗口中,只有當(dāng)特征恰好和該窗口大小相時(shí),才能夠有效的提;但是眾所周知,自然圖像中特征匹配度好的,肯定不止矩形一式,因此 Ojala 等人改進(jìn)并拓展了基本 LBP 算子的結(jié)構(gòu),提出了一種圓形結(jié)構(gòu)的 LBP 算5]。在一幅灰度圖像中,定義了一個(gè)半徑為 R(R>0)的圓環(huán)形區(qū)域,在圓周上均勻分布了>0)個(gè)鄰域像素,如圖 2.4 所示.
向傳播就是要把這個(gè)誤差信息回傳給神經(jīng)網(wǎng)絡(luò)的每一層,每一層都會(huì)通過(guò)梯度的大小來(lái)自身的權(quán)值,讓誤差進(jìn)一步縮小。BP 算法中是使用用梯度下降法進(jìn)行權(quán)值更新的。oldloldlnewloldloldlnewlbEbbWEWW 其中 是梯度下降的學(xué)習(xí)率(learning rate),該學(xué)習(xí)率控制參數(shù)更新的步長(zhǎng),從公式(2.看出,梯度下降法更新權(quán)值,其核心就是求梯度矩陣,最直接的辦法就是利用誤差代價(jià)來(lái)計(jì)算參數(shù)的梯度,所以權(quán)值更新的本質(zhì)在于,神經(jīng)網(wǎng)絡(luò)的每一個(gè)參數(shù)可以依據(jù)各自的梯度,利用公式進(jìn)行參數(shù)更新。在權(quán)值不斷的更新之后,卷積神經(jīng)網(wǎng)絡(luò)就逐漸學(xué)習(xí)到了提取圖像特征的能力,如圖 2.11 所示不同的卷積核提取不同的特征,會(huì)生成不同的特征圖一層再將這些特征進(jìn)行進(jìn)一步的融合,提取更高層次的特征。
【參考文獻(xiàn)】:
期刊論文
[1]一種基于CLMF的深度卷積神經(jīng)網(wǎng)絡(luò)模型[J]. 隨婷婷,王曉峰. 自動(dòng)化學(xué)報(bào). 2016(06)
本文編號(hào):3098404
【文章來(lái)源】:南京郵電大學(xué)江蘇省
【文章頁(yè)數(shù)】:66 頁(yè)
【學(xué)位級(jí)別】:碩士
【部分圖文】:
通過(guò)KL變換之后的人臉圖像
圖 2.3 LBP 編碼過(guò)程示意圖LBP 特征值的定義,如公式 2.1 所示: 7i 01, 0s 2 s0, elseii cxLBP p p x (2.1其中,cP 表示中心像素點(diǎn)的灰度值,iP 表示其他像素點(diǎn)的灰度值。由于上述原理中,LBP 算子限定在一個(gè)固定的窗口中,只有當(dāng)特征恰好和該窗口大小相時(shí),才能夠有效的提;但是眾所周知,自然圖像中特征匹配度好的,肯定不止矩形一式,因此 Ojala 等人改進(jìn)并拓展了基本 LBP 算子的結(jié)構(gòu),提出了一種圓形結(jié)構(gòu)的 LBP 算5]。在一幅灰度圖像中,定義了一個(gè)半徑為 R(R>0)的圓環(huán)形區(qū)域,在圓周上均勻分布了>0)個(gè)鄰域像素,如圖 2.4 所示.
向傳播就是要把這個(gè)誤差信息回傳給神經(jīng)網(wǎng)絡(luò)的每一層,每一層都會(huì)通過(guò)梯度的大小來(lái)自身的權(quán)值,讓誤差進(jìn)一步縮小。BP 算法中是使用用梯度下降法進(jìn)行權(quán)值更新的。oldloldlnewloldloldlnewlbEbbWEWW 其中 是梯度下降的學(xué)習(xí)率(learning rate),該學(xué)習(xí)率控制參數(shù)更新的步長(zhǎng),從公式(2.看出,梯度下降法更新權(quán)值,其核心就是求梯度矩陣,最直接的辦法就是利用誤差代價(jià)來(lái)計(jì)算參數(shù)的梯度,所以權(quán)值更新的本質(zhì)在于,神經(jīng)網(wǎng)絡(luò)的每一個(gè)參數(shù)可以依據(jù)各自的梯度,利用公式進(jìn)行參數(shù)更新。在權(quán)值不斷的更新之后,卷積神經(jīng)網(wǎng)絡(luò)就逐漸學(xué)習(xí)到了提取圖像特征的能力,如圖 2.11 所示不同的卷積核提取不同的特征,會(huì)生成不同的特征圖一層再將這些特征進(jìn)行進(jìn)一步的融合,提取更高層次的特征。
【參考文獻(xiàn)】:
期刊論文
[1]一種基于CLMF的深度卷積神經(jīng)網(wǎng)絡(luò)模型[J]. 隨婷婷,王曉峰. 自動(dòng)化學(xué)報(bào). 2016(06)
本文編號(hào):3098404
本文鏈接:http://sikaile.net/kejilunwen/zidonghuakongzhilunwen/3098404.html
最近更新
教材專(zhuān)著