基于深度神經(jīng)網(wǎng)絡(luò)的面部表情識別研究與實(shí)現(xiàn)
發(fā)布時(shí)間:2021-03-24 21:12
人臉表情識別一直以來都是計(jì)算機(jī)視覺和機(jī)器學(xué)習(xí)領(lǐng)域的研究熱點(diǎn)。因?yàn)槿祟惸槻康牟煌砬榈牟町惙浅<?xì)微,因此,讓計(jì)算機(jī)準(zhǔn)確的識別人臉面部表情是一項(xiàng)極具挑戰(zhàn)性的任務(wù)。此外,許多公開的人臉面部表情識別算法對在非限制條件下采集到的人臉圖像識別效果不佳,其表情識別算法距離實(shí)際應(yīng)用仍有較大的差距。傳統(tǒng)的表情識別算法通常只是用到圖像的空間結(jié)構(gòu)信息,但是表情的變化是一個動態(tài)的過程,它在變化的過程中具有非常明顯的動作變化特征,也就是時(shí)序的信息,該信息一般使用多幀圖像,利用光流算法來進(jìn)行獲取,但是這種方法所需要的計(jì)算資源過大,算法較為復(fù)雜。針對上述問題,本文采用基于深度時(shí)空信息融合的方法來提高人臉表情識別的正確率和魯棒性。本文的研究內(nèi)容如下:(1)調(diào)研了常用的人臉表情特征提取算法和人臉表情分類方法,并對經(jīng)典的人臉表情識別系統(tǒng)進(jìn)行了重現(xiàn),對比了各個識別系統(tǒng)的識別正確率,并分析了這些識別系統(tǒng)的優(yōu)劣;(2)提出了針對人臉表情識別的特征提取方法,由于近年來,卷積神經(jīng)網(wǎng)絡(luò)在圖像識別領(lǐng)域取得了巨大的成功,本文將其引入到表情識別領(lǐng)域并取得了不錯的效果;為了進(jìn)一步提高表情識別的正確率,本文在利用表情圖像的空間特征之外,又介紹...
【文章來源】:南京郵電大學(xué)江蘇省
【文章頁數(shù)】:66 頁
【學(xué)位級別】:碩士
【部分圖文】:
通過KL變換之后的人臉圖像
圖 2.3 LBP 編碼過程示意圖LBP 特征值的定義,如公式 2.1 所示: 7i 01, 0s 2 s0, elseii cxLBP p p x (2.1其中,cP 表示中心像素點(diǎn)的灰度值,iP 表示其他像素點(diǎn)的灰度值。由于上述原理中,LBP 算子限定在一個固定的窗口中,只有當(dāng)特征恰好和該窗口大小相時(shí),才能夠有效的提取;但是眾所周知,自然圖像中特征匹配度好的,肯定不止矩形一式,因此 Ojala 等人改進(jìn)并拓展了基本 LBP 算子的結(jié)構(gòu),提出了一種圓形結(jié)構(gòu)的 LBP 算5]。在一幅灰度圖像中,定義了一個半徑為 R(R>0)的圓環(huán)形區(qū)域,在圓周上均勻分布了>0)個鄰域像素,如圖 2.4 所示.
向傳播就是要把這個誤差信息回傳給神經(jīng)網(wǎng)絡(luò)的每一層,每一層都會通過梯度的大小來自身的權(quán)值,讓誤差進(jìn)一步縮小。BP 算法中是使用用梯度下降法進(jìn)行權(quán)值更新的。oldloldlnewloldloldlnewlbEbbWEWW 其中 是梯度下降的學(xué)習(xí)率(learning rate),該學(xué)習(xí)率控制參數(shù)更新的步長,從公式(2.看出,梯度下降法更新權(quán)值,其核心就是求梯度矩陣,最直接的辦法就是利用誤差代價(jià)來計(jì)算參數(shù)的梯度,所以權(quán)值更新的本質(zhì)在于,神經(jīng)網(wǎng)絡(luò)的每一個參數(shù)可以依據(jù)各自的梯度,利用公式進(jìn)行參數(shù)更新。在權(quán)值不斷的更新之后,卷積神經(jīng)網(wǎng)絡(luò)就逐漸學(xué)習(xí)到了提取圖像特征的能力,如圖 2.11 所示不同的卷積核提取不同的特征,會生成不同的特征圖一層再將這些特征進(jìn)行進(jìn)一步的融合,提取更高層次的特征。
【參考文獻(xiàn)】:
期刊論文
[1]一種基于CLMF的深度卷積神經(jīng)網(wǎng)絡(luò)模型[J]. 隨婷婷,王曉峰. 自動化學(xué)報(bào). 2016(06)
本文編號:3098404
【文章來源】:南京郵電大學(xué)江蘇省
【文章頁數(shù)】:66 頁
【學(xué)位級別】:碩士
【部分圖文】:
通過KL變換之后的人臉圖像
圖 2.3 LBP 編碼過程示意圖LBP 特征值的定義,如公式 2.1 所示: 7i 01, 0s 2 s0, elseii cxLBP p p x (2.1其中,cP 表示中心像素點(diǎn)的灰度值,iP 表示其他像素點(diǎn)的灰度值。由于上述原理中,LBP 算子限定在一個固定的窗口中,只有當(dāng)特征恰好和該窗口大小相時(shí),才能夠有效的提取;但是眾所周知,自然圖像中特征匹配度好的,肯定不止矩形一式,因此 Ojala 等人改進(jìn)并拓展了基本 LBP 算子的結(jié)構(gòu),提出了一種圓形結(jié)構(gòu)的 LBP 算5]。在一幅灰度圖像中,定義了一個半徑為 R(R>0)的圓環(huán)形區(qū)域,在圓周上均勻分布了>0)個鄰域像素,如圖 2.4 所示.
向傳播就是要把這個誤差信息回傳給神經(jīng)網(wǎng)絡(luò)的每一層,每一層都會通過梯度的大小來自身的權(quán)值,讓誤差進(jìn)一步縮小。BP 算法中是使用用梯度下降法進(jìn)行權(quán)值更新的。oldloldlnewloldloldlnewlbEbbWEWW 其中 是梯度下降的學(xué)習(xí)率(learning rate),該學(xué)習(xí)率控制參數(shù)更新的步長,從公式(2.看出,梯度下降法更新權(quán)值,其核心就是求梯度矩陣,最直接的辦法就是利用誤差代價(jià)來計(jì)算參數(shù)的梯度,所以權(quán)值更新的本質(zhì)在于,神經(jīng)網(wǎng)絡(luò)的每一個參數(shù)可以依據(jù)各自的梯度,利用公式進(jìn)行參數(shù)更新。在權(quán)值不斷的更新之后,卷積神經(jīng)網(wǎng)絡(luò)就逐漸學(xué)習(xí)到了提取圖像特征的能力,如圖 2.11 所示不同的卷積核提取不同的特征,會生成不同的特征圖一層再將這些特征進(jìn)行進(jìn)一步的融合,提取更高層次的特征。
【參考文獻(xiàn)】:
期刊論文
[1]一種基于CLMF的深度卷積神經(jīng)網(wǎng)絡(luò)模型[J]. 隨婷婷,王曉峰. 自動化學(xué)報(bào). 2016(06)
本文編號:3098404
本文鏈接:http://sikaile.net/kejilunwen/zidonghuakongzhilunwen/3098404.html
最近更新
教材專著