基于深度卷積神經(jīng)網(wǎng)絡(luò)的小尺度人臉情緒識別
發(fā)布時間:2020-12-22 14:29
人臉情緒識別是提升機器智能程度的重要環(huán)節(jié),在社交機器人、醫(yī)學治療及疲勞駕駛監(jiān)測等人機交互系統(tǒng)中有著廣泛的應(yīng)用。傳統(tǒng)的人臉情緒識別主要靠人工提取特征結(jié)合分類的方法,存在操作復(fù)雜、特征表征能力不強、效果差等問題,用深度學習的方法來替代傳統(tǒng)人臉情緒識別方法可以有效彌補上述不足。隨著人們對深度卷積神經(jīng)網(wǎng)絡(luò)的認知不斷更新,特定人臉情緒識別算法中的網(wǎng)絡(luò)結(jié)構(gòu)不合理、訓(xùn)練效率低下等問題顯現(xiàn)。本文為解決這些問題,對整個系統(tǒng)中的人臉檢測和小尺度情緒識別分別展開研究。針對特定的人臉檢測算法網(wǎng)絡(luò),提出了一種網(wǎng)絡(luò)調(diào)整的方案。對特定的人臉檢測算法網(wǎng)絡(luò)結(jié)構(gòu)進行深入分析,包括參數(shù)量、計算量和感受野。采用連續(xù)堆疊的小卷積核構(gòu)成小卷積核加速模塊,替換網(wǎng)絡(luò)淺層特征提取模塊。采用空洞卷積結(jié)合普通卷積構(gòu)成視覺感知模塊,替換網(wǎng)絡(luò)深層特征提取模塊。通過實驗驗證了網(wǎng)絡(luò)調(diào)整方案的有效性。針對人臉檢測算法模型訓(xùn)練,提出了一種引導(dǎo)式訓(xùn)練策略。啟發(fā)于教師教學的漸進式特點,在網(wǎng)絡(luò)訓(xùn)練的周期中引入真實目標信息,并逐漸減少信息量。通過實驗驗證了引導(dǎo)式訓(xùn)練策略的可行性。針對小尺度人臉情緒識別,提出了一種基于注意力機制的網(wǎng)絡(luò)。對算法場景進行分析,調(diào)整...
【文章來源】:哈爾濱工業(yè)大學黑龍江省 211工程院校 985工程院校
【文章頁數(shù)】:59 頁
【學位級別】:碩士
【部分圖文】:
人臉情緒識別流程圖
哈爾濱工業(yè)大學工程碩士學位論文學習的檢測方法。圖1-2基于傳統(tǒng)圖像處理的人臉檢測方法[2]早期的人臉檢測方法基本上都是通過傳統(tǒng)圖像處理來實現(xiàn)的,其中最有影響力的便是Viola-Jones算法[2],具體做法是先通過滑動窗口來得到候選框,然后通過一些人工設(shè)計的算子,如Haar-like算子[3]來提取候選框中圖像的特征,再用傳統(tǒng)的機器學習算法如SVM[4]進行分類,最后利用級聯(lián)的分類器來進一步提升分類器的準確率。如圖1-2所示,先利用滑動窗口來獲取候選框,然后提取候選框中圖像的特征并用級聯(lián)分類器來判斷是否是人臉,最后通過后處理來得到整個人臉的矩形區(qū)域。類似框架的算法還有很多[5–9],它們都是對級聯(lián)分類器結(jié)構(gòu)的改進,采用樹形級聯(lián)結(jié)構(gòu)或者更為復(fù)雜的級聯(lián)結(jié)構(gòu),如圖1-3所示。該類算法面臨著手動提取特征的局限性,且利用滑動窗口來獲取候選框的做法比較耗時,在復(fù)雜場景下表現(xiàn)較差,魯棒性和性能不高是該類算法的主要問題。a)并聯(lián)型[5]b)金字塔型[6]c)決策樹型I[7]d)決策樹型II[8]圖1-3級聯(lián)結(jié)構(gòu)隨著硬件計算力的巨大提升和海量數(shù)據(jù)獲取難度的降低,卷積神經(jīng)網(wǎng)絡(luò)的作用更加明顯;谏疃葘W習的人臉檢測方法可以分為三種:基于級聯(lián)卷積神經(jīng)網(wǎng)絡(luò)的人臉檢測方法、基于兩階段的人臉檢測方法、基于一階段的人臉檢測方法。Li[10]等人提出了基于級聯(lián)卷積神經(jīng)網(wǎng)絡(luò)的人臉檢測(如圖1-4),該算法是對Viola-Jones方法的深度卷積神經(jīng)網(wǎng)絡(luò)實現(xiàn),將卷積神經(jīng)網(wǎng)絡(luò)作為級聯(lián)分類器中的基分類器,并利用多尺度特征圖融合來提升算法的精度。Zhang[11]等人提出了多任務(wù)級聯(lián)卷積網(wǎng)絡(luò),實現(xiàn)人臉檢測的同時完成人臉關(guān)鍵點定位,兩個任務(wù)能夠共享信息,人臉檢測協(xié)助關(guān)鍵點定位任務(wù)確定點的大致區(qū)域,關(guān)鍵點定位協(xié)助人臉檢測任務(wù)確定人-3-
哈爾濱工業(yè)大學工程碩士學位論文學習的檢測方法。圖1-2基于傳統(tǒng)圖像處理的人臉檢測方法[2]早期的人臉檢測方法基本上都是通過傳統(tǒng)圖像處理來實現(xiàn)的,其中最有影響力的便是Viola-Jones算法[2],具體做法是先通過滑動窗口來得到候選框,然后通過一些人工設(shè)計的算子,如Haar-like算子[3]來提取候選框中圖像的特征,再用傳統(tǒng)的機器學習算法如SVM[4]進行分類,最后利用級聯(lián)的分類器來進一步提升分類器的準確率。如圖1-2所示,先利用滑動窗口來獲取候選框,然后提取候選框中圖像的特征并用級聯(lián)分類器來判斷是否是人臉,最后通過后處理來得到整個人臉的矩形區(qū)域。類似框架的算法還有很多[5–9],它們都是對級聯(lián)分類器結(jié)構(gòu)的改進,采用樹形級聯(lián)結(jié)構(gòu)或者更為復(fù)雜的級聯(lián)結(jié)構(gòu),如圖1-3所示。該類算法面臨著手動提取特征的局限性,且利用滑動窗口來獲取候選框的做法比較耗時,在復(fù)雜場景下表現(xiàn)較差,魯棒性和性能不高是該類算法的主要問題。a)并聯(lián)型[5]b)金字塔型[6]c)決策樹型I[7]d)決策樹型II[8]圖1-3級聯(lián)結(jié)構(gòu)隨著硬件計算力的巨大提升和海量數(shù)據(jù)獲取難度的降低,卷積神經(jīng)網(wǎng)絡(luò)的作用更加明顯;谏疃葘W習的人臉檢測方法可以分為三種:基于級聯(lián)卷積神經(jīng)網(wǎng)絡(luò)的人臉檢測方法、基于兩階段的人臉檢測方法、基于一階段的人臉檢測方法。Li[10]等人提出了基于級聯(lián)卷積神經(jīng)網(wǎng)絡(luò)的人臉檢測(如圖1-4),該算法是對Viola-Jones方法的深度卷積神經(jīng)網(wǎng)絡(luò)實現(xiàn),將卷積神經(jīng)網(wǎng)絡(luò)作為級聯(lián)分類器中的基分類器,并利用多尺度特征圖融合來提升算法的精度。Zhang[11]等人提出了多任務(wù)級聯(lián)卷積網(wǎng)絡(luò),實現(xiàn)人臉檢測的同時完成人臉關(guān)鍵點定位,兩個任務(wù)能夠共享信息,人臉檢測協(xié)助關(guān)鍵點定位任務(wù)確定點的大致區(qū)域,關(guān)鍵點定位協(xié)助人臉檢測任務(wù)確定人-3-
本文編號:2931919
【文章來源】:哈爾濱工業(yè)大學黑龍江省 211工程院校 985工程院校
【文章頁數(shù)】:59 頁
【學位級別】:碩士
【部分圖文】:
人臉情緒識別流程圖
哈爾濱工業(yè)大學工程碩士學位論文學習的檢測方法。圖1-2基于傳統(tǒng)圖像處理的人臉檢測方法[2]早期的人臉檢測方法基本上都是通過傳統(tǒng)圖像處理來實現(xiàn)的,其中最有影響力的便是Viola-Jones算法[2],具體做法是先通過滑動窗口來得到候選框,然后通過一些人工設(shè)計的算子,如Haar-like算子[3]來提取候選框中圖像的特征,再用傳統(tǒng)的機器學習算法如SVM[4]進行分類,最后利用級聯(lián)的分類器來進一步提升分類器的準確率。如圖1-2所示,先利用滑動窗口來獲取候選框,然后提取候選框中圖像的特征并用級聯(lián)分類器來判斷是否是人臉,最后通過后處理來得到整個人臉的矩形區(qū)域。類似框架的算法還有很多[5–9],它們都是對級聯(lián)分類器結(jié)構(gòu)的改進,采用樹形級聯(lián)結(jié)構(gòu)或者更為復(fù)雜的級聯(lián)結(jié)構(gòu),如圖1-3所示。該類算法面臨著手動提取特征的局限性,且利用滑動窗口來獲取候選框的做法比較耗時,在復(fù)雜場景下表現(xiàn)較差,魯棒性和性能不高是該類算法的主要問題。a)并聯(lián)型[5]b)金字塔型[6]c)決策樹型I[7]d)決策樹型II[8]圖1-3級聯(lián)結(jié)構(gòu)隨著硬件計算力的巨大提升和海量數(shù)據(jù)獲取難度的降低,卷積神經(jīng)網(wǎng)絡(luò)的作用更加明顯;谏疃葘W習的人臉檢測方法可以分為三種:基于級聯(lián)卷積神經(jīng)網(wǎng)絡(luò)的人臉檢測方法、基于兩階段的人臉檢測方法、基于一階段的人臉檢測方法。Li[10]等人提出了基于級聯(lián)卷積神經(jīng)網(wǎng)絡(luò)的人臉檢測(如圖1-4),該算法是對Viola-Jones方法的深度卷積神經(jīng)網(wǎng)絡(luò)實現(xiàn),將卷積神經(jīng)網(wǎng)絡(luò)作為級聯(lián)分類器中的基分類器,并利用多尺度特征圖融合來提升算法的精度。Zhang[11]等人提出了多任務(wù)級聯(lián)卷積網(wǎng)絡(luò),實現(xiàn)人臉檢測的同時完成人臉關(guān)鍵點定位,兩個任務(wù)能夠共享信息,人臉檢測協(xié)助關(guān)鍵點定位任務(wù)確定點的大致區(qū)域,關(guān)鍵點定位協(xié)助人臉檢測任務(wù)確定人-3-
哈爾濱工業(yè)大學工程碩士學位論文學習的檢測方法。圖1-2基于傳統(tǒng)圖像處理的人臉檢測方法[2]早期的人臉檢測方法基本上都是通過傳統(tǒng)圖像處理來實現(xiàn)的,其中最有影響力的便是Viola-Jones算法[2],具體做法是先通過滑動窗口來得到候選框,然后通過一些人工設(shè)計的算子,如Haar-like算子[3]來提取候選框中圖像的特征,再用傳統(tǒng)的機器學習算法如SVM[4]進行分類,最后利用級聯(lián)的分類器來進一步提升分類器的準確率。如圖1-2所示,先利用滑動窗口來獲取候選框,然后提取候選框中圖像的特征并用級聯(lián)分類器來判斷是否是人臉,最后通過后處理來得到整個人臉的矩形區(qū)域。類似框架的算法還有很多[5–9],它們都是對級聯(lián)分類器結(jié)構(gòu)的改進,采用樹形級聯(lián)結(jié)構(gòu)或者更為復(fù)雜的級聯(lián)結(jié)構(gòu),如圖1-3所示。該類算法面臨著手動提取特征的局限性,且利用滑動窗口來獲取候選框的做法比較耗時,在復(fù)雜場景下表現(xiàn)較差,魯棒性和性能不高是該類算法的主要問題。a)并聯(lián)型[5]b)金字塔型[6]c)決策樹型I[7]d)決策樹型II[8]圖1-3級聯(lián)結(jié)構(gòu)隨著硬件計算力的巨大提升和海量數(shù)據(jù)獲取難度的降低,卷積神經(jīng)網(wǎng)絡(luò)的作用更加明顯;谏疃葘W習的人臉檢測方法可以分為三種:基于級聯(lián)卷積神經(jīng)網(wǎng)絡(luò)的人臉檢測方法、基于兩階段的人臉檢測方法、基于一階段的人臉檢測方法。Li[10]等人提出了基于級聯(lián)卷積神經(jīng)網(wǎng)絡(luò)的人臉檢測(如圖1-4),該算法是對Viola-Jones方法的深度卷積神經(jīng)網(wǎng)絡(luò)實現(xiàn),將卷積神經(jīng)網(wǎng)絡(luò)作為級聯(lián)分類器中的基分類器,并利用多尺度特征圖融合來提升算法的精度。Zhang[11]等人提出了多任務(wù)級聯(lián)卷積網(wǎng)絡(luò),實現(xiàn)人臉檢測的同時完成人臉關(guān)鍵點定位,兩個任務(wù)能夠共享信息,人臉檢測協(xié)助關(guān)鍵點定位任務(wù)確定點的大致區(qū)域,關(guān)鍵點定位協(xié)助人臉檢測任務(wù)確定人-3-
本文編號:2931919
本文鏈接:http://sikaile.net/kejilunwen/zidonghuakongzhilunwen/2931919.html
最近更新
教材專著