基于深度卷積神經(jīng)網(wǎng)絡(luò)的小尺度人臉情緒識(shí)別
發(fā)布時(shí)間:2020-12-22 14:29
人臉情緒識(shí)別是提升機(jī)器智能程度的重要環(huán)節(jié),在社交機(jī)器人、醫(yī)學(xué)治療及疲勞駕駛監(jiān)測(cè)等人機(jī)交互系統(tǒng)中有著廣泛的應(yīng)用。傳統(tǒng)的人臉情緒識(shí)別主要靠人工提取特征結(jié)合分類的方法,存在操作復(fù)雜、特征表征能力不強(qiáng)、效果差等問(wèn)題,用深度學(xué)習(xí)的方法來(lái)替代傳統(tǒng)人臉情緒識(shí)別方法可以有效彌補(bǔ)上述不足。隨著人們對(duì)深度卷積神經(jīng)網(wǎng)絡(luò)的認(rèn)知不斷更新,特定人臉情緒識(shí)別算法中的網(wǎng)絡(luò)結(jié)構(gòu)不合理、訓(xùn)練效率低下等問(wèn)題顯現(xiàn)。本文為解決這些問(wèn)題,對(duì)整個(gè)系統(tǒng)中的人臉檢測(cè)和小尺度情緒識(shí)別分別展開(kāi)研究。針對(duì)特定的人臉檢測(cè)算法網(wǎng)絡(luò),提出了一種網(wǎng)絡(luò)調(diào)整的方案。對(duì)特定的人臉檢測(cè)算法網(wǎng)絡(luò)結(jié)構(gòu)進(jìn)行深入分析,包括參數(shù)量、計(jì)算量和感受野。采用連續(xù)堆疊的小卷積核構(gòu)成小卷積核加速模塊,替換網(wǎng)絡(luò)淺層特征提取模塊。采用空洞卷積結(jié)合普通卷積構(gòu)成視覺(jué)感知模塊,替換網(wǎng)絡(luò)深層特征提取模塊。通過(guò)實(shí)驗(yàn)驗(yàn)證了網(wǎng)絡(luò)調(diào)整方案的有效性。針對(duì)人臉檢測(cè)算法模型訓(xùn)練,提出了一種引導(dǎo)式訓(xùn)練策略。啟發(fā)于教師教學(xué)的漸進(jìn)式特點(diǎn),在網(wǎng)絡(luò)訓(xùn)練的周期中引入真實(shí)目標(biāo)信息,并逐漸減少信息量。通過(guò)實(shí)驗(yàn)驗(yàn)證了引導(dǎo)式訓(xùn)練策略的可行性。針對(duì)小尺度人臉情緒識(shí)別,提出了一種基于注意力機(jī)制的網(wǎng)絡(luò)。對(duì)算法場(chǎng)景進(jìn)行分析,調(diào)整...
【文章來(lái)源】:哈爾濱工業(yè)大學(xué)黑龍江省 211工程院校 985工程院校
【文章頁(yè)數(shù)】:59 頁(yè)
【學(xué)位級(jí)別】:碩士
【部分圖文】:
人臉情緒識(shí)別流程圖
哈爾濱工業(yè)大學(xué)工程碩士學(xué)位論文學(xué)習(xí)的檢測(cè)方法。圖1-2基于傳統(tǒng)圖像處理的人臉檢測(cè)方法[2]早期的人臉檢測(cè)方法基本上都是通過(guò)傳統(tǒng)圖像處理來(lái)實(shí)現(xiàn)的,其中最有影響力的便是Viola-Jones算法[2],具體做法是先通過(guò)滑動(dòng)窗口來(lái)得到候選框,然后通過(guò)一些人工設(shè)計(jì)的算子,如Haar-like算子[3]來(lái)提取候選框中圖像的特征,再用傳統(tǒng)的機(jī)器學(xué)習(xí)算法如SVM[4]進(jìn)行分類,最后利用級(jí)聯(lián)的分類器來(lái)進(jìn)一步提升分類器的準(zhǔn)確率。如圖1-2所示,先利用滑動(dòng)窗口來(lái)獲取候選框,然后提取候選框中圖像的特征并用級(jí)聯(lián)分類器來(lái)判斷是否是人臉,最后通過(guò)后處理來(lái)得到整個(gè)人臉的矩形區(qū)域。類似框架的算法還有很多[5–9],它們都是對(duì)級(jí)聯(lián)分類器結(jié)構(gòu)的改進(jìn),采用樹(shù)形級(jí)聯(lián)結(jié)構(gòu)或者更為復(fù)雜的級(jí)聯(lián)結(jié)構(gòu),如圖1-3所示。該類算法面臨著手動(dòng)提取特征的局限性,且利用滑動(dòng)窗口來(lái)獲取候選框的做法比較耗時(shí),在復(fù)雜場(chǎng)景下表現(xiàn)較差,魯棒性和性能不高是該類算法的主要問(wèn)題。a)并聯(lián)型[5]b)金字塔型[6]c)決策樹(shù)型I[7]d)決策樹(shù)型II[8]圖1-3級(jí)聯(lián)結(jié)構(gòu)隨著硬件計(jì)算力的巨大提升和海量數(shù)據(jù)獲取難度的降低,卷積神經(jīng)網(wǎng)絡(luò)的作用更加明顯。基于深度學(xué)習(xí)的人臉檢測(cè)方法可以分為三種:基于級(jí)聯(lián)卷積神經(jīng)網(wǎng)絡(luò)的人臉檢測(cè)方法、基于兩階段的人臉檢測(cè)方法、基于一階段的人臉檢測(cè)方法。Li[10]等人提出了基于級(jí)聯(lián)卷積神經(jīng)網(wǎng)絡(luò)的人臉檢測(cè)(如圖1-4),該算法是對(duì)Viola-Jones方法的深度卷積神經(jīng)網(wǎng)絡(luò)實(shí)現(xiàn),將卷積神經(jīng)網(wǎng)絡(luò)作為級(jí)聯(lián)分類器中的基分類器,并利用多尺度特征圖融合來(lái)提升算法的精度。Zhang[11]等人提出了多任務(wù)級(jí)聯(lián)卷積網(wǎng)絡(luò),實(shí)現(xiàn)人臉檢測(cè)的同時(shí)完成人臉關(guān)鍵點(diǎn)定位,兩個(gè)任務(wù)能夠共享信息,人臉檢測(cè)協(xié)助關(guān)鍵點(diǎn)定位任務(wù)確定點(diǎn)的大致區(qū)域,關(guān)鍵點(diǎn)定位協(xié)助人臉檢測(cè)任務(wù)確定人-3-
哈爾濱工業(yè)大學(xué)工程碩士學(xué)位論文學(xué)習(xí)的檢測(cè)方法。圖1-2基于傳統(tǒng)圖像處理的人臉檢測(cè)方法[2]早期的人臉檢測(cè)方法基本上都是通過(guò)傳統(tǒng)圖像處理來(lái)實(shí)現(xiàn)的,其中最有影響力的便是Viola-Jones算法[2],具體做法是先通過(guò)滑動(dòng)窗口來(lái)得到候選框,然后通過(guò)一些人工設(shè)計(jì)的算子,如Haar-like算子[3]來(lái)提取候選框中圖像的特征,再用傳統(tǒng)的機(jī)器學(xué)習(xí)算法如SVM[4]進(jìn)行分類,最后利用級(jí)聯(lián)的分類器來(lái)進(jìn)一步提升分類器的準(zhǔn)確率。如圖1-2所示,先利用滑動(dòng)窗口來(lái)獲取候選框,然后提取候選框中圖像的特征并用級(jí)聯(lián)分類器來(lái)判斷是否是人臉,最后通過(guò)后處理來(lái)得到整個(gè)人臉的矩形區(qū)域。類似框架的算法還有很多[5–9],它們都是對(duì)級(jí)聯(lián)分類器結(jié)構(gòu)的改進(jìn),采用樹(shù)形級(jí)聯(lián)結(jié)構(gòu)或者更為復(fù)雜的級(jí)聯(lián)結(jié)構(gòu),如圖1-3所示。該類算法面臨著手動(dòng)提取特征的局限性,且利用滑動(dòng)窗口來(lái)獲取候選框的做法比較耗時(shí),在復(fù)雜場(chǎng)景下表現(xiàn)較差,魯棒性和性能不高是該類算法的主要問(wèn)題。a)并聯(lián)型[5]b)金字塔型[6]c)決策樹(shù)型I[7]d)決策樹(shù)型II[8]圖1-3級(jí)聯(lián)結(jié)構(gòu)隨著硬件計(jì)算力的巨大提升和海量數(shù)據(jù)獲取難度的降低,卷積神經(jīng)網(wǎng)絡(luò)的作用更加明顯;谏疃葘W(xué)習(xí)的人臉檢測(cè)方法可以分為三種:基于級(jí)聯(lián)卷積神經(jīng)網(wǎng)絡(luò)的人臉檢測(cè)方法、基于兩階段的人臉檢測(cè)方法、基于一階段的人臉檢測(cè)方法。Li[10]等人提出了基于級(jí)聯(lián)卷積神經(jīng)網(wǎng)絡(luò)的人臉檢測(cè)(如圖1-4),該算法是對(duì)Viola-Jones方法的深度卷積神經(jīng)網(wǎng)絡(luò)實(shí)現(xiàn),將卷積神經(jīng)網(wǎng)絡(luò)作為級(jí)聯(lián)分類器中的基分類器,并利用多尺度特征圖融合來(lái)提升算法的精度。Zhang[11]等人提出了多任務(wù)級(jí)聯(lián)卷積網(wǎng)絡(luò),實(shí)現(xiàn)人臉檢測(cè)的同時(shí)完成人臉關(guān)鍵點(diǎn)定位,兩個(gè)任務(wù)能夠共享信息,人臉檢測(cè)協(xié)助關(guān)鍵點(diǎn)定位任務(wù)確定點(diǎn)的大致區(qū)域,關(guān)鍵點(diǎn)定位協(xié)助人臉檢測(cè)任務(wù)確定人-3-
本文編號(hào):2931919
【文章來(lái)源】:哈爾濱工業(yè)大學(xué)黑龍江省 211工程院校 985工程院校
【文章頁(yè)數(shù)】:59 頁(yè)
【學(xué)位級(jí)別】:碩士
【部分圖文】:
人臉情緒識(shí)別流程圖
哈爾濱工業(yè)大學(xué)工程碩士學(xué)位論文學(xué)習(xí)的檢測(cè)方法。圖1-2基于傳統(tǒng)圖像處理的人臉檢測(cè)方法[2]早期的人臉檢測(cè)方法基本上都是通過(guò)傳統(tǒng)圖像處理來(lái)實(shí)現(xiàn)的,其中最有影響力的便是Viola-Jones算法[2],具體做法是先通過(guò)滑動(dòng)窗口來(lái)得到候選框,然后通過(guò)一些人工設(shè)計(jì)的算子,如Haar-like算子[3]來(lái)提取候選框中圖像的特征,再用傳統(tǒng)的機(jī)器學(xué)習(xí)算法如SVM[4]進(jìn)行分類,最后利用級(jí)聯(lián)的分類器來(lái)進(jìn)一步提升分類器的準(zhǔn)確率。如圖1-2所示,先利用滑動(dòng)窗口來(lái)獲取候選框,然后提取候選框中圖像的特征并用級(jí)聯(lián)分類器來(lái)判斷是否是人臉,最后通過(guò)后處理來(lái)得到整個(gè)人臉的矩形區(qū)域。類似框架的算法還有很多[5–9],它們都是對(duì)級(jí)聯(lián)分類器結(jié)構(gòu)的改進(jìn),采用樹(shù)形級(jí)聯(lián)結(jié)構(gòu)或者更為復(fù)雜的級(jí)聯(lián)結(jié)構(gòu),如圖1-3所示。該類算法面臨著手動(dòng)提取特征的局限性,且利用滑動(dòng)窗口來(lái)獲取候選框的做法比較耗時(shí),在復(fù)雜場(chǎng)景下表現(xiàn)較差,魯棒性和性能不高是該類算法的主要問(wèn)題。a)并聯(lián)型[5]b)金字塔型[6]c)決策樹(shù)型I[7]d)決策樹(shù)型II[8]圖1-3級(jí)聯(lián)結(jié)構(gòu)隨著硬件計(jì)算力的巨大提升和海量數(shù)據(jù)獲取難度的降低,卷積神經(jīng)網(wǎng)絡(luò)的作用更加明顯。基于深度學(xué)習(xí)的人臉檢測(cè)方法可以分為三種:基于級(jí)聯(lián)卷積神經(jīng)網(wǎng)絡(luò)的人臉檢測(cè)方法、基于兩階段的人臉檢測(cè)方法、基于一階段的人臉檢測(cè)方法。Li[10]等人提出了基于級(jí)聯(lián)卷積神經(jīng)網(wǎng)絡(luò)的人臉檢測(cè)(如圖1-4),該算法是對(duì)Viola-Jones方法的深度卷積神經(jīng)網(wǎng)絡(luò)實(shí)現(xiàn),將卷積神經(jīng)網(wǎng)絡(luò)作為級(jí)聯(lián)分類器中的基分類器,并利用多尺度特征圖融合來(lái)提升算法的精度。Zhang[11]等人提出了多任務(wù)級(jí)聯(lián)卷積網(wǎng)絡(luò),實(shí)現(xiàn)人臉檢測(cè)的同時(shí)完成人臉關(guān)鍵點(diǎn)定位,兩個(gè)任務(wù)能夠共享信息,人臉檢測(cè)協(xié)助關(guān)鍵點(diǎn)定位任務(wù)確定點(diǎn)的大致區(qū)域,關(guān)鍵點(diǎn)定位協(xié)助人臉檢測(cè)任務(wù)確定人-3-
哈爾濱工業(yè)大學(xué)工程碩士學(xué)位論文學(xué)習(xí)的檢測(cè)方法。圖1-2基于傳統(tǒng)圖像處理的人臉檢測(cè)方法[2]早期的人臉檢測(cè)方法基本上都是通過(guò)傳統(tǒng)圖像處理來(lái)實(shí)現(xiàn)的,其中最有影響力的便是Viola-Jones算法[2],具體做法是先通過(guò)滑動(dòng)窗口來(lái)得到候選框,然后通過(guò)一些人工設(shè)計(jì)的算子,如Haar-like算子[3]來(lái)提取候選框中圖像的特征,再用傳統(tǒng)的機(jī)器學(xué)習(xí)算法如SVM[4]進(jìn)行分類,最后利用級(jí)聯(lián)的分類器來(lái)進(jìn)一步提升分類器的準(zhǔn)確率。如圖1-2所示,先利用滑動(dòng)窗口來(lái)獲取候選框,然后提取候選框中圖像的特征并用級(jí)聯(lián)分類器來(lái)判斷是否是人臉,最后通過(guò)后處理來(lái)得到整個(gè)人臉的矩形區(qū)域。類似框架的算法還有很多[5–9],它們都是對(duì)級(jí)聯(lián)分類器結(jié)構(gòu)的改進(jìn),采用樹(shù)形級(jí)聯(lián)結(jié)構(gòu)或者更為復(fù)雜的級(jí)聯(lián)結(jié)構(gòu),如圖1-3所示。該類算法面臨著手動(dòng)提取特征的局限性,且利用滑動(dòng)窗口來(lái)獲取候選框的做法比較耗時(shí),在復(fù)雜場(chǎng)景下表現(xiàn)較差,魯棒性和性能不高是該類算法的主要問(wèn)題。a)并聯(lián)型[5]b)金字塔型[6]c)決策樹(shù)型I[7]d)決策樹(shù)型II[8]圖1-3級(jí)聯(lián)結(jié)構(gòu)隨著硬件計(jì)算力的巨大提升和海量數(shù)據(jù)獲取難度的降低,卷積神經(jīng)網(wǎng)絡(luò)的作用更加明顯;谏疃葘W(xué)習(xí)的人臉檢測(cè)方法可以分為三種:基于級(jí)聯(lián)卷積神經(jīng)網(wǎng)絡(luò)的人臉檢測(cè)方法、基于兩階段的人臉檢測(cè)方法、基于一階段的人臉檢測(cè)方法。Li[10]等人提出了基于級(jí)聯(lián)卷積神經(jīng)網(wǎng)絡(luò)的人臉檢測(cè)(如圖1-4),該算法是對(duì)Viola-Jones方法的深度卷積神經(jīng)網(wǎng)絡(luò)實(shí)現(xiàn),將卷積神經(jīng)網(wǎng)絡(luò)作為級(jí)聯(lián)分類器中的基分類器,并利用多尺度特征圖融合來(lái)提升算法的精度。Zhang[11]等人提出了多任務(wù)級(jí)聯(lián)卷積網(wǎng)絡(luò),實(shí)現(xiàn)人臉檢測(cè)的同時(shí)完成人臉關(guān)鍵點(diǎn)定位,兩個(gè)任務(wù)能夠共享信息,人臉檢測(cè)協(xié)助關(guān)鍵點(diǎn)定位任務(wù)確定點(diǎn)的大致區(qū)域,關(guān)鍵點(diǎn)定位協(xié)助人臉檢測(cè)任務(wù)確定人-3-
本文編號(hào):2931919
本文鏈接:http://sikaile.net/kejilunwen/zidonghuakongzhilunwen/2931919.html
最近更新
教材專著