基于局部幅值編碼的人臉表情識(shí)別
發(fā)布時(shí)間:2022-01-10 05:34
人臉表情是情感感知最直接的的載體和情感表達(dá)最明顯的方式。作為智能機(jī)器人,我們希望它們擁有友好的外表更希望他們具有像人一樣的情感感知能力和表達(dá)能力。雖然目前已經(jīng)出現(xiàn)了很多經(jīng)典有效的人臉表情識(shí)別算法,但對(duì)人臉表情識(shí)別的研究仍未進(jìn)入成熟階段。綜上,研究人臉表情識(shí)別算法對(duì)提高智能機(jī)器人的友好交互能力具有重要的理論意義和實(shí)用價(jià)值。本文主要從特征提取和分類識(shí)別兩方面進(jìn)行了探究和實(shí)驗(yàn),在經(jīng)典的局部紋理特征提取算法和局部幾何特征提取算法的基礎(chǔ)上進(jìn)行了改進(jìn),在分類識(shí)別的設(shè)計(jì)上將元輔助學(xué)習(xí)網(wǎng)絡(luò)和SVM進(jìn)行結(jié)合。具體工作如下:(1)本文第三章提出了一個(gè)新的特征描述符,即中心對(duì)稱局部符號(hào)幅值模式(CS-LSMP)。和傳統(tǒng)的特征提取算法局部二值模式(LBP)相比,CS-LSMP算子不僅考慮了局部區(qū)域的符號(hào)信息,而且考慮了局部差異的幅度信息,同時(shí)還大大地降低了特征維度。除此之外,為了降低單一特征提取算法的限制和更加充分的利用不同特征的優(yōu)勢(shì),分別提取方向幅值特征圖(OMFMs)、正負(fù)幅值特征圖(PNMFMs)和Gabor特征圖(GFMs)的CS-LSMP特征,然后將這些特征進(jìn)行級(jí)聯(lián)形成融合特征。OMFMs與梯度方向...
【文章來(lái)源】:合肥工業(yè)大學(xué)安徽省 211工程院校 教育部直屬院校
【文章頁(yè)數(shù)】:77 頁(yè)
【學(xué)位級(jí)別】:碩士
【部分圖文】:
JAFFE數(shù)據(jù)庫(kù)中一位受試者的7種表情圖像
第一章緒論集,但是卻包含了不同膚色、性別、年齡的差異。圖1.2展示了CK數(shù)據(jù)庫(kù)中一位志愿者的6種表情圖像。圖1.2CK數(shù)據(jù)庫(kù)中一位志愿者的6種表情圖像Fig1.2SixkindsofexpressionimagesofavolunteerintheCKdatabase(3)MMI(ManMachineInteraction)表情庫(kù)MMI面部表情數(shù)據(jù)庫(kù)是一個(gè)正在進(jìn)行的項(xiàng)目,旨在向面部表情分析社區(qū)提供大量面部表情的視覺(jué)數(shù)據(jù)。在自動(dòng)人類行為分析領(lǐng)域,阻礙其新的發(fā)展,尤其是在影響識(shí)別方面,的一個(gè)主要問(wèn)題是缺乏顯示行為和影響的數(shù)據(jù)庫(kù)。為了解決這個(gè)問(wèn)題,MMI面部表情數(shù)據(jù)庫(kù)于2002年被構(gòu)想為構(gòu)建和評(píng)估面部表情識(shí)別算法的資源。該面部表情數(shù)據(jù)庫(kù)中包含2900多個(gè)視頻和75個(gè)受試者的高分辨率靜態(tài)圖像,其中每個(gè)視頻序列包含了面部表情的完整時(shí)間模式的記錄,即從中性表情開(kāi)始變化到某種基本表情的峰值然后再逐漸恢復(fù)為中性表情結(jié)束。最近該庫(kù)中還增加了最近自然表情的錄音。由于該數(shù)據(jù)庫(kù)中參與者姿態(tài)、膚色、年齡差異較大,且部分參與者面部還含有遮擋物,如眼鏡等,因此在MMI數(shù)據(jù)庫(kù)上進(jìn)行表情識(shí)別存在挑戰(zhàn)性。圖1.3展示了MMI數(shù)據(jù)庫(kù)中一位參與者的6種表情圖像。圖1.3MMI數(shù)據(jù)庫(kù)中一位參與者的6種表情圖像Fig1.3SixkindsofexpressionimagesofaparticipantintheMMIdatabase(4)AFEW及SFEW數(shù)據(jù)庫(kù)AFEW(ActedFacialExpressionsintheWild)數(shù)據(jù)庫(kù)是一個(gè)動(dòng)態(tài)的貼近現(xiàn)實(shí)情況的面部表情數(shù)據(jù)庫(kù),該數(shù)據(jù)庫(kù)由電影中提取的接近真實(shí)世界環(huán)境的包含表情的視頻片段組成,它包含六類基本表情和中性表情。AFEW是在“聾人和聽(tīng)力障礙者的字幕”(SDH)和“隱藏式字幕”(CC)的基礎(chǔ)上收集的,目的是搜索與表情相關(guān)的內(nèi)容,并提取一些有代表意義的面部運(yùn)動(dòng)視頻片段所對(duì)應(yīng)的時(shí)間戳。該數(shù)據(jù)庫(kù)包含1~70歲的較大年齡段對(duì)象,并且剪輯的相
私餼穌飧鑫?題,MMI面部表情數(shù)據(jù)庫(kù)于2002年被構(gòu)想為構(gòu)建和評(píng)估面部表情識(shí)別算法的資源。該面部表情數(shù)據(jù)庫(kù)中包含2900多個(gè)視頻和75個(gè)受試者的高分辨率靜態(tài)圖像,其中每個(gè)視頻序列包含了面部表情的完整時(shí)間模式的記錄,即從中性表情開(kāi)始變化到某種基本表情的峰值然后再逐漸恢復(fù)為中性表情結(jié)束。最近該庫(kù)中還增加了最近自然表情的錄音。由于該數(shù)據(jù)庫(kù)中參與者姿態(tài)、膚色、年齡差異較大,且部分參與者面部還含有遮擋物,如眼鏡等,因此在MMI數(shù)據(jù)庫(kù)上進(jìn)行表情識(shí)別存在挑戰(zhàn)性。圖1.3展示了MMI數(shù)據(jù)庫(kù)中一位參與者的6種表情圖像。圖1.3MMI數(shù)據(jù)庫(kù)中一位參與者的6種表情圖像Fig1.3SixkindsofexpressionimagesofaparticipantintheMMIdatabase(4)AFEW及SFEW數(shù)據(jù)庫(kù)AFEW(ActedFacialExpressionsintheWild)數(shù)據(jù)庫(kù)是一個(gè)動(dòng)態(tài)的貼近現(xiàn)實(shí)情況的面部表情數(shù)據(jù)庫(kù),該數(shù)據(jù)庫(kù)由電影中提取的接近真實(shí)世界環(huán)境的包含表情的視頻片段組成,它包含六類基本表情和中性表情。AFEW是在“聾人和聽(tīng)力障礙者的字幕”(SDH)和“隱藏式字幕”(CC)的基礎(chǔ)上收集的,目的是搜索與表情相關(guān)的內(nèi)容,并提取一些有代表意義的面部運(yùn)動(dòng)視頻片段所對(duì)應(yīng)的時(shí)間戳。該數(shù)據(jù)庫(kù)包含1~70歲的較大年齡段對(duì)象,并且剪輯的相關(guān)信息如姓名、演員年齡、角色年齡、姿勢(shì)、性別、人物表情以及整個(gè)剪輯片段所代表的表情等都存儲(chǔ)在一個(gè)可擴(kuò)展的XML模式中。SFEW(StaticFacialExpressionintheWild)數(shù)據(jù)庫(kù)是從AFEW庫(kù)5
【參考文獻(xiàn)】:
期刊論文
[1]基于跨連接LeNet-5網(wǎng)絡(luò)的面部表情識(shí)別[J]. 李勇,林小竹,蔣夢(mèng)瑩. 自動(dòng)化學(xué)報(bào). 2018(01)
[2]基于梯度Gabor直方圖特征的表情識(shí)別方法[J]. 胡敏,朱弘,王曉華,許良鳳. 計(jì)算機(jī)輔助設(shè)計(jì)與圖形學(xué)學(xué)報(bào). 2013(12)
[3]人臉檢測(cè)研究綜述[J]. 梁路宏,艾海舟,徐光祐,張鈸. 計(jì)算機(jī)學(xué)報(bào). 2002(05)
碩士論文
[1]基于生成對(duì)抗網(wǎng)絡(luò)的人臉表情識(shí)別方法研究[D]. 余勝男.合肥工業(yè)大學(xué) 2019
[2]基于LBP特征與深度學(xué)習(xí)模型的人臉表情識(shí)別研究[D]. 蔡建峰.南昌大學(xué) 2016
本文編號(hào):3580145
【文章來(lái)源】:合肥工業(yè)大學(xué)安徽省 211工程院校 教育部直屬院校
【文章頁(yè)數(shù)】:77 頁(yè)
【學(xué)位級(jí)別】:碩士
【部分圖文】:
JAFFE數(shù)據(jù)庫(kù)中一位受試者的7種表情圖像
第一章緒論集,但是卻包含了不同膚色、性別、年齡的差異。圖1.2展示了CK數(shù)據(jù)庫(kù)中一位志愿者的6種表情圖像。圖1.2CK數(shù)據(jù)庫(kù)中一位志愿者的6種表情圖像Fig1.2SixkindsofexpressionimagesofavolunteerintheCKdatabase(3)MMI(ManMachineInteraction)表情庫(kù)MMI面部表情數(shù)據(jù)庫(kù)是一個(gè)正在進(jìn)行的項(xiàng)目,旨在向面部表情分析社區(qū)提供大量面部表情的視覺(jué)數(shù)據(jù)。在自動(dòng)人類行為分析領(lǐng)域,阻礙其新的發(fā)展,尤其是在影響識(shí)別方面,的一個(gè)主要問(wèn)題是缺乏顯示行為和影響的數(shù)據(jù)庫(kù)。為了解決這個(gè)問(wèn)題,MMI面部表情數(shù)據(jù)庫(kù)于2002年被構(gòu)想為構(gòu)建和評(píng)估面部表情識(shí)別算法的資源。該面部表情數(shù)據(jù)庫(kù)中包含2900多個(gè)視頻和75個(gè)受試者的高分辨率靜態(tài)圖像,其中每個(gè)視頻序列包含了面部表情的完整時(shí)間模式的記錄,即從中性表情開(kāi)始變化到某種基本表情的峰值然后再逐漸恢復(fù)為中性表情結(jié)束。最近該庫(kù)中還增加了最近自然表情的錄音。由于該數(shù)據(jù)庫(kù)中參與者姿態(tài)、膚色、年齡差異較大,且部分參與者面部還含有遮擋物,如眼鏡等,因此在MMI數(shù)據(jù)庫(kù)上進(jìn)行表情識(shí)別存在挑戰(zhàn)性。圖1.3展示了MMI數(shù)據(jù)庫(kù)中一位參與者的6種表情圖像。圖1.3MMI數(shù)據(jù)庫(kù)中一位參與者的6種表情圖像Fig1.3SixkindsofexpressionimagesofaparticipantintheMMIdatabase(4)AFEW及SFEW數(shù)據(jù)庫(kù)AFEW(ActedFacialExpressionsintheWild)數(shù)據(jù)庫(kù)是一個(gè)動(dòng)態(tài)的貼近現(xiàn)實(shí)情況的面部表情數(shù)據(jù)庫(kù),該數(shù)據(jù)庫(kù)由電影中提取的接近真實(shí)世界環(huán)境的包含表情的視頻片段組成,它包含六類基本表情和中性表情。AFEW是在“聾人和聽(tīng)力障礙者的字幕”(SDH)和“隱藏式字幕”(CC)的基礎(chǔ)上收集的,目的是搜索與表情相關(guān)的內(nèi)容,并提取一些有代表意義的面部運(yùn)動(dòng)視頻片段所對(duì)應(yīng)的時(shí)間戳。該數(shù)據(jù)庫(kù)包含1~70歲的較大年齡段對(duì)象,并且剪輯的相
私餼穌飧鑫?題,MMI面部表情數(shù)據(jù)庫(kù)于2002年被構(gòu)想為構(gòu)建和評(píng)估面部表情識(shí)別算法的資源。該面部表情數(shù)據(jù)庫(kù)中包含2900多個(gè)視頻和75個(gè)受試者的高分辨率靜態(tài)圖像,其中每個(gè)視頻序列包含了面部表情的完整時(shí)間模式的記錄,即從中性表情開(kāi)始變化到某種基本表情的峰值然后再逐漸恢復(fù)為中性表情結(jié)束。最近該庫(kù)中還增加了最近自然表情的錄音。由于該數(shù)據(jù)庫(kù)中參與者姿態(tài)、膚色、年齡差異較大,且部分參與者面部還含有遮擋物,如眼鏡等,因此在MMI數(shù)據(jù)庫(kù)上進(jìn)行表情識(shí)別存在挑戰(zhàn)性。圖1.3展示了MMI數(shù)據(jù)庫(kù)中一位參與者的6種表情圖像。圖1.3MMI數(shù)據(jù)庫(kù)中一位參與者的6種表情圖像Fig1.3SixkindsofexpressionimagesofaparticipantintheMMIdatabase(4)AFEW及SFEW數(shù)據(jù)庫(kù)AFEW(ActedFacialExpressionsintheWild)數(shù)據(jù)庫(kù)是一個(gè)動(dòng)態(tài)的貼近現(xiàn)實(shí)情況的面部表情數(shù)據(jù)庫(kù),該數(shù)據(jù)庫(kù)由電影中提取的接近真實(shí)世界環(huán)境的包含表情的視頻片段組成,它包含六類基本表情和中性表情。AFEW是在“聾人和聽(tīng)力障礙者的字幕”(SDH)和“隱藏式字幕”(CC)的基礎(chǔ)上收集的,目的是搜索與表情相關(guān)的內(nèi)容,并提取一些有代表意義的面部運(yùn)動(dòng)視頻片段所對(duì)應(yīng)的時(shí)間戳。該數(shù)據(jù)庫(kù)包含1~70歲的較大年齡段對(duì)象,并且剪輯的相關(guān)信息如姓名、演員年齡、角色年齡、姿勢(shì)、性別、人物表情以及整個(gè)剪輯片段所代表的表情等都存儲(chǔ)在一個(gè)可擴(kuò)展的XML模式中。SFEW(StaticFacialExpressionintheWild)數(shù)據(jù)庫(kù)是從AFEW庫(kù)5
【參考文獻(xiàn)】:
期刊論文
[1]基于跨連接LeNet-5網(wǎng)絡(luò)的面部表情識(shí)別[J]. 李勇,林小竹,蔣夢(mèng)瑩. 自動(dòng)化學(xué)報(bào). 2018(01)
[2]基于梯度Gabor直方圖特征的表情識(shí)別方法[J]. 胡敏,朱弘,王曉華,許良鳳. 計(jì)算機(jī)輔助設(shè)計(jì)與圖形學(xué)學(xué)報(bào). 2013(12)
[3]人臉檢測(cè)研究綜述[J]. 梁路宏,艾海舟,徐光祐,張鈸. 計(jì)算機(jī)學(xué)報(bào). 2002(05)
碩士論文
[1]基于生成對(duì)抗網(wǎng)絡(luò)的人臉表情識(shí)別方法研究[D]. 余勝男.合肥工業(yè)大學(xué) 2019
[2]基于LBP特征與深度學(xué)習(xí)模型的人臉表情識(shí)別研究[D]. 蔡建峰.南昌大學(xué) 2016
本文編號(hào):3580145
本文鏈接:http://sikaile.net/kejilunwen/shengwushengchang/3580145.html
最近更新
教材專著