基于身體動(dòng)作的情感識(shí)別研究
發(fā)布時(shí)間:2021-01-13 16:24
在人機(jī)交互日益密切的人工智能時(shí)代,希望機(jī)器能識(shí)別人類情感的需求越來越迫切,F(xiàn)階段的情感識(shí)別主要通過面部表情和語音信號(hào)實(shí)現(xiàn)。身體動(dòng)作作為肢體語言的重要組成部分,同樣蘊(yùn)含了豐富的情感信息。本課題以基于身體動(dòng)作的情感識(shí)別為研究內(nèi)容,設(shè)計(jì)并采集處理了兩個(gè)相關(guān)數(shù)據(jù)集,提出對(duì)應(yīng)算法,在數(shù)據(jù)集上實(shí)現(xiàn)了有效識(shí)別。本文的主要貢獻(xiàn)包括:第一,采集并處理了兩個(gè)大型、多視角,識(shí)別難度由易到難的身體動(dòng)作情感數(shù)據(jù)集,F(xiàn)階段基于身體動(dòng)作的情感識(shí)別公開數(shù)據(jù)集數(shù)量僅為個(gè)位數(shù),單個(gè)數(shù)據(jù)集樣本數(shù)量僅為千級(jí)。本課題的數(shù)據(jù)集極大豐富了該領(lǐng)域的研究數(shù)據(jù),十萬級(jí)別的樣本總數(shù)為深度學(xué)習(xí)在該領(lǐng)域的運(yùn)用創(chuàng)造了可能性。第二,針對(duì)識(shí)別較為容易的動(dòng)作對(duì)照組情感數(shù)據(jù)集,雖然該數(shù)據(jù)集的數(shù)據(jù)模態(tài)僅有RGB視頻,但是本課題開創(chuàng)性地使用人體姿態(tài)估計(jì)模型估計(jì)出骨架關(guān)節(jié)點(diǎn),同時(shí)利用身體動(dòng)作的RGB特征和骨架特征,實(shí)現(xiàn)情感識(shí)別。與該領(lǐng)域其他研究手工提取特征,使用傳統(tǒng)分類器識(shí)別不同,本課題的算法特征提取和情感識(shí)別均通過深度學(xué)習(xí)網(wǎng)絡(luò)實(shí)現(xiàn),識(shí)別效果較好。第三,針對(duì)識(shí)別較為困難的標(biāo)準(zhǔn)動(dòng)作情感數(shù)據(jù)集,本課題在之前研究的基礎(chǔ)上,實(shí)驗(yàn)分析得出骨架特征識(shí)別效果更好,并引入注...
【文章來源】:中國科學(xué)院大學(xué)(中國科學(xué)院深圳先進(jìn)技術(shù)研究院)廣東省
【文章頁數(shù)】:60 頁
【學(xué)位級(jí)別】:碩士
【部分圖文】:
Plutchik情感模型示意圖
第2章動(dòng)作對(duì)照組情感數(shù)據(jù)集介紹13度,可量化,可定量測量。情感具有維度的話,意味著如果情感空間建立的方法合適,可以將情感表示為坐標(biāo)空間基向量的線性組合。人類所有的情感將分布于連續(xù)的情感空間中,該空間的每一個(gè)坐標(biāo)軸代表情感的某種特定維度。不同的情感由于各維度所占的值不同,在情感空間的位置也不同。對(duì)于一維情感空間模型,心理學(xué)家Johnston將情感按照消極-積極程度在實(shí)數(shù)坐標(biāo)軸上排列,正半軸代表積極,負(fù)半軸代表消極,距離原點(diǎn)越遠(yuǎn)代表消極或者積極程度越高。一維情感空間模型,就是消極和積極的二分類模型。二維情感空間模型在一維情感空間模型的基礎(chǔ)上,增加了情感的強(qiáng)弱特性,作為第二個(gè)維度。Russell等人[54]基于提出了情感環(huán)狀模型,又名喚醒度-效價(jià)(arousal-valence)模型,如圖2.2所示。橫坐標(biāo)效價(jià)即一維模型的繼承,縱坐標(biāo)喚醒度也就是情感的強(qiáng)度。圖2.2喚醒度-效價(jià)情感模型示意圖1974年,Mehrabian[55]提出由愉悅度(Pleasure)、喚醒度(Arousal)和優(yōu)勢度(Dominance)三個(gè)維度構(gòu)成的PAD模型。其中,P代表愉悅度(Pleasure-displeasure),表示個(gè)體情感狀態(tài)的正負(fù)特性,包括情感的積極或消極兩個(gè)對(duì)立的狀態(tài),也就是一維模型的坐標(biāo);A代表喚醒度(Arousal-nonarousal),或者叫激活度。也就是二維模型相較于一維模型加入的維度—
基于身體動(dòng)作的情感識(shí)別研究14—情感強(qiáng)度。D代表優(yōu)勢度(Dominance-submissiveness),表示個(gè)體對(duì)情景和他人的控制狀態(tài)。D是三維模型相較于二維模型新加入的維度,是指個(gè)體對(duì)他人和外界環(huán)境的控制力和影響力,主要指個(gè)體對(duì)情感狀態(tài)的主觀控制程度,用以區(qū)分情感狀態(tài)是由個(gè)體主觀發(fā)出的還是受客觀環(huán)境影響產(chǎn)生的。圖2.3PAD三維情感模型示意圖2.1.2動(dòng)作對(duì)照組情感數(shù)據(jù)集的標(biāo)簽類型為實(shí)施可行且有效的實(shí)驗(yàn)研究,并參考1.2.1節(jié)中表1.1公開的基于身體動(dòng)作情感識(shí)別數(shù)據(jù)集的信息,本課題采用學(xué)術(shù)界廣泛應(yīng)用的,PaulEkman提出的六類基本情感:高興、憤怒、厭惡、恐懼、悲傷、驚訝,作為情感標(biāo)簽。需要指出的是,該課題的研究分為兩個(gè)階段進(jìn)行,采集的數(shù)據(jù)集也分為兩個(gè)部分。因?yàn)樯眢w動(dòng)作情感表達(dá)不如面部表情和語音信號(hào)明顯,且從身體運(yùn)動(dòng)中得出情感特征十分困難,第一階段采集的數(shù)據(jù)是六類基本情感和中性情感的動(dòng)作對(duì)照組。針對(duì)每一對(duì)照組,我們指定了動(dòng)作。例如,跳躍動(dòng)作,采集待識(shí)別對(duì)象中性跳躍和開心地跳躍兩個(gè)身體動(dòng)作,作為對(duì)照組,用于識(shí)別。每個(gè)對(duì)象的每個(gè)標(biāo)簽將會(huì)重復(fù)三次采集。動(dòng)作對(duì)照組情感數(shù)據(jù)集的標(biāo)簽類別示例如表2.1所示。包括高興、憤怒、
【參考文獻(xiàn)】:
期刊論文
[1]基于腦電信號(hào)的ILDB情感特征提取算法[J]. 時(shí)文飛,葉西寧. 華東理工大學(xué)學(xué)報(bào)(自然科學(xué)版). 2016(02)
本文編號(hào):2975186
【文章來源】:中國科學(xué)院大學(xué)(中國科學(xué)院深圳先進(jìn)技術(shù)研究院)廣東省
【文章頁數(shù)】:60 頁
【學(xué)位級(jí)別】:碩士
【部分圖文】:
Plutchik情感模型示意圖
第2章動(dòng)作對(duì)照組情感數(shù)據(jù)集介紹13度,可量化,可定量測量。情感具有維度的話,意味著如果情感空間建立的方法合適,可以將情感表示為坐標(biāo)空間基向量的線性組合。人類所有的情感將分布于連續(xù)的情感空間中,該空間的每一個(gè)坐標(biāo)軸代表情感的某種特定維度。不同的情感由于各維度所占的值不同,在情感空間的位置也不同。對(duì)于一維情感空間模型,心理學(xué)家Johnston將情感按照消極-積極程度在實(shí)數(shù)坐標(biāo)軸上排列,正半軸代表積極,負(fù)半軸代表消極,距離原點(diǎn)越遠(yuǎn)代表消極或者積極程度越高。一維情感空間模型,就是消極和積極的二分類模型。二維情感空間模型在一維情感空間模型的基礎(chǔ)上,增加了情感的強(qiáng)弱特性,作為第二個(gè)維度。Russell等人[54]基于提出了情感環(huán)狀模型,又名喚醒度-效價(jià)(arousal-valence)模型,如圖2.2所示。橫坐標(biāo)效價(jià)即一維模型的繼承,縱坐標(biāo)喚醒度也就是情感的強(qiáng)度。圖2.2喚醒度-效價(jià)情感模型示意圖1974年,Mehrabian[55]提出由愉悅度(Pleasure)、喚醒度(Arousal)和優(yōu)勢度(Dominance)三個(gè)維度構(gòu)成的PAD模型。其中,P代表愉悅度(Pleasure-displeasure),表示個(gè)體情感狀態(tài)的正負(fù)特性,包括情感的積極或消極兩個(gè)對(duì)立的狀態(tài),也就是一維模型的坐標(biāo);A代表喚醒度(Arousal-nonarousal),或者叫激活度。也就是二維模型相較于一維模型加入的維度—
基于身體動(dòng)作的情感識(shí)別研究14—情感強(qiáng)度。D代表優(yōu)勢度(Dominance-submissiveness),表示個(gè)體對(duì)情景和他人的控制狀態(tài)。D是三維模型相較于二維模型新加入的維度,是指個(gè)體對(duì)他人和外界環(huán)境的控制力和影響力,主要指個(gè)體對(duì)情感狀態(tài)的主觀控制程度,用以區(qū)分情感狀態(tài)是由個(gè)體主觀發(fā)出的還是受客觀環(huán)境影響產(chǎn)生的。圖2.3PAD三維情感模型示意圖2.1.2動(dòng)作對(duì)照組情感數(shù)據(jù)集的標(biāo)簽類型為實(shí)施可行且有效的實(shí)驗(yàn)研究,并參考1.2.1節(jié)中表1.1公開的基于身體動(dòng)作情感識(shí)別數(shù)據(jù)集的信息,本課題采用學(xué)術(shù)界廣泛應(yīng)用的,PaulEkman提出的六類基本情感:高興、憤怒、厭惡、恐懼、悲傷、驚訝,作為情感標(biāo)簽。需要指出的是,該課題的研究分為兩個(gè)階段進(jìn)行,采集的數(shù)據(jù)集也分為兩個(gè)部分。因?yàn)樯眢w動(dòng)作情感表達(dá)不如面部表情和語音信號(hào)明顯,且從身體運(yùn)動(dòng)中得出情感特征十分困難,第一階段采集的數(shù)據(jù)是六類基本情感和中性情感的動(dòng)作對(duì)照組。針對(duì)每一對(duì)照組,我們指定了動(dòng)作。例如,跳躍動(dòng)作,采集待識(shí)別對(duì)象中性跳躍和開心地跳躍兩個(gè)身體動(dòng)作,作為對(duì)照組,用于識(shí)別。每個(gè)對(duì)象的每個(gè)標(biāo)簽將會(huì)重復(fù)三次采集。動(dòng)作對(duì)照組情感數(shù)據(jù)集的標(biāo)簽類別示例如表2.1所示。包括高興、憤怒、
【參考文獻(xiàn)】:
期刊論文
[1]基于腦電信號(hào)的ILDB情感特征提取算法[J]. 時(shí)文飛,葉西寧. 華東理工大學(xué)學(xué)報(bào)(自然科學(xué)版). 2016(02)
本文編號(hào):2975186
本文鏈接:http://sikaile.net/kejilunwen/zidonghuakongzhilunwen/2975186.html
最近更新
教材專著