基于深度學(xué)習(xí)的多模態(tài)老人情感識別方法研究
發(fā)布時間:2021-01-28 10:46
為了讓計算機具有理解、識別、讀懂和表達人類情感的能力,情感計算技術(shù)開始被深入研究,使得人類與計算機可以實現(xiàn)相互理解、高效互動?墒侨祟愂且粋復(fù)雜的群體,人類表達情感有著多種載體,包括表情、語音、生理信號、身體姿態(tài)等等,通過對多種模態(tài)的情感識別研究,可以幫助計算機更好地理解人類,創(chuàng)建更輕松的人機交互環(huán)境。本文從建立多模態(tài)老年人情感數(shù)據(jù)庫、語音情感特征的提取和識別以及人臉表情特征的提取和情感識別等方面展開研究。其主要研究工作及成果總結(jié)如下:1.從情感研究的現(xiàn)狀中,可以發(fā)現(xiàn)以老年人為對象的情感研究還不夠充分,同時國內(nèi)外研究者們建立的情感數(shù)據(jù)庫中,情感表達對象幾乎是年輕人,而且模態(tài)單一。針對這個問題,本文在名為《空巢姥爺》的電視連續(xù)劇上構(gòu)建了視頻情感數(shù)據(jù)庫、語音情感語料庫和人臉表情圖像庫,并闡述了多模態(tài)情感庫的構(gòu)建方法和過程。實驗結(jié)果表明,構(gòu)建多模態(tài)老人情感數(shù)據(jù)庫是合理的和有效的。2.在自建的多模態(tài)情感數(shù)據(jù)庫的基礎(chǔ)上,采用自編碼神經(jīng)網(wǎng)絡(luò)進行特征降維,并選擇支持向量機作為分類器,進行語音情感識別研究。本文分別提取傅里葉系數(shù)特征(Fourier parameter,FP)、動態(tài)特征(一階差分和二階...
【文章來源】:安徽建筑大學(xué)安徽省
【文章頁數(shù)】:66 頁
【學(xué)位級別】:碩士
【部分圖文】:
空巢姥爺語料庫的情感分布
這樣后續(xù)程序再去處理分析降明顯提高了工作效率,并且運行后的從宏觀意義上說,特征降維就是要防有監(jiān)督信息,降維算法可以劃分為監(jiān)分分析)[48]、LPP(局部保留投影)[49]和而 LDA(線性判別分析)[51]和 MMC(文中,我們使用無監(jiān)督型降維方法—維,以更精煉的形式保存特征信息。構(gòu)出原始的特征,它們能有效地找出效的方式來表示樣本數(shù)據(jù)。eep Learning)思想的自編碼神經(jīng)網(wǎng)絡(luò)數(shù)據(jù)盡可能來重構(gòu)輸入數(shù)據(jù)。
位論文 第三章 語音特別率結(jié)果和表 3-2 混淆矩陣中看到的那樣,它而言,分析認為不平衡的數(shù)據(jù)分布會導(dǎo)致問如表 3-3 所示。表 3-3 每種情感的樣本數(shù)量 1 2 3 4 5 6 123 103 17 32 80 100 能是 106,數(shù)據(jù)分布不均。考慮到相對較小的充分的理由相信它是最終擾亂實驗結(jié)果的主用方法是采樣,包括過采樣,欠采樣,過采樣。圖 3-2 顯示了采樣后的數(shù)據(jù)重新分配。
【參考文獻】:
期刊論文
[1]基于稀疏自動編碼器的深度神經(jīng)網(wǎng)絡(luò)實現(xiàn)[J]. 張光建. 現(xiàn)代計算機(專業(yè)版). 2017(35)
[2]一種基于小波包主成分分析的語音情感識別方法[J]. 朱宗寶,王坤俠,肖玲玲,劉文靜. 安徽建筑大學(xué)學(xué)報. 2017(05)
[3]中國人口老齡化形勢與養(yǎng)老服務(wù)的發(fā)展[J]. 杜鵬. 人口與計劃生育. 2015(07)
[4]深度學(xué)習(xí)理論及其在語音識別領(lǐng)域的應(yīng)用[J]. 楊俊安,王一,劉輝,李晉徽,陸俊. 通信對抗. 2014(03)
[5]基于表情和語音的多模態(tài)情感識別研究[J]. 王蓓,王曉蘭. 信息化研究. 2014(01)
[6]一種新的基于MMC和LSE的監(jiān)督流形學(xué)習(xí)算法[J]. 袁暋,程雷,朱然剛,雷迎科. 自動化學(xué)報. 2013(12)
[7]語音情感識別研究進展綜述[J]. 韓文靜,李海峰,阮華斌,馬琳. 軟件學(xué)報. 2014(01)
[8]表情和姿態(tài)的雙模態(tài)情感識別[J]. 閆靜杰,鄭文明,辛明海,邱偉. 中國圖象圖形學(xué)報. 2013(09)
[9]基于改進的快速稀疏編碼的圖像特征提取[J]. 尚麗,蘇品剛,周燕. 計算機應(yīng)用. 2013(03)
[10]人類情緒的外周自主反應(yīng)與中樞神經(jīng)機制的整合——情緒信息加工腦功能網(wǎng)絡(luò)模型的初步構(gòu)想[J]. 蔡厚德. 南京師大學(xué)報(社會科學(xué)版). 2012(04)
博士論文
[1]語音情感識別方法研究[D]. 王坤俠.合肥工業(yè)大學(xué) 2015
[2]基于語音和人臉的情感識別研究[D]. 張石清.電子科技大學(xué) 2012
[3]情感計算關(guān)鍵技術(shù)研究[D]. 于冬梅.東華大學(xué) 2009
[4]決策神經(jīng)網(wǎng)絡(luò)模型及應(yīng)用研究[D]. 南晉華.華中科技大學(xué) 2008
[5]人臉表情識別中若干關(guān)鍵技術(shù)的研究[D]. 何良華.東南大學(xué) 2005
碩士論文
[1]基于PAD三維情感模型的情感語音研究[D]. 張婷.太原理工大學(xué) 2018
[2]基于語音和面部表情融合的情緒識別算法研究及其實現(xiàn)[D]. 王喆.北方工業(yè)大學(xué) 2018
[3]基于卷積神經(jīng)網(wǎng)絡(luò)的圖像識別算法研究[D]. 張榮磊.山東理工大學(xué) 2017
[4]基于深度學(xué)習(xí)的手寫數(shù)字集特征提取算法[D]. 任沙.湖南師范大學(xué) 2016
[5]基于深度學(xué)習(xí)的圖像目標定位識別研究[D]. 程欣.電子科技大學(xué) 2016
[6]基于自編碼神經(jīng)網(wǎng)絡(luò)文本特征選擇的研究[D]. 李時峰.天津科技大學(xué) 2016
[7]基于語音信息的多特征情緒識別算法研究[D]. 丁倩.山東大學(xué) 2015
[8]基于條件神經(jīng)域的語音情感識別研究[D]. 李瓊.天津師范大學(xué) 2014
[9]基于PCA與LDA的表情識別算法研究[D]. 趙春偉.西安電子科技大學(xué) 2014
[10]人臉面部表情的情感識別研究[D]. 陳鑫.天津大學(xué) 2014
本文編號:3004860
【文章來源】:安徽建筑大學(xué)安徽省
【文章頁數(shù)】:66 頁
【學(xué)位級別】:碩士
【部分圖文】:
空巢姥爺語料庫的情感分布
這樣后續(xù)程序再去處理分析降明顯提高了工作效率,并且運行后的從宏觀意義上說,特征降維就是要防有監(jiān)督信息,降維算法可以劃分為監(jiān)分分析)[48]、LPP(局部保留投影)[49]和而 LDA(線性判別分析)[51]和 MMC(文中,我們使用無監(jiān)督型降維方法—維,以更精煉的形式保存特征信息。構(gòu)出原始的特征,它們能有效地找出效的方式來表示樣本數(shù)據(jù)。eep Learning)思想的自編碼神經(jīng)網(wǎng)絡(luò)數(shù)據(jù)盡可能來重構(gòu)輸入數(shù)據(jù)。
位論文 第三章 語音特別率結(jié)果和表 3-2 混淆矩陣中看到的那樣,它而言,分析認為不平衡的數(shù)據(jù)分布會導(dǎo)致問如表 3-3 所示。表 3-3 每種情感的樣本數(shù)量 1 2 3 4 5 6 123 103 17 32 80 100 能是 106,數(shù)據(jù)分布不均。考慮到相對較小的充分的理由相信它是最終擾亂實驗結(jié)果的主用方法是采樣,包括過采樣,欠采樣,過采樣。圖 3-2 顯示了采樣后的數(shù)據(jù)重新分配。
【參考文獻】:
期刊論文
[1]基于稀疏自動編碼器的深度神經(jīng)網(wǎng)絡(luò)實現(xiàn)[J]. 張光建. 現(xiàn)代計算機(專業(yè)版). 2017(35)
[2]一種基于小波包主成分分析的語音情感識別方法[J]. 朱宗寶,王坤俠,肖玲玲,劉文靜. 安徽建筑大學(xué)學(xué)報. 2017(05)
[3]中國人口老齡化形勢與養(yǎng)老服務(wù)的發(fā)展[J]. 杜鵬. 人口與計劃生育. 2015(07)
[4]深度學(xué)習(xí)理論及其在語音識別領(lǐng)域的應(yīng)用[J]. 楊俊安,王一,劉輝,李晉徽,陸俊. 通信對抗. 2014(03)
[5]基于表情和語音的多模態(tài)情感識別研究[J]. 王蓓,王曉蘭. 信息化研究. 2014(01)
[6]一種新的基于MMC和LSE的監(jiān)督流形學(xué)習(xí)算法[J]. 袁暋,程雷,朱然剛,雷迎科. 自動化學(xué)報. 2013(12)
[7]語音情感識別研究進展綜述[J]. 韓文靜,李海峰,阮華斌,馬琳. 軟件學(xué)報. 2014(01)
[8]表情和姿態(tài)的雙模態(tài)情感識別[J]. 閆靜杰,鄭文明,辛明海,邱偉. 中國圖象圖形學(xué)報. 2013(09)
[9]基于改進的快速稀疏編碼的圖像特征提取[J]. 尚麗,蘇品剛,周燕. 計算機應(yīng)用. 2013(03)
[10]人類情緒的外周自主反應(yīng)與中樞神經(jīng)機制的整合——情緒信息加工腦功能網(wǎng)絡(luò)模型的初步構(gòu)想[J]. 蔡厚德. 南京師大學(xué)報(社會科學(xué)版). 2012(04)
博士論文
[1]語音情感識別方法研究[D]. 王坤俠.合肥工業(yè)大學(xué) 2015
[2]基于語音和人臉的情感識別研究[D]. 張石清.電子科技大學(xué) 2012
[3]情感計算關(guān)鍵技術(shù)研究[D]. 于冬梅.東華大學(xué) 2009
[4]決策神經(jīng)網(wǎng)絡(luò)模型及應(yīng)用研究[D]. 南晉華.華中科技大學(xué) 2008
[5]人臉表情識別中若干關(guān)鍵技術(shù)的研究[D]. 何良華.東南大學(xué) 2005
碩士論文
[1]基于PAD三維情感模型的情感語音研究[D]. 張婷.太原理工大學(xué) 2018
[2]基于語音和面部表情融合的情緒識別算法研究及其實現(xiàn)[D]. 王喆.北方工業(yè)大學(xué) 2018
[3]基于卷積神經(jīng)網(wǎng)絡(luò)的圖像識別算法研究[D]. 張榮磊.山東理工大學(xué) 2017
[4]基于深度學(xué)習(xí)的手寫數(shù)字集特征提取算法[D]. 任沙.湖南師范大學(xué) 2016
[5]基于深度學(xué)習(xí)的圖像目標定位識別研究[D]. 程欣.電子科技大學(xué) 2016
[6]基于自編碼神經(jīng)網(wǎng)絡(luò)文本特征選擇的研究[D]. 李時峰.天津科技大學(xué) 2016
[7]基于語音信息的多特征情緒識別算法研究[D]. 丁倩.山東大學(xué) 2015
[8]基于條件神經(jīng)域的語音情感識別研究[D]. 李瓊.天津師范大學(xué) 2014
[9]基于PCA與LDA的表情識別算法研究[D]. 趙春偉.西安電子科技大學(xué) 2014
[10]人臉面部表情的情感識別研究[D]. 陳鑫.天津大學(xué) 2014
本文編號:3004860
本文鏈接:http://sikaile.net/kejilunwen/zidonghuakongzhilunwen/3004860.html
最近更新
教材專著