語(yǔ)音情感識(shí)別及在人機(jī)對(duì)話(huà)系統(tǒng)中的應(yīng)用研究
發(fā)布時(shí)間:2023-08-20 09:40
隨著人機(jī)交互的逐漸發(fā)展,語(yǔ)音作為快速、直接的交流方式,使機(jī)器理解語(yǔ)音交互過(guò)程中的情感變得更加迫切。由于語(yǔ)言差異、記錄語(yǔ)音的環(huán)境不同、語(yǔ)音有效情感特征的不確定性和語(yǔ)音存在的噪音等導(dǎo)致富情感的語(yǔ)音特征缺乏有效的提取影響了語(yǔ)音情感識(shí)別的效率和有效性;跈C(jī)器學(xué)習(xí)的語(yǔ)音情感識(shí)別方法,只能提取特定的特征集作為模型的輸入;谏疃葘W(xué)習(xí)的語(yǔ)音情感識(shí)別可以避免上述特征工程,并自動(dòng)提取語(yǔ)音特征,但這些大量的語(yǔ)音特征會(huì)使模型的識(shí)別效率降低,富情感的語(yǔ)音特征得不到有效的提取。本文旨在對(duì)特定特征的提取和融合,并基于深度學(xué)習(xí)算法,研究具有較強(qiáng)泛化能力、高效的語(yǔ)音情感識(shí)別方法,并將語(yǔ)音情感識(shí)別應(yīng)用于人機(jī)對(duì)話(huà)系統(tǒng)。在語(yǔ)音情感識(shí)別中,有效提取富情感的語(yǔ)音特征是情感識(shí)別成功的關(guān)鍵。本文提出互補(bǔ)特征提取方法,并對(duì)該方法的有效性進(jìn)行驗(yàn)證。在語(yǔ)料庫(kù)方面,語(yǔ)料庫(kù)是驗(yàn)證方法可靠性的重要元素,本文基于兩種常用語(yǔ)料庫(kù)和一種較新的語(yǔ)料庫(kù)進(jìn)行模型的訓(xùn)練與驗(yàn)證。在情感識(shí)別算法方面,高效的分類(lèi)模型算法決定了語(yǔ)音情感識(shí)別方法是否有效。本文結(jié)合三種語(yǔ)音情感識(shí)別語(yǔ)料庫(kù),完成特征提取后,將其作為深度學(xué)習(xí)識(shí)別模型的輸入。深度學(xué)習(xí)模型采用了高效的卷積神...
【文章頁(yè)數(shù)】:90 頁(yè)
【學(xué)位級(jí)別】:碩士
【文章目錄】:
摘要
abstract
第一章 緒論
1.1 研究工作的背景與意義
1.2 研究現(xiàn)狀
1.2.1 語(yǔ)音情感識(shí)別的研究現(xiàn)狀
1.2.2 人機(jī)對(duì)話(huà)的研究現(xiàn)狀
1.2.3 語(yǔ)音情感識(shí)別在人機(jī)對(duì)話(huà)系統(tǒng)中的應(yīng)用
1.3 本文研究?jī)?nèi)容
1.4 本文組織結(jié)構(gòu)
1.5 本章小結(jié)
第二章 語(yǔ)音情感識(shí)別概述
2.1 引言
2.2 語(yǔ)音情感識(shí)別語(yǔ)料庫(kù)
2.2.1 人類(lèi)語(yǔ)音情感數(shù)據(jù)庫(kù)
2.2.2 常用語(yǔ)音情感識(shí)別語(yǔ)料庫(kù)
2.3 語(yǔ)音情感特征
2.3.1 頻譜特征
2.3.2 韻律特征
2.3.3 非線(xiàn)性特征
2.3.4 其他特征
2.4 語(yǔ)音情感識(shí)別方法
2.5 本章小結(jié)
第三章 特征提取方法研究
3.1 引言
3.2 快速傅里葉變換
3.3 短時(shí)傅里葉變換
3.4 特征提取
3.4.1 MFCC特征
3.4.2 Melspectrogram特征
3.4.3 Chroma特征
3.4.4 Tonal Centroid特征
3.4.5 Spectral contrast特征
3.5 互補(bǔ)特征
3.6 本章小結(jié)
第四章 基于1D CNN的語(yǔ)音情感識(shí)別
4.1 引言
4.2 計(jì)算結(jié)果指標(biāo)
4.3 語(yǔ)音情感實(shí)驗(yàn)數(shù)據(jù)集
4.4 語(yǔ)音情感識(shí)別架構(gòu)
4.4.1 架構(gòu)相關(guān)介紹
4.4.2 NACNN方法實(shí)驗(yàn)
4.4.3 NACNN+LogMels方法實(shí)驗(yàn)
4.4.4 NACNN+LogMels*方法實(shí)驗(yàn)
4.5 實(shí)驗(yàn)總結(jié)
4.6 本章小結(jié)
第五章 ECM人機(jī)對(duì)話(huà)
5.1 引言
5.2 任務(wù)定義及概覽
5.3 編碼解碼框架
5.3.1 SeqToSeq模型
5.3.2 Gated Recurrent Unit
5.4 情感分類(lèi)嵌入
5.5 內(nèi)外部記憶
5.6 本章小結(jié)
第六章 語(yǔ)音情感識(shí)別在人機(jī)對(duì)話(huà)系統(tǒng)中的應(yīng)用
6.1 引言
6.2 需求分析
6.2.1 功能需求
6.2.2 系統(tǒng)開(kāi)發(fā)環(huán)境
6.3 系統(tǒng)設(shè)計(jì)
6.4 實(shí)現(xiàn)與展示
6.4.1 功能展示
6.5 本章小結(jié)
第七章 總結(jié)與展望
7.1 論文總結(jié)
7.2 工作展望
致謝
參考文獻(xiàn)
攻碩期間取得的成果
本文編號(hào):3842970
【文章頁(yè)數(shù)】:90 頁(yè)
【學(xué)位級(jí)別】:碩士
【文章目錄】:
摘要
abstract
第一章 緒論
1.1 研究工作的背景與意義
1.2 研究現(xiàn)狀
1.2.1 語(yǔ)音情感識(shí)別的研究現(xiàn)狀
1.2.2 人機(jī)對(duì)話(huà)的研究現(xiàn)狀
1.2.3 語(yǔ)音情感識(shí)別在人機(jī)對(duì)話(huà)系統(tǒng)中的應(yīng)用
1.3 本文研究?jī)?nèi)容
1.4 本文組織結(jié)構(gòu)
1.5 本章小結(jié)
第二章 語(yǔ)音情感識(shí)別概述
2.1 引言
2.2 語(yǔ)音情感識(shí)別語(yǔ)料庫(kù)
2.2.1 人類(lèi)語(yǔ)音情感數(shù)據(jù)庫(kù)
2.2.2 常用語(yǔ)音情感識(shí)別語(yǔ)料庫(kù)
2.3 語(yǔ)音情感特征
2.3.1 頻譜特征
2.3.2 韻律特征
2.3.3 非線(xiàn)性特征
2.3.4 其他特征
2.4 語(yǔ)音情感識(shí)別方法
2.5 本章小結(jié)
第三章 特征提取方法研究
3.1 引言
3.2 快速傅里葉變換
3.3 短時(shí)傅里葉變換
3.4 特征提取
3.4.1 MFCC特征
3.4.2 Melspectrogram特征
3.4.3 Chroma特征
3.4.4 Tonal Centroid特征
3.4.5 Spectral contrast特征
3.5 互補(bǔ)特征
3.6 本章小結(jié)
第四章 基于1D CNN的語(yǔ)音情感識(shí)別
4.1 引言
4.2 計(jì)算結(jié)果指標(biāo)
4.3 語(yǔ)音情感實(shí)驗(yàn)數(shù)據(jù)集
4.4 語(yǔ)音情感識(shí)別架構(gòu)
4.4.1 架構(gòu)相關(guān)介紹
4.4.2 NACNN方法實(shí)驗(yàn)
4.4.3 NACNN+LogMels方法實(shí)驗(yàn)
4.4.4 NACNN+LogMels*方法實(shí)驗(yàn)
4.5 實(shí)驗(yàn)總結(jié)
4.6 本章小結(jié)
第五章 ECM人機(jī)對(duì)話(huà)
5.1 引言
5.2 任務(wù)定義及概覽
5.3 編碼解碼框架
5.3.1 SeqToSeq模型
5.3.2 Gated Recurrent Unit
5.4 情感分類(lèi)嵌入
5.5 內(nèi)外部記憶
5.6 本章小結(jié)
第六章 語(yǔ)音情感識(shí)別在人機(jī)對(duì)話(huà)系統(tǒng)中的應(yīng)用
6.1 引言
6.2 需求分析
6.2.1 功能需求
6.2.2 系統(tǒng)開(kāi)發(fā)環(huán)境
6.3 系統(tǒng)設(shè)計(jì)
6.4 實(shí)現(xiàn)與展示
6.4.1 功能展示
6.5 本章小結(jié)
第七章 總結(jié)與展望
7.1 論文總結(jié)
7.2 工作展望
致謝
參考文獻(xiàn)
攻碩期間取得的成果
本文編號(hào):3842970
本文鏈接:http://sikaile.net/kejilunwen/xinxigongchenglunwen/3842970.html
最近更新
教材專(zhuān)著