基于音韻表征的語音情感識別改進研究
發(fā)布時間:2023-03-05 04:53
語音是人機交互最自然、最便捷的方式之一,蘊含著說話人的情感狀態(tài)。語音情感識別是實現(xiàn)更加自然、更加智能的人機交互的關(guān)鍵技術(shù)之一。提高語音情感識別率主要依賴于兩個因素:分類器和特征的選擇。關(guān)于特征選擇,目前為止,大多數(shù)研究只使用超大規(guī)模聲學特征集進行分類,然而,這些特征集并不能反映情感與韻律之間的關(guān)系,如語調(diào)、節(jié)奏、重音等等,也不能揭示特定情感的韻律表達模式。該研究的目的:(1)利用音韻表征并使用深度學習的方法提高語音情感識別率;(2)分析與情感關(guān)系密切的音韻表征,探索韻律和特定情感之間的關(guān)系,得到特定情感的韻律表達模式。該研究實驗分兩部分:(1)基于IEMOCAP數(shù)據(jù)庫,利用音韻表征并使用深度學習算法,分別進行基于整句和基于聚類單詞的語音情感識別,提高語音情感識別率;(2)使用邏輯斯蒂回歸和皮爾遜相關(guān)系數(shù)探索音韻表征、聲學特征與特定情感的關(guān)系,尋找具有區(qū)分性的特征。實驗結(jié)果表明:(1)在基于整句話的語音情感識別實驗中,將聲學特征和音韻表征結(jié)合起來,基于卷積神經(jīng)網(wǎng)絡(luò)的分類器在四分類離散情感分類任務(wù)上識別率最高,UAR(unweighted average recall)為60.02%,超過...
【文章頁數(shù)】:68 頁
【學位級別】:碩士
【文章目錄】:
摘要
ABSTRACT
第1章 引言
1.1 研究背景與意義
1.1.1 語音情感識別是實現(xiàn)人機交互的一個關(guān)鍵技術(shù)
1.1.2 語音情感識別技術(shù)在教育中的應(yīng)用
1.1.3 韻律對語音情感識別的影響
1.2 研究問題的提出
1.2.1 已有研究存在的問題
1.2.2 研究目的
1.2.3 研究問題
1.2.4 研究方法
1.2.5 研究意義
1.3 該研究的創(chuàng)新之處
1.4 本文的章節(jié)結(jié)構(gòu)
第2章 文獻綜述
2.1 概念界定
2.1.1 情感的定義
2.1.2 音韻表征的定義
2.2 研究現(xiàn)狀分析
2.2.1 情感描述模型
2.2.2 語音情感數(shù)據(jù)庫
2.2.3 語音情感聲學特征
2.2.4 語音情感音韻表征
2.2.5 語音情感分類算法
第3章 語音情感特征提取與分析
3.1 IEMOCAP英語情感數(shù)據(jù)集
3.2 數(shù)據(jù)預(yù)處理
3.2.1 預(yù)加重
3.2.2 加窗分幀
3.2.3 端點檢測
3.3 特征提取
3.3.1 聲學特征
3.3.2 音韻表征
3.3.2 特征向量預(yù)處理
3.4 語音情感特征分析
3.4.1 分析工具:邏輯斯蒂回歸模型和皮爾遜相關(guān)系數(shù)
3.4.2 實驗方法和過程
3.4.3 聲學特征和音韻表征分析結(jié)果
第4章 基于音韻表征的語音情感識別改進實驗——以整句為單位
4.1 已有方法和不足
4.2 該實驗提出的方法
4.2.1 聲學特征與音韻表征的融合
4.2.2 卷積神經(jīng)網(wǎng)絡(luò)
4.3 實驗?zāi)康?br> 4.4 實驗過程
4.4.1 訓(xùn)練框架和評價指標
4.4.2 基線系統(tǒng)
4.4.3 超參數(shù)設(shè)置
4.5 實驗結(jié)果和討論
第5章 基于音韻表征的語音情感識別改進實驗——以單詞為單位
5.1 已有方法和不足
5.2 該實驗提出的方法
5.2.1 基于單詞聚類和詞嵌入的單詞向量
5.2.2 循環(huán)神經(jīng)網(wǎng)絡(luò)
5.3 實驗?zāi)康?br> 5.4 實驗過程
5.4.1 訓(xùn)練框架和評價指標
5.4.2 基線系統(tǒng)
5.4.3 超參數(shù)設(shè)置
5.5 實驗結(jié)果和討論
第6章 總結(jié)與展望
6.1 討論與總結(jié)
6.2 不足與展望
參考文獻
致謝
在讀期間發(fā)表的學術(shù)論文及研究成果
本文編號:3755744
【文章頁數(shù)】:68 頁
【學位級別】:碩士
【文章目錄】:
摘要
ABSTRACT
第1章 引言
1.1 研究背景與意義
1.1.1 語音情感識別是實現(xiàn)人機交互的一個關(guān)鍵技術(shù)
1.1.2 語音情感識別技術(shù)在教育中的應(yīng)用
1.1.3 韻律對語音情感識別的影響
1.2 研究問題的提出
1.2.1 已有研究存在的問題
1.2.2 研究目的
1.2.3 研究問題
1.2.4 研究方法
1.2.5 研究意義
1.3 該研究的創(chuàng)新之處
1.4 本文的章節(jié)結(jié)構(gòu)
第2章 文獻綜述
2.1 概念界定
2.1.1 情感的定義
2.1.2 音韻表征的定義
2.2 研究現(xiàn)狀分析
2.2.1 情感描述模型
2.2.2 語音情感數(shù)據(jù)庫
2.2.3 語音情感聲學特征
2.2.4 語音情感音韻表征
2.2.5 語音情感分類算法
第3章 語音情感特征提取與分析
3.1 IEMOCAP英語情感數(shù)據(jù)集
3.2 數(shù)據(jù)預(yù)處理
3.2.1 預(yù)加重
3.2.2 加窗分幀
3.2.3 端點檢測
3.3 特征提取
3.3.1 聲學特征
3.3.2 音韻表征
3.3.2 特征向量預(yù)處理
3.4 語音情感特征分析
3.4.1 分析工具:邏輯斯蒂回歸模型和皮爾遜相關(guān)系數(shù)
3.4.2 實驗方法和過程
3.4.3 聲學特征和音韻表征分析結(jié)果
第4章 基于音韻表征的語音情感識別改進實驗——以整句為單位
4.1 已有方法和不足
4.2 該實驗提出的方法
4.2.1 聲學特征與音韻表征的融合
4.2.2 卷積神經(jīng)網(wǎng)絡(luò)
4.3 實驗?zāi)康?br> 4.4 實驗過程
4.4.1 訓(xùn)練框架和評價指標
4.4.2 基線系統(tǒng)
4.4.3 超參數(shù)設(shè)置
4.5 實驗結(jié)果和討論
第5章 基于音韻表征的語音情感識別改進實驗——以單詞為單位
5.1 已有方法和不足
5.2 該實驗提出的方法
5.2.1 基于單詞聚類和詞嵌入的單詞向量
5.2.2 循環(huán)神經(jīng)網(wǎng)絡(luò)
5.3 實驗?zāi)康?br> 5.4 實驗過程
5.4.1 訓(xùn)練框架和評價指標
5.4.2 基線系統(tǒng)
5.4.3 超參數(shù)設(shè)置
5.5 實驗結(jié)果和討論
第6章 總結(jié)與展望
6.1 討論與總結(jié)
6.2 不足與展望
參考文獻
致謝
在讀期間發(fā)表的學術(shù)論文及研究成果
本文編號:3755744
本文鏈接:http://sikaile.net/jiaoyulunwen/jykj/3755744.html
最近更新
教材專著