基于LSTM神經網(wǎng)絡的語音情緒識別
發(fā)布時間:2024-05-23 03:08
隨著人工智能的發(fā)展,人機交互技術在不斷進步,為使人機交互更加友好,情緒識別技術被廣泛關注。情緒是一個人內心的感觸的體現(xiàn),可以體現(xiàn)在面部、語音、脈搏等多方面。實驗室環(huán)境中的語音識別技術取得了較好的效果,而現(xiàn)實場景的語言情緒識別技術仍不成熟,使用基于現(xiàn)實場景的CHEAVD2.0情感數(shù)據(jù)庫進行實驗。在對音頻信息進行預處理后,進行音頻特征的提取,提取了梅爾倒譜系數(shù)、短時過零率、基音周期和頻率等特征。為抓取音頻數(shù)據(jù)在時間維上的關聯(lián)性,使用長短時記憶網(wǎng)絡的方法進行情緒識別分類任務。
【文章頁數(shù)】:3 頁
【文章目錄】:
1 語音情感特征提取
1.1 語音信號預處理
1.2 語音特征提取
(1)短時過零率
(2)短時能量
2 基于LSTM的情感分類方法
2.1 循環(huán)神經網(wǎng)絡
2.2 長短時記憶神經網(wǎng)絡
3 實驗分析
3.1 情感數(shù)據(jù)庫
3.2網(wǎng)絡模型訓練及結果分析
4 結束語
本文編號:3980913
【文章頁數(shù)】:3 頁
【文章目錄】:
1 語音情感特征提取
1.1 語音信號預處理
1.2 語音特征提取
(1)短時過零率
(2)短時能量
2 基于LSTM的情感分類方法
2.1 循環(huán)神經網(wǎng)絡
2.2 長短時記憶神經網(wǎng)絡
3 實驗分析
3.1 情感數(shù)據(jù)庫
3.2網(wǎng)絡模型訓練及結果分析
4 結束語
本文編號:3980913
本文鏈接:http://sikaile.net/kejilunwen/wltx/3980913.html
最近更新
教材專著