基于LSTM神經網絡的語音情緒識別
發(fā)布時間:2024-05-23 03:08
隨著人工智能的發(fā)展,人機交互技術在不斷進步,為使人機交互更加友好,情緒識別技術被廣泛關注。情緒是一個人內心的感觸的體現,可以體現在面部、語音、脈搏等多方面。實驗室環(huán)境中的語音識別技術取得了較好的效果,而現實場景的語言情緒識別技術仍不成熟,使用基于現實場景的CHEAVD2.0情感數據庫進行實驗。在對音頻信息進行預處理后,進行音頻特征的提取,提取了梅爾倒譜系數、短時過零率、基音周期和頻率等特征。為抓取音頻數據在時間維上的關聯性,使用長短時記憶網絡的方法進行情緒識別分類任務。
【文章頁數】:3 頁
【文章目錄】:
1 語音情感特征提取
1.1 語音信號預處理
1.2 語音特征提取
(1)短時過零率
(2)短時能量
2 基于LSTM的情感分類方法
2.1 循環(huán)神經網絡
2.2 長短時記憶神經網絡
3 實驗分析
3.1 情感數據庫
3.2網絡模型訓練及結果分析
4 結束語
本文編號:3980913
【文章頁數】:3 頁
【文章目錄】:
1 語音情感特征提取
1.1 語音信號預處理
1.2 語音特征提取
(1)短時過零率
(2)短時能量
2 基于LSTM的情感分類方法
2.1 循環(huán)神經網絡
2.2 長短時記憶神經網絡
3 實驗分析
3.1 情感數據庫
3.2網絡模型訓練及結果分析
4 結束語
本文編號:3980913
本文鏈接:http://sikaile.net/kejilunwen/wltx/3980913.html