結合語譜圖和神經(jīng)網(wǎng)絡的語音情感識別
發(fā)布時間:2023-10-02 03:37
語音作為人們?nèi)粘=涣髯钪匾姆绞街?其中蘊含了大量的跟情感相關的信息。隨著近年來人工智能的發(fā)展以及技術研究的深入,使得人機交互成為了當今的研究熱點,讓機器具備跟人一樣能識別和表達情感的能力成為研究者們的目標,語音情感識別的重要性也日益凸顯出來。語音情感識別是語音處理領域富有挑戰(zhàn)性的課題之一,它的應用非常廣泛,因此,這項研究具有重要的理論意義和應用前景。目前,在語音特征提取方面,大多數(shù)研究者選擇的是韻律特征、音質(zhì)特征或者是基于譜的特征,而把時域和頻域結合在一起的研究則相對較少。而語譜圖具有把時域信息和頻域信息結合在一起的特點,它本身就包含了大量跟語音相關的信息,因此本文選用語譜圖來提取語音情感特征。本文的主要研究工作如下:1)闡述了語音情感識別的研究背景和意義,對語音情感識別的研究歷史和現(xiàn)狀做了簡單的歸納總結,研究情感分類的模型、常用的語音情感數(shù)據(jù)庫。2)對語音情感數(shù)據(jù)的預處理能夠提高分析精確度,本文對語音的預處理包括預加重、分幀加窗和端點檢測,經(jīng)過預處理之后,提取出語音信號的基音頻率、短時能量、短時過零率、共振峰和梅爾倒譜系數(shù)等參數(shù)組成情感特征矢量。3)在簡單研究人工神經(jīng)網(wǎng)絡的發(fā)展、...
【文章頁數(shù)】:69 頁
【學位級別】:碩士
【文章目錄】:
摘要
Abstract
第1章 緒論
1.1 語音情感識別的研究背景和意義
1.2 研究歷史與現(xiàn)狀
1.3 本文的研究內(nèi)容與結構安排
第2章 語音情感識別的基礎
2.1 情感分類的描述模型
2.1.1 離散情感論
2.1.2 維度情感論
2.2 語音情感數(shù)據(jù)庫
2.2.1 離散情感數(shù)據(jù)庫
2.2.2 維度情感數(shù)據(jù)庫
2.3 語音情感信號預處理
2.3.1 預加重
2.3.2 分幀加窗
2.3.3 端點檢測
2.4 聲學特征提取
2.4.1 語速
2.4.2 基頻
2.4.3 短時能量和短時平均幅值
2.4.4 短時平均過零率
2.4.5 共振峰
2.4.6 梅爾倒譜系數(shù)
2.5 本章小結
第3章 人工神經(jīng)網(wǎng)絡
3.1 概述及發(fā)展
3.2 神經(jīng)網(wǎng)絡模型
3.3 BP神經(jīng)網(wǎng)絡
3.3.1 BP網(wǎng)絡模型
3.3.2 BP學習算法
3.3.3 改進的BP算法
3.3.4 實驗
3.4 本章小結
第4章 卷積神經(jīng)網(wǎng)絡
4.1 基本概念
4.2 卷積神經(jīng)網(wǎng)絡原理
4.2.1 局部連接
4.2.2 權值共享
4.2.3 卷積層和池化層
4.3 基于卷積神經(jīng)網(wǎng)絡的語音情感識別
4.3.1 語譜圖的處理
4.3.2 CNN網(wǎng)絡基本結構
4.3.3 分類器的選擇
4.4 實驗及結果分析
4.4.1 網(wǎng)絡訓練次數(shù)對實驗結果的影響
4.4.2 選擇不同分類器的對比實驗
4.4.3 在不同環(huán)境下的對比實驗
4.4.4 在不同的信噪比下的對比實驗
4.5 本章小結
第5章 總結與展望
5.1 總結
5.2 展望
參考文獻
致謝
附錄A 個人簡歷
附錄B 攻讀碩士學位期間完成的主要工作
本文編號:3850020
【文章頁數(shù)】:69 頁
【學位級別】:碩士
【文章目錄】:
摘要
Abstract
第1章 緒論
1.1 語音情感識別的研究背景和意義
1.2 研究歷史與現(xiàn)狀
1.3 本文的研究內(nèi)容與結構安排
第2章 語音情感識別的基礎
2.1 情感分類的描述模型
2.1.1 離散情感論
2.1.2 維度情感論
2.2 語音情感數(shù)據(jù)庫
2.2.1 離散情感數(shù)據(jù)庫
2.2.2 維度情感數(shù)據(jù)庫
2.3 語音情感信號預處理
2.3.1 預加重
2.3.2 分幀加窗
2.3.3 端點檢測
2.4 聲學特征提取
2.4.1 語速
2.4.2 基頻
2.4.3 短時能量和短時平均幅值
2.4.4 短時平均過零率
2.4.5 共振峰
2.4.6 梅爾倒譜系數(shù)
2.5 本章小結
第3章 人工神經(jīng)網(wǎng)絡
3.1 概述及發(fā)展
3.2 神經(jīng)網(wǎng)絡模型
3.3 BP神經(jīng)網(wǎng)絡
3.3.1 BP網(wǎng)絡模型
3.3.2 BP學習算法
3.3.3 改進的BP算法
3.3.4 實驗
3.4 本章小結
第4章 卷積神經(jīng)網(wǎng)絡
4.1 基本概念
4.2 卷積神經(jīng)網(wǎng)絡原理
4.2.1 局部連接
4.2.2 權值共享
4.2.3 卷積層和池化層
4.3 基于卷積神經(jīng)網(wǎng)絡的語音情感識別
4.3.1 語譜圖的處理
4.3.2 CNN網(wǎng)絡基本結構
4.3.3 分類器的選擇
4.4 實驗及結果分析
4.4.1 網(wǎng)絡訓練次數(shù)對實驗結果的影響
4.4.2 選擇不同分類器的對比實驗
4.4.3 在不同環(huán)境下的對比實驗
4.4.4 在不同的信噪比下的對比實驗
4.5 本章小結
第5章 總結與展望
5.1 總結
5.2 展望
參考文獻
致謝
附錄A 個人簡歷
附錄B 攻讀碩士學位期間完成的主要工作
本文編號:3850020
本文鏈接:http://sikaile.net/kejilunwen/wltx/3850020.html
最近更新
教材專著