基于HMM和人工神經(jīng)網(wǎng)絡混合模型的漢語語音情感識別
發(fā)布時間:2017-04-21 15:05
本文關鍵詞:基于HMM和人工神經(jīng)網(wǎng)絡混合模型的漢語語音情感識別,,由筆耕文化傳播整理發(fā)布。
【摘要】:隨著人機交互技術的發(fā)展,語音的情感識別已經(jīng)逐漸成為模式識別領域研究的熱點之一。隨著研究的不斷深入,當單獨使用HMM和人工神經(jīng)網(wǎng)絡來對語音情感狀態(tài)進行分類識別時,效果并不是很理想。本文將HMM和人工神經(jīng)網(wǎng)絡兩種算法進行融合,取長補短,形成新的混合模型,進而提高系統(tǒng)的識別率。該識別技術在服務機器人、語音自動應答系統(tǒng)等方面具有應用價值。本文對語音情感識別的發(fā)展現(xiàn)狀進行了分析,對漢語語音情感識別的問題進行了深入的研究。首先,針對目前漢語語音情感識別在建立漢語語音情感數(shù)據(jù)庫時存在很多困難的問題,對語音情感的基礎理論以及建立漢語語音情感數(shù)據(jù)庫的原則進行了詳細的闡述。然后,為了減少語音信號本身對識別效果的影響,提出了基于GA-SVM的語音端點檢測方法并對漢語語音的情感特征進行了統(tǒng)計分析,形成了一個30維的特征向量。針對目前單一的HMM和人工神經(jīng)網(wǎng)絡模型存在的缺陷,提出了將HMM和人工神經(jīng)網(wǎng)絡混合模型應用于漢語語音情感狀態(tài)的分類識別。該模型首先由HMM產(chǎn)生情感語音信號的最佳狀態(tài)序列,然后利用時間規(guī)整算法對同一狀態(tài)的特征參數(shù)進行規(guī)整得到等維的特征向量,并將它作為人工神經(jīng)網(wǎng)絡的輸入進行語音情感狀態(tài)識別。該算法充分利用了HMM極強的動態(tài)時序建模能力以及人工神經(jīng)網(wǎng)絡強大的分類能力。最后,以Matlab2012a為工作平臺進行編程仿真。實現(xiàn)了HMM和人工神經(jīng)網(wǎng)絡兩種模型的結(jié)合。并將混合模型分別與HMM和人工神經(jīng)網(wǎng)絡模型進行對比。實驗結(jié)果表明,HMM和人工神經(jīng)網(wǎng)絡混合模型提高了漢語語音情感識別系統(tǒng)的識別準確率。此外,混合模型在不同信噪比的條件下也體現(xiàn)出了它的優(yōu)勢。
【關鍵詞】:HMM 人工神經(jīng)網(wǎng)絡 漢語語音情感識別 語音端點檢測 情感特征 HMM和人工神經(jīng)網(wǎng)絡混合模型
【學位授予單位】:湖南師范大學
【學位級別】:碩士
【學位授予年份】:2015
【分類號】:TP183;TN912.34
【目錄】:
- 摘要4-6
- Abstract6-12
- 1 緒論12-17
- 1.1 研究背景12
- 1.2 語音情感識別的研究現(xiàn)狀12-14
- 1.2.1 國際研究現(xiàn)狀13
- 1.2.2 國內(nèi)研究現(xiàn)狀13-14
- 1.3 語音情感識別的應用前景14-15
- 1.4 本文的研究內(nèi)容與結(jié)構(gòu)15-17
- 1.4.1 論文的主要研究內(nèi)容15-16
- 1.4.2 論文的結(jié)構(gòu)安排16-17
- 2 語音情感理論基礎17-24
- 2.1 語音情感的定義17
- 2.2 語音情感的分類17-20
- 2.2.1 基本情感論和調(diào)色板情感論18-19
- 2.2.2 情感維度空間論19-20
- 2.3 情感語音數(shù)據(jù)庫20-23
- 2.3.1 建立情感語音數(shù)據(jù)庫的原則21-22
- 2.3.2 典型的情感語音數(shù)據(jù)庫22-23
- 2.3.3 本文的普通話情感語音數(shù)據(jù)庫23
- 2.4 本章小結(jié)23-24
- 3 語音信號的處理24-38
- 3.1 語音信號的預處理24
- 3.2 基于GA-SVM的端點檢測方法24-31
- 3.2.1 端點檢測的特征向量26
- 3.2.2 SVM分類器算法26-28
- 3.2.3 遺傳算法優(yōu)化SVM參數(shù)28-31
- 3.2.4 語音端點檢測ki驟31
- 3.3 語音情感特征分析31-37
- 3.3.1 短時能量32-33
- 3.3.2 梅爾頻率倒譜系數(shù)33
- 3.3.3 基因頻率33-35
- 3.3.4 共振峰35-36
- 3.3.5 語音情感識別的特征向量36-37
- 3.4 本章小結(jié)37-38
- 4 HMM和人工神經(jīng)網(wǎng)絡混合模型的設計38-53
- 4.1 隱馬爾可夫模型38-43
- 4.1.1 HMM的定義38-39
- 4.1.2 HMM模型的基本算法39-42
- 4.1.3 HMM模型的優(yōu)缺點42-43
- 4.2 人工神經(jīng)網(wǎng)絡43-46
- 4.2.1 人工神經(jīng)網(wǎng)絡的概述43-44
- 4.2.2 概率神經(jīng)網(wǎng)絡44-46
- 4.2.3 概率神經(jīng)網(wǎng)絡的優(yōu)缺點46
- 4.3 HMM和人工神經(jīng)網(wǎng)絡的混合模型46-47
- 4.3.1 HMM和人工神經(jīng)網(wǎng)絡結(jié)合的理論依據(jù)46
- 4.3.2 HMM和人工神經(jīng)網(wǎng)絡混合模型的結(jié)合方式46-47
- 4.4 HMM和人工神經(jīng)網(wǎng)絡混合模型的實現(xiàn)47-51
- 4.4.1 HMM和人工神經(jīng)網(wǎng)絡混合模型的結(jié)構(gòu)47-48
- 4.4.2 HMM和人工神經(jīng)網(wǎng)絡混合模型的訓練48-50
- 4.4.3 HMM和人工神經(jīng)網(wǎng)絡混合模型的識別50-51
- 4.5 本章小結(jié)51-53
- 5 仿真實驗和結(jié)果分析53-60
- 5.1 仿真環(huán)境與數(shù)據(jù)來源53
- 5.2 端點檢測53-55
- 5.2.1 遺傳算法搜索SVM最優(yōu)參數(shù)實驗53-54
- 5.2.2 語音端點檢測實驗54-55
- 5.3 情感語音信號的特征提取55-57
- 5.4 系統(tǒng)性能評估57-59
- 5.4.1 識別率的比較57-58
- 5.4.2 算法速度比較58
- 5.4.3 噪聲環(huán)境下系統(tǒng)的性能58-59
- 5.5 本章小結(jié)59-60
- 6 總結(jié)與展望60-62
- 6.1 總結(jié)60
- 6.2 展望60-62
- 參考文獻62-67
- 附錄67-68
- 致謝68
【參考文獻】
中國期刊全文數(shù)據(jù)庫 前4條
1 王艷芬,于洪珍,劉衛(wèi)東,鄭曉紅;基于時域自相關平方函數(shù)的基音周期估計[J];計算機工程與應用;2004年31期
2 李書玲;劉蓉;張鎏欽;劉紅;;基于改進型SVM算法的語音情感識別[J];計算機應用;2013年07期
3 汪海燕;黎建輝;楊風雷;;支持向量機理論及算法研究綜述[J];計算機應用研究;2014年05期
4 趙力;黃程韋;;實用語音情感識別中的若干關鍵技術[J];數(shù)據(jù)采集與處理;2014年02期
中國碩士學位論文全文數(shù)據(jù)庫 前1條
1 王明;基于神經(jīng)網(wǎng)絡的語音識別技術研究與實現(xiàn)[D];電子科技大學;2012年
本文關鍵詞:基于HMM和人工神經(jīng)網(wǎng)絡混合模型的漢語語音情感識別,由筆耕文化傳播整理發(fā)布。
本文編號:320583
本文鏈接:http://sikaile.net/kejilunwen/wltx/320583.html
最近更新
教材專著