天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當前位置:主頁 > 科技論文 > 信息工程論文 >

基于ANN和GMM融合的語音情感識別方法的研究

發(fā)布時間:2017-06-25 09:17

  本文關(guān)鍵詞:基于ANN和GMM融合的語音情感識別方法的研究,由筆耕文化傳播整理發(fā)布。


【摘要】:人機交互是人與計算機之間使用某種對話語言,以一定的交互方式,為完成確定任務(wù)的人與計算機之間的信息交換過程,是計算機智能的重要體現(xiàn),同時也可以讓計算機更好的為人類服務(wù)。語音情感識別對發(fā)展人機交互來說至關(guān)重要。目前,語音情感識別的研究是一門綜合認知科學、生理學、心理學、語言學、計算機科學等多學科的熱點研究課題,正越來越受到國內(nèi)外科研機構(gòu)和研究人員的重視。本文主要圍繞人工神經(jīng)網(wǎng)絡(luò)和高斯混合模型展開語音情感識別的研究,在原有結(jié)構(gòu)模型的基礎(chǔ)上從算法層面入手提出改進的方法,以期提高相關(guān)模型的識別精度和識別效率,并在文章最后提出了一種高斯混合模型和神經(jīng)網(wǎng)絡(luò)混合的語音情感識別模型。本論文的主要研究內(nèi)容和創(chuàng)新點如下:(1)闡述了語音情感識別的研究背景與意義,總結(jié)了當前國內(nèi)外的研究現(xiàn)狀,并對當前有待深入研究和亟待解決的理論和技術(shù)問題進行了說明。(2)概述了與情感相關(guān)的一些基礎(chǔ)知識,包括情感的定義與情感的分類。設(shè)計并錄制了漢語語音情感數(shù)據(jù)庫,該庫包含高興、憤怒、驚訝、悲傷等四種基本情感,且全部語音樣本都經(jīng)過有效性檢驗以確保數(shù)據(jù)符合規(guī)范。完成了語音情感識別過程中需要進行的預(yù)處理工作,簡述了本文所用到的情感特征參數(shù)的提取方式以及情感特征向量的歸一化方法。(3)研究了基于Elman神經(jīng)網(wǎng)絡(luò)的語音情感識別,并運用萬有引力搜索算法(Gravitational Search Algorithm, GSA)以Elman網(wǎng)絡(luò)進行優(yōu)化,算法的核心思想是運用萬有引力定律通過位置尋優(yōu)來不斷更新網(wǎng)絡(luò)的權(quán)值參數(shù),最終實現(xiàn)網(wǎng)絡(luò)的最優(yōu)化。(4)介紹了高斯混合模型(GMM)的EM優(yōu)化算法,并分析了傳統(tǒng)EM算法的缺點。由此本文研究了一種基于改進的GMM算法的語音情感識別方法,該算法通過設(shè)定一個初始GMM模型,運用迭代方式不斷修正M值和GMM網(wǎng)絡(luò)的參數(shù),直至得到最終的GMM模型。(5)研究了GMM和深度信念網(wǎng)絡(luò)融合的語音情感識別方法。在受限玻爾茲曼機(Restricted Boltzmann Machines, RBM)模型基礎(chǔ)上構(gòu)建深度信念網(wǎng)絡(luò)(Deep Belief Network, DBN),最后提出了一種多維GMM輸出與深度信念神經(jīng)網(wǎng)絡(luò)相融合的方法實現(xiàn)語音情感識別。
【關(guān)鍵詞】:語音情感識別 埃爾曼遞歸神經(jīng)網(wǎng)絡(luò) 萬有引力算法 高斯混合模型 深度信念網(wǎng)絡(luò)
【學位授予單位】:東南大學
【學位級別】:碩士
【學位授予年份】:2016
【分類號】:TN912.34
【目錄】:
  • 摘要5-6
  • Abstract6-9
  • 第一章 緒論9-13
  • 1.1 研究背景及其意義9-10
  • 1.2 語音情感識別的研究現(xiàn)狀10
  • 1.3 語音情感識別關(guān)鍵技術(shù)問題10-12
  • 1.3.1 語音情感數(shù)據(jù)庫問題11
  • 1.3.2 情感特征參數(shù)的提取11-12
  • 1.3.3 高效、穩(wěn)定的情感識別算法12
  • 1.4 本文的研究內(nèi)容與文章結(jié)構(gòu)12-13
  • 第二章 語音情感識別基礎(chǔ)13-27
  • 2.1 情感的基礎(chǔ)知識13-15
  • 2.1.1 情感的定義13
  • 2.1.2 情感的分類13-15
  • 2.2 漢語語音情感數(shù)據(jù)庫的建立15-18
  • 2.2.1 表演型情感語音16
  • 2.2.2 引導(dǎo)型情感語音16-17
  • 2.2.3 自然型情感語音17
  • 2.2.4 漢語語音情感數(shù)據(jù)庫的建立17-18
  • 2.3 語音情感信號的預(yù)處理18-20
  • 2.3.1 預(yù)加重18
  • 2.3.2 分幀加窗18-20
  • 2.3.3 端點檢測20
  • 2.4 語音情感特征的提取與計算20-26
  • 2.4.1 短時能量和短時平均幅度20-21
  • 2.4.2 短時過零率21
  • 2.4.3 語速21-22
  • 2.4.4 基音頻率22
  • 2.4.5 共振峰22-23
  • 2.4.6 梅爾頻率倒譜系數(shù)23-26
  • 2.5 語音情感特征歸一化26
  • 2.6 本章小結(jié)26-27
  • 第三章 神經(jīng)網(wǎng)絡(luò)理論與基于遞歸神經(jīng)網(wǎng)絡(luò)的語音情感識別27-43
  • 3.1 傳統(tǒng)人工神經(jīng)網(wǎng)絡(luò)基本理論27-33
  • 3.1.1 神經(jīng)網(wǎng)絡(luò)概念27-28
  • 3.1.2 人工神經(jīng)網(wǎng)絡(luò)的分類28-29
  • 3.1.3 人工神經(jīng)網(wǎng)絡(luò)的學習算法29-33
  • 3.2 遞歸神經(jīng)網(wǎng)絡(luò)33-37
  • 3.2.1 遞歸神經(jīng)網(wǎng)絡(luò)的多種結(jié)構(gòu)模型33-35
  • 3.2.2 Elman遞歸神經(jīng)網(wǎng)絡(luò)35-36
  • 3.2.3 Elman神經(jīng)網(wǎng)絡(luò)的BP學習算法36-37
  • 3.3 基于萬有引力搜索算法的Elman模型優(yōu)化37-40
  • 3.3.1 萬有引力搜索算法37-39
  • 3.3.2 Elman模型的萬有引力優(yōu)化方法39-40
  • 3.4 情感識別實驗與實驗結(jié)果分析40-41
  • 3.4.1 情感實驗特征參數(shù)的設(shè)置40
  • 3.4.2 情感實驗中網(wǎng)路訓(xùn)練相關(guān)參數(shù)設(shè)置40
  • 3.4.3 情感實驗結(jié)果與分析40-41
  • 3.5 本章小結(jié)41-43
  • 第四章 基于改進GMM的語音情感識別43-53
  • 4.1 傳統(tǒng)GMM模型概述43-48
  • 4.1.1 GMM模型43-44
  • 4.1.2 GMM的EM算法44-47
  • 4.1.3 GMM模型建立流程47-48
  • 4.2 改進的GMM48-51
  • 4.2.1 有限混合模型的無監(jiān)督學習算法48-49
  • 4.2.2 改進的GMM算法49-51
  • 4.3 情感識別實驗與實驗結(jié)果分析51-52
  • 4.4 本章小結(jié)52-53
  • 第五章 基于深度神經(jīng)網(wǎng)絡(luò)與GMM融合的語音情感識別53-63
  • 5.1 深度學習神經(jīng)網(wǎng)絡(luò)基本理論53-58
  • 5.1.1 深度神經(jīng)網(wǎng)絡(luò)的訓(xùn)練過程53
  • 5.1.2 深度學習常用模型結(jié)構(gòu)53-58
  • 5.2 基于深度神經(jīng)網(wǎng)絡(luò)與GMM融合的情感識別58-61
  • 5.2.1 softmax分類器58
  • 5.2.2 基于廣義線性判別優(yōu)化算法的深度神經(jīng)網(wǎng)絡(luò)58-60
  • 5.2.3 基于深度神經(jīng)網(wǎng)絡(luò)與GMM融合的語音情感識別60-61
  • 5.3 情感識別實驗與實驗結(jié)果分析61-62
  • 5.4 本章小結(jié)62-63
  • 第六章 總結(jié)與展望63-65
  • 致謝65-67
  • 參考文獻67-70

【參考文獻】

中國期刊全文數(shù)據(jù)庫 前8條

1 李春龍;戴娟;潘豐;;引力搜索算法中粒子記憶性改進的研究[J];計算機應(yīng)用;2012年10期

2 張永皋;馬青玉;孫青;;基于MFCC和CHMM技術(shù)的語音情感分析及其在教育中的應(yīng)用研究[J];南京師范大學學報(工程技術(shù)版);2009年02期

3 姜曉慶;崔世耀;殷艷華;;人機語音交互中的情感語音處理[J];濟南大學學報(自然科學版);2008年04期

4 孫亞;;遠程教學中語音情感識別系統(tǒng)的研究與實現(xiàn)[J];長春理工大學學報(高教版);2008年02期

5 劉明輝;戴蓓劏;解焱陸;;基于GMM多維概率輸出的SVM話者確認[J];模式識別與人工智能;2008年01期

6 余伶俐;蔡自興;陳明義;;語音信號的情感特征分析與識別研究綜述[J];電路與系統(tǒng)學報;2007年04期

7 谷學靜,石志國,王志良;基于BDI Agent技術(shù)的情感機器人語音識別技術(shù)研究[J];計算機應(yīng)用研究;2003年04期

8 馮天瑾,陳哲,熊建設(shè);多層感知器網(wǎng)絡(luò)內(nèi)部判決模式的研究[J];數(shù)據(jù)采集與處理;2000年04期

中國碩士學位論文全文數(shù)據(jù)庫 前1條

1 韓文靜;基于神經(jīng)網(wǎng)絡(luò)的語音情感識別技術(shù)研究[D];哈爾濱工業(yè)大學;2007年


  本文關(guān)鍵詞:基于ANN和GMM融合的語音情感識別方法的研究,,由筆耕文化傳播整理發(fā)布。



本文編號:481609

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/xinxigongchenglunwen/481609.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶48e10***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com