天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

基于深度神經(jīng)網(wǎng)絡(luò)的RASR語(yǔ)音識(shí)別的研究

發(fā)布時(shí)間:2017-06-08 01:18

  本文關(guān)鍵詞:基于深度神經(jīng)網(wǎng)絡(luò)的RASR語(yǔ)音識(shí)別的研究,,由筆耕文化傳播整理發(fā)布。


【摘要】:目前有關(guān)語(yǔ)言和語(yǔ)音處理的公共可用的開(kāi)源軟件越來(lái)越多,而大多數(shù)的語(yǔ)音識(shí)別系統(tǒng)僅僅處理封閉的詞匯表。但對(duì)于處理無(wú)限制語(yǔ)音輸入的應(yīng)用程序來(lái)說(shuō),即使再大的詞匯表也無(wú)法覆蓋所有的詞匯。德國(guó)亞琛工業(yè)大學(xué)開(kāi)發(fā)的開(kāi)源語(yǔ)音識(shí)別工具(RWTH ASR,簡(jiǎn)稱RASR),可將詞匯表中的詞單元組合起來(lái)合并成一個(gè)新詞,從而在識(shí)別處理過(guò)程中識(shí)別外來(lái)詞匯,完成大詞匯量連續(xù)語(yǔ)音識(shí)別。本文除了回顧語(yǔ)音識(shí)別相關(guān)理論背景之外,更重要的是通過(guò)RASR工具中的聲學(xué)模型和解碼器開(kāi)發(fā)識(shí)別大詞匯量語(yǔ)音系統(tǒng)。通過(guò)配置相應(yīng)參數(shù)完成語(yǔ)音信號(hào)分析,估計(jì)高斯混合模型(Gaussian Mixture Models, GMM)和語(yǔ)音決策樹(shù),結(jié)合深度神經(jīng)網(wǎng)絡(luò)(Deep Neural Network, DNN)得到一個(gè)開(kāi)放的詞匯自動(dòng)語(yǔ)音識(shí)別(Automatic Speech Recognition, ASR)系統(tǒng)。通過(guò)使用SRILM工具包訓(xùn)練語(yǔ)言模型,最后使用NIST SCTK語(yǔ)音識(shí)別評(píng)分工具包進(jìn)行誤差分析和評(píng)估。本文的重點(diǎn)是使用神經(jīng)網(wǎng)絡(luò)(Neural Network, NN)模塊訓(xùn)練神經(jīng)網(wǎng)絡(luò)聲學(xué)模型,并詳細(xì)說(shuō)明和介紹如何使用RASR開(kāi)發(fā)大詞匯量連續(xù)語(yǔ)音自動(dòng)識(shí)別系統(tǒng),重點(diǎn)介紹訓(xùn)練和識(shí)別的配置和實(shí)現(xiàn)。
【關(guān)鍵詞】:RASR 神經(jīng)網(wǎng)絡(luò) 聲學(xué)模型 語(yǔ)音識(shí)別
【學(xué)位授予單位】:內(nèi)蒙古大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2015
【分類號(hào)】:TN912.34
【目錄】:
  • 摘要4-5
  • ABSTRACT5-10
  • 第一章 緒論10-12
  • 1.1 語(yǔ)音識(shí)別概述10
  • 1.2 語(yǔ)言識(shí)別研究歷史及現(xiàn)狀10-11
  • 1.3 論文研究?jī)?nèi)容和組織結(jié)構(gòu)11-12
  • 第二章 RASR實(shí)現(xiàn)語(yǔ)音識(shí)別的基本原理12-20
  • 2.1 隱馬爾可夫模型基本原理13-15
  • 2.2 HMM參數(shù)說(shuō)明15
  • 2.3 Baum-Welch重估15-18
  • 2.4 識(shí)別和Viterbi算法18-19
  • 2.5 本章小結(jié)19-20
  • 第二章 神經(jīng)網(wǎng)絡(luò)模型20-29
  • 3.1 人工神經(jīng)網(wǎng)絡(luò)基礎(chǔ)20-22
  • 3.1.1 人工神經(jīng)網(wǎng)絡(luò)模型20-21
  • 3.1.2 神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu)21-22
  • 3.1.3 神經(jīng)網(wǎng)絡(luò)的學(xué)習(xí)22
  • 3.2 BP網(wǎng)絡(luò)模型22-25
  • 3.2.1 BP算法的基本思想23
  • 3.2.2 BP算法的步驟23-24
  • 3.2.3 BP網(wǎng)絡(luò)優(yōu)缺點(diǎn)24-25
  • 3.3 深度學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)模型25-28
  • 3.3.1 深度學(xué)習(xí)簡(jiǎn)介25-26
  • 3.3.2 深度學(xué)習(xí)的基本思想26
  • 3.3.3 深度學(xué)習(xí)的常用方法26
  • 3.3.4 深度信念神經(jīng)網(wǎng)絡(luò)26-28
  • 3.4 本章小結(jié)28-29
  • 第四章 基于深度神經(jīng)網(wǎng)絡(luò)的RASR語(yǔ)音識(shí)別的研究29-59
  • 4.1 軟件安裝29-31
  • 4.1.1 RASR 0.6.1安裝29-30
  • 4.1.2 SRILM工具安裝30-31
  • 4.1.3 NISTSCTK安裝31
  • 4.2 數(shù)據(jù)準(zhǔn)備31-36
  • 4.2.1 語(yǔ)料庫(kù)文件31-33
  • 4.2.2 字典文件33-34
  • 4.2.3 計(jì)算統(tǒng)計(jì)34-36
  • 4.3 特征提取36-39
  • 4.3.1 流網(wǎng)絡(luò)36-37
  • 4.3.2 聲學(xué)特征37-38
  • 4.3.3 MFCC特征提取38-39
  • 4.4 聲學(xué)模型訓(xùn)練39-46
  • 4.4.1 單音素訓(xùn)練40-42
  • 4.4.2 三音素訓(xùn)練42-46
  • 4.5 神經(jīng)網(wǎng)絡(luò)訓(xùn)練46-49
  • 4.6 語(yǔ)言模型訓(xùn)練49
  • 4.7 解碼及識(shí)別49-53
  • 4.7.1 解碼器49-50
  • 4.7.2 識(shí)別過(guò)程50-53
  • 4.8 實(shí)驗(yàn)結(jié)果53-58
  • 4.8.1 AN4語(yǔ)料庫(kù)識(shí)別53-54
  • 4.8.2 TIMIT語(yǔ)料庫(kù)識(shí)別54-58
  • 4.9 本章小結(jié)58-59
  • 第五章 總結(jié)與展望59-61
  • 5.1 總結(jié)59
  • 5.2 展望59-61
  • 參考文獻(xiàn)61-64
  • 致謝64

【參考文獻(xiàn)】

中國(guó)期刊全文數(shù)據(jù)庫(kù) 前1條

1 楊俊安;王一;劉輝;李晉徽;陸俊;;深度學(xué)習(xí)理論及其在語(yǔ)音識(shí)別領(lǐng)域的應(yīng)用[J];通信對(duì)抗;2014年03期


  本文關(guān)鍵詞:基于深度神經(jīng)網(wǎng)絡(luò)的RASR語(yǔ)音識(shí)別的研究,由筆耕文化傳播整理發(fā)布。



本文編號(hào):430948

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/wltx/430948.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶7193a***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com