天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁 > 科技論文 > 信息工程論文 >

基于深度神經(jīng)網(wǎng)絡(luò)的語音識別研究

發(fā)布時間:2017-09-11 05:31

  本文關(guān)鍵詞:基于深度神經(jīng)網(wǎng)絡(luò)的語音識別研究


  更多相關(guān)文章: 語音識別 深度學(xué)習(xí)(DL) Kaldi工具箱 音節(jié)錯誤率(WER)


【摘要】:在過去的幾年里,以深度學(xué)習(xí)研究為基礎(chǔ)發(fā)展起來的深度學(xué)習(xí)技術(shù)對信號和信息處理方面的工作有著越來越廣泛的影響,可以說,深度學(xué)習(xí)已經(jīng)拓寬為機器學(xué)習(xí)和人工智能研究的主要方面。 本文首先介紹了語音識別基于原理,主要介紹了語音信號的預(yù)處理過程,語音信號的MFCC特征和語音識別方法。 以人工神經(jīng)網(wǎng)絡(luò)在機器學(xué)習(xí)方面的應(yīng)用為主線,,可以引入深層神經(jīng)網(wǎng)絡(luò)和深度學(xué)習(xí)問題。根據(jù)網(wǎng)絡(luò)結(jié)構(gòu)的作用和訓(xùn)練方法的不同,深層神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)可以大致分為三類:生成深層結(jié)構(gòu),判別深層結(jié)構(gòu)和混合深層結(jié)構(gòu)。對于深度學(xué)習(xí)方法,本文主要介紹了BP算法和用RBM實現(xiàn)深度學(xué)習(xí)的方法。 最后,本文利用Kaldi語音識別工具箱,以BP訓(xùn)練算法為理論依據(jù),對一個含有4隱層神經(jīng)網(wǎng)絡(luò)進(jìn)行訓(xùn)練,并利用該網(wǎng)絡(luò)進(jìn)行中文語音識別。 本文以識別錯誤率為標(biāo)準(zhǔn),研究了中文發(fā)音音子集對深層神經(jīng)網(wǎng)絡(luò)語音識別錯誤率的影響。
【關(guān)鍵詞】:語音識別 深度學(xué)習(xí)(DL) Kaldi工具箱 音節(jié)錯誤率(WER)
【學(xué)位授予單位】:新疆大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2014
【分類號】:TN912.34
【目錄】:
  • 摘要3-4
  • Abstract4-5
  • 目錄5-7
  • 第一章 緒論7-10
  • 1.1 研究背景7
  • 1.2 深度學(xué)習(xí)的幾種定義7-8
  • 1.3 本文內(nèi)容安排8-10
  • 第二章 語音識別基本原理10-19
  • 2.1 語音信號的預(yù)處理10-15
  • 2.1.1 語音信號的預(yù)加重11
  • 2.1.2 語音信號的加窗處理11-13
  • 2.1.3 語音信號的端點檢測13-15
  • 2.2 語音識別特征提取15-16
  • 2.3 語音識別方法16-17
  • 2.4 本章小結(jié)17-19
  • 第三章 人工神經(jīng)網(wǎng)絡(luò)基礎(chǔ)19-26
  • 3.1 人工神經(jīng)元模型19-20
  • 3.2 神經(jīng)網(wǎng)絡(luò)應(yīng)用于機器學(xué)習(xí)20-21
  • 3.3 BP 算法21-24
  • 3.4 神經(jīng)網(wǎng)絡(luò)的優(yōu)化問題24-25
  • 3.5 本章小結(jié)25-26
  • 第四章 深度學(xué)習(xí)26-35
  • 4.1 深度學(xué)習(xí)結(jié)構(gòu)26-30
  • 4.1.1 DNN 結(jié)構(gòu)27-28
  • 4.1.2 DBN 結(jié)構(gòu)28-30
  • 4.2 用 RBM 實現(xiàn)深度學(xué)習(xí)的方法30-34
  • 4.3 本章小結(jié)34-35
  • 第五章 Kaldi 語音識別系統(tǒng)35-40
  • 5.1 Kaldi 語音識別平臺搭建35-37
  • 5.2 Kaldi 語音識別工具箱簡介37-39
  • 5.3 本章小結(jié)39-40
  • 第六章 實驗過程與結(jié)果分析40-51
  • 6.1 數(shù)據(jù)準(zhǔn)備40-48
  • 6.1.1 data/local/dict 文件夾41-42
  • 6.1.2 data/train 文件夾42-44
  • 6.1.3 data/lang 文件夾44-47
  • 6.1.4 G.fst47-48
  • 6.2 主要的腳本文件48-49
  • 6.3 結(jié)果與分析49-50
  • 6.4 本章小結(jié)50-51
  • 參考文獻(xiàn)51-55
  • 致謝55

【共引文獻(xiàn)】

中國期刊全文數(shù)據(jù)庫 前4條

1 劉翠;張歆奕;;基于FT和HHT的語音能量輪郭特征提取[J];五邑大學(xué)學(xué)報(自然科學(xué)版);2014年01期

2 孟澤民;林生生;;基于神經(jīng)網(wǎng)絡(luò)的家用型睡眠呼吸暫停綜合癥監(jiān)測系統(tǒng)[J];計算機系統(tǒng)應(yīng)用;2014年03期

3 張俏;楊驍;湯煒;;LPC與LSF系數(shù)轉(zhuǎn)換的FPGA實現(xiàn)[J];微型機與應(yīng)用;2014年13期

4 李野;姬紅旭;張磊;張曉雪;;端點檢測方法的研究[J];職業(yè)技術(shù);2014年10期

中國碩士學(xué)位論文全文數(shù)據(jù)庫 前10條

1 徐紅梅;與文本無關(guān)的閉集聲紋識別系統(tǒng)研究[D];哈爾濱理工大學(xué);2013年

2 吳艷君;基于AMDF的脈搏周期提取算法改進(jìn)[D];江西財經(jīng)大學(xué);2013年

3 羅影利;基于嵌入式的關(guān)鍵詞組識別系統(tǒng)的設(shè)計與實現(xiàn)[D];南京理工大學(xué);2014年

4 肖宇鋒;基于ISOMAP語音特征提取的研究與DSP實現(xiàn)[D];湖南大學(xué);2013年

5 王帥;基于壓縮感知的語音信號壓縮重構(gòu)算法研究[D];中北大學(xué);2014年

6 陳鳴;基于復(fù)倒譜變換的音頻水印算法研究[D];長春理工大學(xué);2013年

7 施巍巍;經(jīng)驗?zāi)B(tài)分解方法及其在語音識別算法中的研究[D];浙江理工大學(xué);2014年

8 顏利君;基于噪聲估計和掩蔽效應(yīng)的語音增強[D];西南交通大學(xué);2014年

9 龐永強;基于VoIP的VHF通信系統(tǒng)中話音質(zhì)量增強方法研究[D];內(nèi)蒙古大學(xué);2014年

10 郭曉彬;基于DSP的G.729語音編碼算法的研究與實現(xiàn)[D];吉林大學(xué);2014年



本文編號:828916

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/xinxigongchenglunwen/828916.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶7de2d***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com