基于深度神經(jīng)網(wǎng)絡(luò)的語音識別研究
本文關(guān)鍵詞:基于深度神經(jīng)網(wǎng)絡(luò)的語音識別研究
更多相關(guān)文章: 語音識別 深度學(xué)習(xí)(DL) Kaldi工具箱 音節(jié)錯誤率(WER)
【摘要】:在過去的幾年里,以深度學(xué)習(xí)研究為基礎(chǔ)發(fā)展起來的深度學(xué)習(xí)技術(shù)對信號和信息處理方面的工作有著越來越廣泛的影響,可以說,深度學(xué)習(xí)已經(jīng)拓寬為機器學(xué)習(xí)和人工智能研究的主要方面。 本文首先介紹了語音識別基于原理,主要介紹了語音信號的預(yù)處理過程,語音信號的MFCC特征和語音識別方法。 以人工神經(jīng)網(wǎng)絡(luò)在機器學(xué)習(xí)方面的應(yīng)用為主線,,可以引入深層神經(jīng)網(wǎng)絡(luò)和深度學(xué)習(xí)問題。根據(jù)網(wǎng)絡(luò)結(jié)構(gòu)的作用和訓(xùn)練方法的不同,深層神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)可以大致分為三類:生成深層結(jié)構(gòu),判別深層結(jié)構(gòu)和混合深層結(jié)構(gòu)。對于深度學(xué)習(xí)方法,本文主要介紹了BP算法和用RBM實現(xiàn)深度學(xué)習(xí)的方法。 最后,本文利用Kaldi語音識別工具箱,以BP訓(xùn)練算法為理論依據(jù),對一個含有4隱層神經(jīng)網(wǎng)絡(luò)進(jìn)行訓(xùn)練,并利用該網(wǎng)絡(luò)進(jìn)行中文語音識別。 本文以識別錯誤率為標(biāo)準(zhǔn),研究了中文發(fā)音音子集對深層神經(jīng)網(wǎng)絡(luò)語音識別錯誤率的影響。
【關(guān)鍵詞】:語音識別 深度學(xué)習(xí)(DL) Kaldi工具箱 音節(jié)錯誤率(WER)
【學(xué)位授予單位】:新疆大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2014
【分類號】:TN912.34
【目錄】:
- 摘要3-4
- Abstract4-5
- 目錄5-7
- 第一章 緒論7-10
- 1.1 研究背景7
- 1.2 深度學(xué)習(xí)的幾種定義7-8
- 1.3 本文內(nèi)容安排8-10
- 第二章 語音識別基本原理10-19
- 2.1 語音信號的預(yù)處理10-15
- 2.1.1 語音信號的預(yù)加重11
- 2.1.2 語音信號的加窗處理11-13
- 2.1.3 語音信號的端點檢測13-15
- 2.2 語音識別特征提取15-16
- 2.3 語音識別方法16-17
- 2.4 本章小結(jié)17-19
- 第三章 人工神經(jīng)網(wǎng)絡(luò)基礎(chǔ)19-26
- 3.1 人工神經(jīng)元模型19-20
- 3.2 神經(jīng)網(wǎng)絡(luò)應(yīng)用于機器學(xué)習(xí)20-21
- 3.3 BP 算法21-24
- 3.4 神經(jīng)網(wǎng)絡(luò)的優(yōu)化問題24-25
- 3.5 本章小結(jié)25-26
- 第四章 深度學(xué)習(xí)26-35
- 4.1 深度學(xué)習(xí)結(jié)構(gòu)26-30
- 4.1.1 DNN 結(jié)構(gòu)27-28
- 4.1.2 DBN 結(jié)構(gòu)28-30
- 4.2 用 RBM 實現(xiàn)深度學(xué)習(xí)的方法30-34
- 4.3 本章小結(jié)34-35
- 第五章 Kaldi 語音識別系統(tǒng)35-40
- 5.1 Kaldi 語音識別平臺搭建35-37
- 5.2 Kaldi 語音識別工具箱簡介37-39
- 5.3 本章小結(jié)39-40
- 第六章 實驗過程與結(jié)果分析40-51
- 6.1 數(shù)據(jù)準(zhǔn)備40-48
- 6.1.1 data/local/dict 文件夾41-42
- 6.1.2 data/train 文件夾42-44
- 6.1.3 data/lang 文件夾44-47
- 6.1.4 G.fst47-48
- 6.2 主要的腳本文件48-49
- 6.3 結(jié)果與分析49-50
- 6.4 本章小結(jié)50-51
- 參考文獻(xiàn)51-55
- 致謝55
【共引文獻(xiàn)】
中國期刊全文數(shù)據(jù)庫 前4條
1 劉翠;張歆奕;;基于FT和HHT的語音能量輪郭特征提取[J];五邑大學(xué)學(xué)報(自然科學(xué)版);2014年01期
2 孟澤民;林生生;;基于神經(jīng)網(wǎng)絡(luò)的家用型睡眠呼吸暫停綜合癥監(jiān)測系統(tǒng)[J];計算機系統(tǒng)應(yīng)用;2014年03期
3 張俏;楊驍;湯煒;;LPC與LSF系數(shù)轉(zhuǎn)換的FPGA實現(xiàn)[J];微型機與應(yīng)用;2014年13期
4 李野;姬紅旭;張磊;張曉雪;;端點檢測方法的研究[J];職業(yè)技術(shù);2014年10期
中國碩士學(xué)位論文全文數(shù)據(jù)庫 前10條
1 徐紅梅;與文本無關(guān)的閉集聲紋識別系統(tǒng)研究[D];哈爾濱理工大學(xué);2013年
2 吳艷君;基于AMDF的脈搏周期提取算法改進(jìn)[D];江西財經(jīng)大學(xué);2013年
3 羅影利;基于嵌入式的關(guān)鍵詞組識別系統(tǒng)的設(shè)計與實現(xiàn)[D];南京理工大學(xué);2014年
4 肖宇鋒;基于ISOMAP語音特征提取的研究與DSP實現(xiàn)[D];湖南大學(xué);2013年
5 王帥;基于壓縮感知的語音信號壓縮重構(gòu)算法研究[D];中北大學(xué);2014年
6 陳鳴;基于復(fù)倒譜變換的音頻水印算法研究[D];長春理工大學(xué);2013年
7 施巍巍;經(jīng)驗?zāi)B(tài)分解方法及其在語音識別算法中的研究[D];浙江理工大學(xué);2014年
8 顏利君;基于噪聲估計和掩蔽效應(yīng)的語音增強[D];西南交通大學(xué);2014年
9 龐永強;基于VoIP的VHF通信系統(tǒng)中話音質(zhì)量增強方法研究[D];內(nèi)蒙古大學(xué);2014年
10 郭曉彬;基于DSP的G.729語音編碼算法的研究與實現(xiàn)[D];吉林大學(xué);2014年
本文編號:828916
本文鏈接:http://sikaile.net/kejilunwen/xinxigongchenglunwen/828916.html