基于BP神經(jīng)網(wǎng)絡(luò)的語音識(shí)別技術(shù)研究
本文關(guān)鍵詞:基于BP神經(jīng)網(wǎng)絡(luò)的語音識(shí)別技術(shù)研究
更多相關(guān)文章: 人工神經(jīng)網(wǎng)絡(luò) 語音識(shí)別 特征提取
【摘要】:語音識(shí)別技術(shù)應(yīng)用前景廣闊,因此得到了人們的較高關(guān)注。目前語音識(shí)別研究廣泛應(yīng)用動(dòng)態(tài)時(shí)間規(guī)整(DTW)技術(shù)和隱馬爾可夫模型(HMM)技術(shù),已經(jīng)取得了較為成熟的理論基礎(chǔ)。由于語音不是一個(gè)簡(jiǎn)單的線性過程,而是復(fù)雜的非線性過程,近年來,研究人員將具有非線性、自適應(yīng)、學(xué)習(xí)性等優(yōu)點(diǎn)的人工神經(jīng)網(wǎng)絡(luò)應(yīng)用到語音識(shí)別系統(tǒng)中,并取得了較好的效果。本文將以標(biāo)準(zhǔn)三層BP神經(jīng)網(wǎng)絡(luò)作為識(shí)別算法,探索了其在語音識(shí)別技術(shù)中的應(yīng)用。 本文對(duì)孤立數(shù)字識(shí)別進(jìn)行了系統(tǒng)的研究,采用了BP神經(jīng)網(wǎng)絡(luò)算法,對(duì)神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu)和模型參數(shù)進(jìn)行了實(shí)驗(yàn)研究,由此提高語音識(shí)別系統(tǒng)的識(shí)別率,最終實(shí)現(xiàn)了一個(gè)特定人孤立字的語音識(shí)別系統(tǒng),為后續(xù)非特定人語音研究做鋪墊。本文對(duì)語音識(shí)別的基本理論進(jìn)行了詳細(xì)的介紹。分析研究了語音信號(hào)預(yù)處理過程,包括語音信號(hào)采集、濾波、加窗、分幀以及端點(diǎn)檢測(cè)等環(huán)節(jié),同時(shí)還重點(diǎn)研究了LPCC和MFCC特征參數(shù)提取方法,并對(duì)MFCC特征參數(shù)提取進(jìn)行了改進(jìn),提出了混合MFCC參數(shù)提取法,并對(duì)LPCC與MFCC的混合參數(shù)、LPCC和改進(jìn)的MFCC相混合的參數(shù)進(jìn)行了實(shí)驗(yàn)分析。對(duì)比了不同參數(shù)的識(shí)別性能,結(jié)果顯示改進(jìn)的MFCC參數(shù)和相混合的特征參數(shù)具有更好的識(shí)別性能。同時(shí)對(duì)BP神經(jīng)網(wǎng)絡(luò)的基本原理、學(xué)習(xí)規(guī)則以及算法流程進(jìn)行了分析和介紹,提出了增加動(dòng)量因子法與自適應(yīng)速率方法相結(jié)合的算法,該算法同時(shí)解決了神經(jīng)網(wǎng)絡(luò)易陷入局部極小值點(diǎn)及收斂速度慢的缺點(diǎn),極大的優(yōu)化了系統(tǒng)性能。最后,對(duì)不同神經(jīng)元個(gè)數(shù)和訓(xùn)練樣本個(gè)數(shù)進(jìn)行了仿真實(shí)驗(yàn),得出了神經(jīng)元個(gè)數(shù)和訓(xùn)練樣本數(shù)目對(duì)識(shí)別的精度影響很大,實(shí)驗(yàn)中需選擇合適的個(gè)數(shù)。
【關(guān)鍵詞】:人工神經(jīng)網(wǎng)絡(luò) 語音識(shí)別 特征提取
【學(xué)位授予單位】:云南大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2015
【分類號(hào)】:TN912.34;TP183
【目錄】:
- 摘要3-4
- Abstract4-9
- 第一章 緒論9-15
- 1.1 引言9-10
- 1.2 國內(nèi)外研究現(xiàn)狀10-12
- 1.2.1 國外研究現(xiàn)狀10-11
- 1.2.2 國內(nèi)研究現(xiàn)狀11-12
- 1.3 語音識(shí)別系統(tǒng)所面臨的困難12-13
- 1.3.1 噪音干擾12
- 1.3.2 語音信號(hào)具有復(fù)雜和多變性12
- 1.3.3 魯棒性方面12-13
- 1.3.4 語音系統(tǒng)的復(fù)雜性13
- 1.4 本文研究?jī)?nèi)容和結(jié)構(gòu)安排13-15
- 1.4.1 研究?jī)?nèi)容13
- 1.4.2 結(jié)構(gòu)安排13-15
- 第二章 語音識(shí)別基本原理和技術(shù)15-27
- 2.1 語音識(shí)別系統(tǒng)簡(jiǎn)介15-16
- 2.1.1 語音識(shí)別系統(tǒng)分類15
- 2.1.2 語音識(shí)別系統(tǒng)的基本原理15-16
- 2.2 語音信號(hào)預(yù)處理16-20
- 2.2.1 預(yù)濾波與采樣16-17
- 2.2.2 預(yù)加重17
- 2.2.3 分幀加窗17-18
- 2.2.4 端點(diǎn)檢測(cè)18-20
- 2.3 語音特征提取方法20-26
- 2.3.1 線性預(yù)測(cè)系數(shù)(LPC)21-22
- 2.3.2 線性預(yù)測(cè)倒譜系數(shù)(LPCC)22
- 2.3.3 美爾頻率倒譜系數(shù)(MFCC)22-24
- 2.3.4 改進(jìn)的混合MFCC24-26
- 2.4 本章小結(jié)26-27
- 第三章 人工神經(jīng)網(wǎng)絡(luò)相關(guān)理論及算法27-40
- 3.1 人工神經(jīng)網(wǎng)絡(luò)概述27-32
- 3.1.1 人工神經(jīng)元28-29
- 3.1.2 人工神經(jīng)網(wǎng)絡(luò)模型29-30
- 3.1.3 神經(jīng)網(wǎng)絡(luò)的學(xué)習(xí)方法30-31
- 3.1.4 神經(jīng)網(wǎng)絡(luò)的學(xué)習(xí)規(guī)則31-32
- 3.2 BP神經(jīng)網(wǎng)絡(luò)32-36
- 3.2.1 BP神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)32-34
- 3.2.2 BP網(wǎng)絡(luò)的學(xué)習(xí)算法34-36
- 3.3 BP神經(jīng)網(wǎng)絡(luò)的不足與改進(jìn)36-39
- 3.4 本章小結(jié)39-40
- 第四章 基于BP神經(jīng)網(wǎng)絡(luò)的語音識(shí)別仿真實(shí)現(xiàn)40-54
- 4.1 仿真系統(tǒng)的介紹40-41
- 4.2 語音樣本的建立41-46
- 4.2.1 語音信號(hào)的采集41-42
- 4.2.2 語音信號(hào)預(yù)處理42-43
- 4.2.3 語音信號(hào)的特征參數(shù)提取43-44
- 4.2.4 特征參數(shù)的規(guī)整44-46
- 4.3 神經(jīng)網(wǎng)絡(luò)模型的建立46-47
- 4.4 神經(jīng)網(wǎng)絡(luò)的訓(xùn)練和識(shí)別47-48
- 4.5 仿真實(shí)驗(yàn)及性能分析48-53
- 4.5.1 BP神經(jīng)網(wǎng)絡(luò)改進(jìn)前后性能比較48-49
- 4.5.2 網(wǎng)絡(luò)結(jié)構(gòu)對(duì)性能的影響49-51
- 4.5.3 不同參數(shù)的性能比較51-52
- 4.5.4 訓(xùn)練樣本個(gè)數(shù)對(duì)識(shí)別性能的影響52
- 4.5.5 特定人和非特定人識(shí)別性能測(cè)試52-53
- 4.6 本章小結(jié)53-54
- 第五章 總結(jié)與展望54-56
- 5.1 全文總結(jié)54
- 5.2 前景展望54-56
- 參考文獻(xiàn)56-59
- 致謝59
【參考文獻(xiàn)】
中國期刊全文數(shù)據(jù)庫 前10條
1 韓一;王國胤;楊勇;;基于MFCC的語音情感識(shí)別[J];重慶郵電大學(xué)學(xué)報(bào)(自然科學(xué)版);2008年05期
2 史笑興,顧明亮,王太君,何振亞;一種時(shí)間規(guī)整算法在神經(jīng)網(wǎng)絡(luò)語音識(shí)別中的應(yīng)用[J];東南大學(xué)學(xué)報(bào);1999年05期
3 付麗輝;;語音識(shí)別關(guān)鍵性技術(shù)的MATLAB仿真實(shí)現(xiàn)[J];儀器儀表用戶;2010年03期
4 李澤;崔宣;馬雨廷;陳俊宇;;MFCC和LPCC特征參數(shù)在說話人識(shí)別中的研究[J];河南工程學(xué)院學(xué)報(bào)(自然科學(xué)版);2010年02期
5 李曉霞,王東木,李雪耀;語音識(shí)別技術(shù)評(píng)述[J];計(jì)算機(jī)應(yīng)用研究;1999年10期
6 吳尊敬,曹志剛;Improved MFCC-Based Feature for Robust Speaker Identification[J];Tsinghua Science and Technology;2005年02期
7 陳衛(wèi)東;王曉亞;解靜;;基于LPCC的多語種識(shí)別算法[J];無線電工程;2009年09期
8 張曉東,崔仁濤;文本文件的語音識(shí)別中音節(jié)的自動(dòng)切分[J];皖西學(xué)院學(xué)報(bào);2004年02期
9 熊偉;羅云貴;;語音識(shí)別的MFCC算法研究[J];現(xiàn)代商貿(mào)工業(yè);2010年03期
10 張震宇;;基于Matlab的語音端點(diǎn)檢測(cè)實(shí)驗(yàn)研究[J];浙江科技學(xué)院學(xué)報(bào);2007年03期
,本文編號(hào):1089041
本文鏈接:http://sikaile.net/kejilunwen/wltx/1089041.html