基于多模型矢量泰勒級數(shù)的語音識別系統(tǒng)優(yōu)化
發(fā)布時間:2017-05-21 21:16
本文關鍵詞:基于多模型矢量泰勒級數(shù)的語音識別系統(tǒng)優(yōu)化,由筆耕文化傳播整理發(fā)布。
【摘要】:在理想的實驗室環(huán)境下,語音識別系統(tǒng)具有很高的識別率,但是在實際環(huán)境下,由于各種噪聲的干擾,降低了實際應用環(huán)境下的語音識別性能,論文將從前端的端點檢測和后端的拒識別兩方面入手,進行系統(tǒng)優(yōu)化,以提高語音識別系統(tǒng)性能、尤其是低信噪比環(huán)境下的識別性能。論文的主要工作包括:(1)分析了語音識別系統(tǒng)結構,包括預處理、特征提取和建模。預處理主要對語音信號進行預加重、分幀加窗、端點檢測;提取美爾頻率倒譜系數(shù)(MFCC:Mel-Frequency Cepstral Coefficients)及其一階差分倒譜系數(shù),作為語音識別系統(tǒng)的特征參數(shù);利用隱馬爾科夫模型(HMM:Hidden Markov Mod el)對語音信號進行聲學建模。(2)實現(xiàn)了基于子帶能量譜熵的端點檢測算法,優(yōu)化了系統(tǒng)的端點檢測模塊。子帶能量譜熵參數(shù)不僅可以表征低信噪比環(huán)境下的語音信號特征,而且對不同種類的噪聲有一定的魯棒性。測試結果表明,在低信噪比環(huán)境下,基于子帶能量譜熵的端點檢測效果要優(yōu)于原先的雙門限端點檢測:端點檢測模塊的優(yōu)化大幅提高VTSME(VTS-based Multi-Environment)語音識別系統(tǒng)的識別性能,尤其是在低信噪比環(huán)境下的識別性能。(3)為語音識別系統(tǒng)增加了拒識模塊。本文對語音長度過短、環(huán)境信噪比過低和對可能識別錯誤的孤立詞進行拒識這三個方面進行研究,其中重點研究了基于后驗概率差值的拒識算法。通過拒識噪聲大、語音短和區(qū)分度低的測試語音,大幅度提高了系統(tǒng)識別準確率,而基本沒有增加系統(tǒng)復雜度,保證了系統(tǒng)的實時性。(4)在MATLAB平臺上進行的仿真實驗基礎上,實現(xiàn)了C平臺的優(yōu)化算法。將優(yōu)化部分移植到C平臺,完成了對實時的非特定人孤立詞識別系統(tǒng)的優(yōu)化。實驗結果證明,優(yōu)化使語音識別系統(tǒng)的識別性能得到了大幅度提升。
【關鍵詞】:子帶譜熵 端點檢測 拒識 多環(huán)境模型
【學位授予單位】:東南大學
【學位級別】:碩士
【學位授予年份】:2015
【分類號】:TN912.34
【目錄】:
- 摘要4-5
- Abstract5-8
- 第一章 緒論8-12
- 1.1 語音識別的研究背景8
- 1.2 語音識別的發(fā)展歷史和現(xiàn)狀8-9
- 1.2.1 國外發(fā)展歷史和研究現(xiàn)狀8-9
- 1.2.2 國內發(fā)展歷史和研究現(xiàn)狀9
- 1.3 語音識別技術的難點9-10
- 1.4 論文的主要內容及組織結構10-12
- 第二章 語音識別系統(tǒng)的優(yōu)化概述12-24
- 2.1 語音識別系統(tǒng)的結構12-15
- 2.1.1 預處理12-13
- 2.1.2 特征提取13-14
- 2.1.3 HMM聲學模型14-15
- 2.2 端點檢測算法15-19
- 2.2.1 傳統(tǒng)雙門限端點檢測算法16-17
- 2.2.2 基于互相關函數(shù)的端點檢測算法17-18
- 2.2.3 基于譜熵的端點檢測算法18-19
- 2.3 語音拒識算法19-23
- 2.3.1 基于填充模型和噪聲模型的拒識算法20-21
- 2.3.2 基于后驗概率差值的拒識算法21-23
- 2.4 小結23-24
- 第三章 多模型VTS孤立詞識別系統(tǒng)的前端優(yōu)化24-50
- 3.1 引言24-26
- 3.2 基于多環(huán)境模型VTS特征補償算法概述26-28
- 3.2.1 基于VTS倒譜域特征補償算法概述26
- 3.2.2 基于VTS特征補償算法噪聲均值方差估計26-27
- 3.2.3 多環(huán)境模型的VTS特征補償算法概述27-28
- 3.3 基于子帶譜熵的端點檢測算法28-38
- 3.3.1 子帶譜熵參數(shù)28-31
- 3.3.2 基于子帶譜熵的改進端點檢測算法31-37
- 3.3.3 端點檢測及系統(tǒng)性能評價37-38
- 3.4 基于MATLAB的仿真實驗38-43
- 3.4.1 實驗條件38-39
- 3.4.2 實驗結果及分析39-43
- 3.5 基于C平臺的實時實驗43-47
- 3.5.1 實時語音采集43-44
- 3.5.2 實驗設備與數(shù)據(jù)庫介紹44-45
- 3.5.3 實時測試方案45
- 3.5.4 實驗結果與分析45-47
- 3.6 小結47-50
- 第四章 多模型VTS孤立詞識別系統(tǒng)的后端優(yōu)化50-68
- 4.1 基于后驗概率差值的拒識算法50-55
- 4.1.1 拒識特征提取50-52
- 4.1.2 語音長度過短的拒識52-53
- 4.1.3 環(huán)境信噪比過低的拒識53
- 4.1.4 拒識步驟及算法流程53-54
- 4.1.5 拒識及系統(tǒng)性能評價54-55
- 4.2 基于MATLAB的仿真實驗55-63
- 4.2.1 實驗參數(shù)的選取55-56
- 4.2.2 實驗結果及分析56-63
- 4.3 基于C平臺的實時實驗63-66
- 4.3.1 實驗設備與數(shù)據(jù)庫介紹63
- 4.3.2 實時測試方案63
- 4.3.3 實驗結果與分析63-66
- 4.4 小結66-68
- 第五章 總結與展望68-70
- 5.1 全文總結68
- 5.2 研究展望68-70
- 致謝70-72
- 參考文獻72-75
- 攻讀碩士學位期間參加的科研項目和完成的論文75
【相似文獻】
中國期刊全文數(shù)據(jù)庫 前10條
1 汪洪波;;語音識別系統(tǒng)在配送中心的應用[J];信息與電腦;2006年06期
2 楊q,
本文編號:384869
本文鏈接:http://sikaile.net/kejilunwen/wltx/384869.html
最近更新
教材專著