基于語音信號(hào)特征參數(shù)提取的同模板匹配算法的綜合分析及應(yīng)用
本文關(guān)鍵詞:基于語音信號(hào)特征參數(shù)提取的同模板匹配算法的綜合分析及應(yīng)用
更多相關(guān)文章: 語音信號(hào) 線性預(yù)測(cè)倒譜系數(shù) 梅爾頻率倒譜系數(shù) 短點(diǎn)檢測(cè) 特征提取 說話人識(shí)別 語音識(shí)別
【摘要】:語音信號(hào)的處理是為了讓機(jī)器能聽懂人的聲音,最根本的目的是屬于作為人或者說是作為人的自然的重要屬性,其原理是采樣原有的語音波形,然而人的語音中包括很多元素,有我們需要的,也有我們不需要的,這就要求我們需要提取我們需要研究的部分進(jìn)行處理。由于在現(xiàn)在的成熟技術(shù)當(dāng)中,相比于其他的技術(shù)具有不可比擬的方便性、價(jià)格低廉以及支持遠(yuǎn)距離應(yīng)用等優(yōu)勢(shì),在應(yīng)用方面具有廣闊的應(yīng)用背景。已經(jīng)廣泛應(yīng)用于各個(gè)方面,可謂無孔不入,既有軍用的,也有民用的,比如軍用方面涉及到軍隊(duì)、國(guó)防、軍事通信。隨著技術(shù)的愈加進(jìn)步,語音信號(hào)的處理成為人類日常生活工作中普及率非常大的可以進(jìn)行身份認(rèn)證和識(shí)別的主要方式和實(shí)現(xiàn)手段,人們對(duì)于理論研究及相關(guān)的產(chǎn)品開發(fā)越來越受到研究人員的重視。語音信號(hào)的特征提取是語音信號(hào)分析當(dāng)中的關(guān)鍵,也是最為重要的一個(gè)環(huán)節(jié),是相關(guān)領(lǐng)域和研究方向的重點(diǎn)所在。在實(shí)際應(yīng)用當(dāng)中,說話人識(shí)別可以在不同的環(huán)境下,甚至是惡劣的環(huán)境下可以進(jìn)行特征的提取,這對(duì)我們?cè)趯?shí)驗(yàn)當(dāng)中會(huì)造成一定的麻煩。所以在進(jìn)行特征提取過程中不僅可以提取語音信號(hào)的信息、具有更好的穩(wěn)定性且具有更為理想的特征參數(shù),這是我們所面臨的問題所在。本文分別作了關(guān)于兩組語音信號(hào)特征算法的改進(jìn)及檢測(cè),第一個(gè)實(shí)驗(yàn)是基于LPCC和MFCC的文本無關(guān)的混合特征提取算法,綜合了特征參數(shù)算法的優(yōu)點(diǎn)以及差分系數(shù)的提取,提高了系統(tǒng)的識(shí)別率。第二個(gè)實(shí)驗(yàn)是基于動(dòng)態(tài)時(shí)間規(guī)劃和改進(jìn)端點(diǎn)檢測(cè)的算法的孤立詞識(shí)別系統(tǒng)的實(shí)現(xiàn),用說話人發(fā)音“0-9”進(jìn)行數(shù)據(jù)的采樣和分析,結(jié)果證明改進(jìn)的算法相比于傳統(tǒng)的DTW算法具有更好的識(shí)別率和識(shí)別速度。
【關(guān)鍵詞】:語音信號(hào) 線性預(yù)測(cè)倒譜系數(shù) 梅爾頻率倒譜系數(shù) 短點(diǎn)檢測(cè) 特征提取 說話人識(shí)別 語音識(shí)別
【學(xué)位授予單位】:昆明理工大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2015
【分類號(hào)】:TN912.3
【目錄】:
- 摘要5-6
- Abstract6-11
- 第一章 緒論11-21
- 1.1 課題的研究背景和意義11
- 1.2 研究背景11-12
- 1.3 現(xiàn)狀和研究背景12-16
- 1.3.1 說話人識(shí)別的法展現(xiàn)狀12-14
- 1.3.2 說話人識(shí)別的難點(diǎn)14-16
- 1.4 說話人識(shí)別的機(jī)制16-19
- 1.4.1 說話人識(shí)別的基本流程圖介紹16-17
- 1.4.2 語音信號(hào)的特征參數(shù)17-19
- 1.5 本文的工作安排19-21
- 第二章 語音信號(hào)的基本理論21-45
- 2.1 基本概念21-22
- 2.1.1 人的發(fā)聲音機(jī)理21
- 2.1.2 人的發(fā)聲分類21-22
- 2.2 語音信號(hào)的基本模型分析22-25
- 2.2.1 語音信號(hào)的數(shù)字模型22
- 2.2.2 語音信號(hào)的聲學(xué)模型22-25
- 2.3 說話人識(shí)別的概述25-28
- 2.3.1 發(fā)音原理25-27
- 2.3.2 說話人識(shí)別系統(tǒng)的性能評(píng)價(jià)標(biāo)準(zhǔn)27
- 2.3.3 說話人識(shí)別技術(shù)的應(yīng)用27-28
- 2.4 語音信號(hào)的預(yù)處理28-36
- 2.4.1 語音信號(hào)的采集以及量化28-30
- 2.4.2 預(yù)加重處理30
- 2.4.3 信號(hào)幀數(shù)分離和加窗30-33
- 2.4.4 語音信號(hào)的端點(diǎn)檢測(cè)33-34
- 2.4.5 端點(diǎn)檢測(cè)算法34
- 2.4.6 端點(diǎn)檢測(cè)算法的改進(jìn)34-36
- 2.5 語音信號(hào)模型的分析36-43
- 2.5.1 說話人模型的類別36
- 2.5.2 VQ(矢量量化)模型36-41
- 2.5.3 高斯混合模型41-42
- 2.5.4 人工神經(jīng)網(wǎng)絡(luò)模型42-43
- 2.6 本章總結(jié)43-45
- 第三章 說話人特征提取算法的分析及研究45-57
- 3.1 常用的特征參數(shù)提取的分析45-50
- 3.1.1 常見的特征參數(shù)提取方法介紹45
- 3.1.2 線性預(yù)測(cè)倒譜系數(shù)(LPCC)的基本概念45-46
- 3.1.3 LPCC特征參數(shù)分析46
- 3.1.4 線性預(yù)測(cè)倒譜系數(shù)的特征參數(shù)提取46-50
- 3.2 梅爾倒譜系數(shù)算法的基本原理50-55
- 3.2.1 梅爾倒譜系數(shù)的提取過程51-55
- 3.3 本章小結(jié)55-57
- 第四章 語音信號(hào)識(shí)別算法原理介紹57-67
- 4.1 概述57-58
- 4.2 動(dòng)態(tài)時(shí)間規(guī)整算法58-62
- 4.2.1 動(dòng)態(tài)時(shí)間規(guī)整算法的介紹58-60
- 4.2.2 改進(jìn)的動(dòng)態(tài)時(shí)間規(guī)整算法60
- 4.2.3 放寬端點(diǎn)限制60-62
- 4.3 高斯混合模型62-66
- 4.3.1 高斯混合模型的概述62-63
- 4.3.2 高斯混合模型的原理63-64
- 4.3.3 高斯混合模型的訓(xùn)練64-66
- 4.5 本章總結(jié)66-67
- 第五章 具體的實(shí)驗(yàn)及計(jì)算機(jī)仿真67-85
- 5.1 基于LPCC和MFCC的混合特征參數(shù)提取的算法改進(jìn)67-75
- 5.1.1 改進(jìn)算法的原理分析67
- 5.1.2 語音信號(hào)的預(yù)處理67
- 5.1.3 線性預(yù)測(cè)倒譜系數(shù)分析67-68
- 5.1.4 MFCC參數(shù)的提取68-69
- 5.1.5 LPCC和MFCC的特征參數(shù)提取的原理及分析69-70
- 5.1.6 實(shí)驗(yàn)及仿真70-75
- 5.2 基于DTW改進(jìn)算法的孤立詞識(shí)別系統(tǒng)的分析及研究75-84
- 5.2.1 改進(jìn)的孤立詞識(shí)別系統(tǒng)的概述75
- 5.2.2 孤立詞識(shí)別系統(tǒng)的模型建立75-76
- 5.2.3 孤立詞的預(yù)處理過程分析76-80
- 5.2.4 語音信號(hào)的特征提取80-82
- 5.2.5 動(dòng)態(tài)時(shí)間規(guī)整的算法改進(jìn)82-83
- 5.2.6 實(shí)驗(yàn)及仿真83-84
- 5.3 本章小結(jié)84-85
- 第六章 論文小結(jié)85-87
- 致謝87-89
- 參考文獻(xiàn)89-93
- 附錄 (攻讀碩士學(xué)位期間論文)93
【參考文獻(xiàn)】
中國(guó)期刊全文數(shù)據(jù)庫 前4條
1 李玉萍;樸春俊;韓永成;;一種改進(jìn)的語音信號(hào)端點(diǎn)檢測(cè)方法研究[J];國(guó)外電子測(cè)量技術(shù);2008年01期
2 陳孟元;;基于改進(jìn)型DTW算法和MFCC的語音識(shí)別[J];安徽工程大學(xué)學(xué)報(bào);2014年01期
3 潘丹青;;一種改進(jìn)的語音端點(diǎn)特征檢測(cè)方法[J];桂林航天工業(yè)學(xué)院學(xué)報(bào);2014年03期
4 李冰;程建政;劉康;程利;;基于DTW的孤立詞說話人識(shí)別研究[J];數(shù)字技術(shù)與應(yīng)用;2013年10期
中國(guó)碩士學(xué)位論文全文數(shù)據(jù)庫 前2條
1 蘇敏發(fā);基于語音識(shí)別的家用服務(wù)機(jī)器人控制系統(tǒng)[D];廣東工業(yè)大學(xué);2014年
2 路娜;孤立詞語音識(shí)別系統(tǒng)的研究與設(shè)計(jì)[D];曲阜師范大學(xué);2014年
,本文編號(hào):901903
本文鏈接:http://sikaile.net/kejilunwen/wltx/901903.html