基于EMD的說話人特征參數(shù)提取方法研究
發(fā)布時間:2017-10-05 18:44
本文關(guān)鍵詞:基于EMD的說話人特征參數(shù)提取方法研究
更多相關(guān)文章: 說話人識別 經(jīng)驗(yàn)?zāi)B(tài)分解(EMD) 特征提取 Wigner-Ville譜 FFT
【摘要】:隨著科學(xué)技術(shù)的不斷發(fā)展,如何利用機(jī)器來識別出不同的人,逐漸被人們所重視。說話人識別研究的是如何將人的語音作為身份標(biāo)志,讓機(jī)器依據(jù)這個標(biāo)志辨識出不同的人。作為一種能為人們的日常生活提供便利的技術(shù),說話人識別技術(shù)成為人們研究的熱點(diǎn)。在說話人識別技術(shù)中,研究的核心是能夠表征說話人的特征參數(shù),提取了表征性能好的的說話人特征參數(shù),才能準(zhǔn)確的識別說話人。美爾頻率倒譜系數(shù)(MFCC)是基于人耳聽覺特性的一種參數(shù),是描述說話人的重要特征參數(shù)之一。經(jīng)驗(yàn)?zāi)B(tài)分解(EMD)是一種適合于語音信號處理的方法。我們將EMD應(yīng)用到說話人識別中,可得到一些有意義的結(jié)果。本文詳細(xì)的研究了說話人識別的特征參數(shù)的提取方法,分析了目前特征參數(shù)提取法的研究現(xiàn)狀,主要作了以下工作:(1)MFCC提取法中利用FFT將語音信號從時域轉(zhuǎn)換到頻域,但FFT不能反映信號的瞬時變化情況。針對這種情況,本文對這一步驟進(jìn)行了改進(jìn)。Wigner-Ville分布是信號能量隨時間-頻率的分布,它能精確的定位信號的時頻結(jié)構(gòu),但多分量信號的Wigner-Ville分布受困于交叉項(xiàng)的干擾。因此利用Wigner-Ville分布的優(yōu)點(diǎn),采用Wigner-Ville譜與FFT結(jié)合來代替單獨(dú)的FFT,進(jìn)行MFCC參數(shù)提取。提出了一種基于時頻分析的MFCC參數(shù)提取法。通過實(shí)驗(yàn)仿真,驗(yàn)證了本方法既抑制了交叉項(xiàng)的干擾,又得到了精準(zhǔn)的時頻結(jié)構(gòu)。本方法與傳統(tǒng)的MFCC提取法相比,說話人識別的正確率有所提高。(2)根據(jù)語音信號的非平穩(wěn)特點(diǎn),提出了一種基于經(jīng)驗(yàn)?zāi)B(tài)分解的語音特征參數(shù)提取法。首先利用短時時域處理技術(shù)對語音進(jìn)行去清音處理,再用經(jīng)驗(yàn)?zāi)B(tài)分解方法把語音信號分解為一系列固有模態(tài)函數(shù)(IMF)。一個IMF只含有語音信號的一部分信息,不同IMF分量攜帶的特征信息不同,對這些IMFs進(jìn)行加權(quán)處理,綜合得到新的語音,再對其進(jìn)行后續(xù)處理。這樣做的目的是為了突出有效的說話人特征信息,而篩掉一些無用的、不能表征說話人特征的信息。實(shí)驗(yàn)表明,該方法比傳統(tǒng)的參數(shù)提取法更有效。(3)綜合前述方法,提出了一種基于EMD與時頻分析相結(jié)合的提取方法,即先將語音進(jìn)行EMD分解,對得到的IMF進(jìn)行加權(quán),然后用FFT與Wigner分布相結(jié)合的方法進(jìn)行MFCC參數(shù)提取。運(yùn)用到說話人識別系統(tǒng)后,實(shí)驗(yàn)結(jié)果表明,相較于前述的兩種方法,該方法大大提高了說話人識別系統(tǒng)的正確率,且魯棒性較好。(4)ASCC描述的是信號的中頻段信息,運(yùn)用EMD方法和Hilbert變換,將語音信號的中頻段(1500Hz-2500Hz)篩選出來,進(jìn)行ASCC參數(shù)提取。然后與MFCC參數(shù)組合,提出一種基于Hilbert-Huang變換的MFCC與ASCC的混合參數(shù)提取法。實(shí)驗(yàn)表明,混合參數(shù)較傳統(tǒng)的MFCC參數(shù)應(yīng)用于說話人識別系統(tǒng),正確率有一定提升。
【關(guān)鍵詞】:說話人識別 經(jīng)驗(yàn)?zāi)B(tài)分解(EMD) 特征提取 Wigner-Ville譜 FFT
【學(xué)位授予單位】:湘潭大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2015
【分類號】:TN912.34
【目錄】:
- 摘要4-5
- Abstract5-9
- 第1章 緒論9-15
- 1.1 研究背景9
- 1.2 基本原理與研究意義9-11
- 1.2.1 說話人識別的基本原理9-11
- 1.2.2 說話人識別的意義及應(yīng)用11
- 1.3 特征參數(shù)11-12
- 1.4 EMD方法12-13
- 1.4.1 概述12
- 1.4.2 研究現(xiàn)狀12-13
- 1.5 本文的主要研究內(nèi)容和章節(jié)安排13-15
- 1.5.1 主要研究內(nèi)容13
- 1.5.2 文章安排13-15
- 第2章 語音信號的處理方法15-26
- 2.1 引言15
- 2.2 時域處理15-21
- 2.2.1 短時平均能量和短時平均幅度15-17
- 2.2.2 短時過零分析17-19
- 2.2.3 短時自相關(guān)和平均幅度差函數(shù)19-21
- 2.3 時頻處理21-23
- 2.3.1 短時傅里葉變換21-22
- 2.3.2 Wigner分布22-23
- 2.4 同態(tài)處理23-25
- 2.4.1 復(fù)倒譜和倒譜24
- 2.4.2 倒譜分析與同態(tài)解卷積24-25
- 2.5 本章小結(jié)25-26
- 第3章 說話人特征參數(shù)的算法及其實(shí)現(xiàn)26-33
- 3.1 引言26
- 3.2 說話人特征參數(shù)26-29
- 3.2.1 MFCC參數(shù)26-28
- 3.2.2 ASCC參數(shù)28-29
- 3.2.3 實(shí)驗(yàn)仿真結(jié)果與分析29
- 3.3 基于時頻處理的MFCC參數(shù)提取29-31
- 3.3.1 基于Wigner分布與DFT相結(jié)合的時頻分析方法29-30
- 3.3.2 基于時頻分析的MFCC參數(shù)提取過程30-31
- 3.4 實(shí)驗(yàn)仿真與結(jié)果分析31-32
- 3.5 本章小結(jié)32-33
- 第4章 基于EMD的語音信號分解33-41
- 4.1 引言33
- 4.2 EMD分解33-37
- 4.2.1 EMD分解原理及分解的過程33-35
- 4.2.2 固有模態(tài)函數(shù)35-37
- 4.2.3 EMD端點(diǎn)效應(yīng)37
- 4.3 Hilbert變換37-40
- 4.3.1 瞬時頻率37-39
- 4.3.2 Hilbert譜與邊際譜39-40
- 4.4 本章小結(jié)40-41
- 第5章 基于EMD結(jié)合時頻分析的特征參數(shù)提取法41-50
- 5.1 引言41
- 5.2 基于EMD加權(quán)的原理41-44
- 5.2.1 IMF幅值和頻率信息42-43
- 5.2.2 權(quán)重的選擇43-44
- 5.3 基于EMD加權(quán)MFCC參數(shù)提取44-46
- 5.3.1 語音信號的去清音處理44-45
- 5.3.2 基于EMD結(jié)合時頻分析的特征提取流程圖45-46
- 5.4 基于EMD的MFCC與ASCC混合參數(shù)的提取46
- 5.5 實(shí)驗(yàn)仿真與結(jié)果分析46-48
- 5.6 本章小結(jié)48-50
- 第6章 總結(jié)與展望50-52
- 6.1 工作總結(jié)50-51
- 6.2 展望51-52
- 參考文獻(xiàn)52-56
- 致謝56-57
- 附錄A 個人簡歷、在校期間發(fā)表學(xué)術(shù)論文與研究成果57-58
- 附錄B 論文中的用圖58-60
- 附錄C 論文中的用表60
【參考文獻(xiàn)】
中國期刊全文數(shù)據(jù)庫 前1條
1 李天云,趙妍,李楠;基于EMD的Hilbert變換應(yīng)用于暫態(tài)信號分析[J];電力系統(tǒng)自動化;2005年04期
中國碩士學(xué)位論文全文數(shù)據(jù)庫 前1條
1 王京輝;語音信號處理技術(shù)研究[D];山東大學(xué);2008年
,本文編號:978195
本文鏈接:http://sikaile.net/kejilunwen/wltx/978195.html
最近更新
教材專著