噪聲環(huán)境下的說話人識別技術(shù)
發(fā)布時間:2017-05-25 18:21
本文關(guān)鍵詞:噪聲環(huán)境下的說話人識別技術(shù),由筆耕文化傳播整理發(fā)布。
【摘要】:語音是人與人之間交流最直接且最有效的途徑之一。語音在承載信息的同時,還包含了說話人的個性特征。說話人識別技術(shù)就是依據(jù)語音信號中能夠代表說話人個性特征的參數(shù)來識別話者身份的技術(shù)。在過去的幾十年里,說話人識別技術(shù)取得了很大的發(fā)展和進步。而阻礙說話人識別技術(shù)進一步走向?qū)嵱玫闹饕系K,則是各種實際應(yīng)用場景中的噪聲。這些噪聲極大地降低了系統(tǒng)的識別性能,影響了說話人識別技術(shù)的應(yīng)用和推廣。本文主要研究了在噪聲環(huán)境下的說話人識別問題。論文主要對端點檢測、信號空間的抗噪技術(shù)、特征空間的抗噪技術(shù)等方面進行了研究。本文主要研究工作包括以下幾個方面:(1)低信噪比下的端點檢測技術(shù)研究,首先介紹了在噪聲環(huán)境下表現(xiàn)效果較好的兩種端點檢測方法:基于C0復(fù)雜度的端點檢測算法、基于MFCC相似度的端點檢測算法;然后在二者的基礎(chǔ)上研究了一種新的端點檢測算法:基于改進C0復(fù)雜度和MFCC相似度相結(jié)合的端點檢測算法;最后對三種端點檢測算法進行實驗分析,證明了改進算法性能優(yōu)良、穩(wěn)定性更高。(2)信號空間的抗噪技術(shù)研究,首先介紹了常規(guī)的信號空間抗噪方法:譜減法、維納濾波法、基于先驗信噪比的維納濾波法;然后在先驗信噪比的維納濾波法基礎(chǔ)上增加端點檢測環(huán)節(jié):將基于MFCC相似度的端點檢測融入到維納濾波法中;最后對幾種算法在不同信噪比環(huán)境下進行對比實驗,驗證了改進算法的識別性能。(3)特征空間的抗噪技術(shù)研究,首先介紹了幾種常用的魯棒性特征:梅爾頻率倒譜系數(shù)及感知線性預(yù)測系數(shù),并對上述兩種特征分別進行改進;然后,對改進后的兩個特征進行融合;最后,對改進前后的幾種特征參數(shù)做對比實驗,驗證了新的特征參數(shù)具有更高的識別性能。
【關(guān)鍵詞】:說話人識別 端點檢測 去噪技術(shù) 感知線性預(yù)測 梅爾頻率倒譜系數(shù)
【學(xué)位授予單位】:南京理工大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2015
【分類號】:TN912.34
【目錄】:
- 摘要3-4
- Abstract4-9
- 1 緒論9-19
- 1.1 引言9
- 1.2 研究背景與意義9-11
- 1.3 說話人識別的發(fā)展11-12
- 1.4 說話人識別系統(tǒng)概述12-15
- 1.4.1 說話人識別的分類和基本組成12-13
- 1.4.2 說話人識別的特征選取13-14
- 1.4.3 說話人識別的主要方法14-15
- 1.5 噪聲環(huán)境下的說話人識別研究現(xiàn)狀及難點15-18
- 1.5.1 噪聲的分類及影響16
- 1.5.2 噪聲環(huán)境下說話人識別的基本方法16-18
- 1.5.3 噪聲環(huán)境下的研究難點18
- 1.6 本文的組織結(jié)構(gòu)安排18-19
- 2 說話人識別基本原理19-34
- 2.1 語音信號預(yù)處理19-24
- 2.1.1 語音信號的預(yù)加重19-20
- 2.1.2 語音信號的分幀和加窗20-22
- 2.1.3 語音信號的端點檢測22-24
- 2.2 語音信號特征參數(shù)的提取24-30
- 2.2.1 線性預(yù)測系數(shù)LPC25-26
- 2.2.2 線性預(yù)測倒譜系數(shù)LPCC26-27
- 2.2.3 梅爾頻率倒譜系數(shù)MFCC27-28
- 2.2.4 感知線性預(yù)測倒譜系數(shù)PLPC28-30
- 2.3 高斯混合模型GMM30-33
- 2.3.1 GMM模型的基本概念30-31
- 2.3.2 GMM模型的參數(shù)估計31-32
- 2.3.3 GMM模型參數(shù)初始化32
- 2.3.4 GMM模型的識別問題32-33
- 2.4 本章小結(jié)33-34
- 3 語音信號的端點檢測技術(shù)及其改進34-41
- 3.1 基于CO復(fù)雜度的端點檢測34-35
- 3.2 基于MFCC相似度的端點檢測35-36
- 3.3 基于改進C0復(fù)雜度和MFCC相似度相結(jié)合的端點檢測36
- 3.4 三種端點檢測算法的對比實驗36-40
- 3.4.1 實驗準備36
- 3.4.2 實驗結(jié)果分析36-40
- 3.4.3 實驗小結(jié)40
- 3.5 本章小結(jié)40-41
- 4 信號空間抗噪技術(shù)的改進及對識別性能的影響41-56
- 4.1 譜減法41-43
- 4.1.1 基本譜減法41-42
- 4.1.2 基本譜減法的改進42-43
- 4.2 維納濾波法43-45
- 4.2.1 傳統(tǒng)的維納濾波法43-44
- 4.2.2 基于先驗信噪比估計的維納濾波法44-45
- 4.3 改進的維納濾波法45-46
- 4.4 語音增強方法的性能評價標準46-47
- 4.4.1 信噪比46-47
- 4.4.2 失真測度47
- 4.5 語音增強算法的抗噪性能對比試驗47-52
- 4.5.1 實驗準備47
- 4.5.2 實驗分析47-52
- 4.5.3 實驗小結(jié)52
- 4.6 語音增強算法的識別性能對比實驗52-55
- 4.6.1 實驗準備53
- 4.6.2 實驗分析53-54
- 4.6.3 實驗小結(jié)54-55
- 4.7 本章小結(jié)55-56
- 5 特征空間抗噪技術(shù)的改進及對識別性能的影響56-64
- 5.1 梅爾頻率倒譜系數(shù)的相關(guān)參數(shù)及改進56-58
- 5.1.1 MFCC參數(shù)56
- 5.1.2 MFCC參數(shù)的擴展及改進56-58
- 5.2 PLPC參數(shù)的擴展及改進58-60
- 5.2.1 感知線性預(yù)測系數(shù)PLPC58
- 5.2.2 感知對數(shù)面積比PLAR58-60
- 5.2.3 改進的感知對數(shù)面積比mPLAR60
- 5.3 mMFCC_D_D與mPLAR的特征融合60-62
- 5.3.1 串行特征融合61
- 5.3.2 主成份分析(PCA)61-62
- 5.4 特征參數(shù)的識別性能對比實驗62-63
- 5.4.1 實驗準備62
- 5.4.2 說話人識別率對比分析62-63
- 5.4.3 實驗小結(jié)63
- 5.5 本章小結(jié)63-64
- 6 總結(jié)及展望64-65
- 致謝65-66
- 參考文獻66-69
- 附錄69
【參考文獻】
中國期刊全文數(shù)據(jù)庫 前1條
1 李曄;崔慧娟;唐昆;;基于譜減的語音增強算法的改進[J];清華大學(xué)學(xué)報(自然科學(xué)版);2006年10期
中國博士學(xué)位論文全文數(shù)據(jù)庫 前1條
1 陳凌輝;說話人轉(zhuǎn)換建模方法研究[D];中國科學(xué)技術(shù)大學(xué);2013年
中國碩士學(xué)位論文全文數(shù)據(jù)庫 前2條
1 唐娜娜;基于穩(wěn)健性PLPC的抗噪語音識別方法的研究[D];遼寧大學(xué);2011年
2 劉明娟;基于改進的特征參數(shù)的說話人識別研究[D];東北大學(xué);2010年
本文關(guān)鍵詞:噪聲環(huán)境下的說話人識別技術(shù),由筆耕文化傳播整理發(fā)布。
,本文編號:394631
本文鏈接:http://sikaile.net/kejilunwen/wltx/394631.html
最近更新
教材專著