噪聲環(huán)境下說話人識別的魯棒性研究
發(fā)布時間:2020-12-17 21:06
說話人識別,又稱為聲紋識別,是一種基于說話人聲音中特征信息自動識別或驗證說話人身份的技術(shù)。說話人識別技術(shù)能夠讓服務(wù)系統(tǒng)通過語音來控制用戶對受限的服務(wù)(如自動銀行服務(wù))、信息資源(取決于用戶的訪問權(quán)限)或區(qū)域(如政府或研究機構(gòu))的訪問權(quán)限。此外,還可以用于說話人的檢測,如音頻檔案中基于語音的信息檢索、識別犯罪者的取證分析及用戶設(shè)備的個性化。經(jīng)過多年的研究,目前的說話人識別系統(tǒng)取得了相當(dāng)令人滿意的成績。但是,系統(tǒng)在實際應(yīng)用環(huán)境下的噪聲魯棒性問題仍亟待解決,這也是說話人識別技術(shù)走向日常應(yīng)用的一大障礙。本文針對該問題做了以下研究:首先,分析了經(jīng)過主成分分析處理的伽馬通頻率倒譜系數(shù)特征應(yīng)用到說話人識別中的噪聲魯棒性。在white、babble和destroyerops不同信噪比的噪聲環(huán)境下,與梅爾頻率倒譜系數(shù)特征的系統(tǒng)性能做了全面的分析和比較。此外,將主成分分析算法用于伽馬通頻率倒譜系數(shù)的預(yù)處理中,并且對處理后的伽馬通頻率倒譜系數(shù)的性能做了實驗分析。實驗結(jié)果表明,主成分分析在一定程度上提高了伽馬通頻率倒譜系數(shù)在低信噪比條件下的系統(tǒng)表現(xiàn)。隨后,對目前在各類評測中表現(xiàn)突出的i-vector/PLDA...
【文章來源】:南京郵電大學(xué)江蘇省
【文章頁數(shù)】:75 頁
【學(xué)位級別】:碩士
【部分圖文】:
Mel濾波器組頻譜圖
南京郵電大學(xué)專業(yè)學(xué)位碩士研究生學(xué)位論文 第三章 基于 GFCC 和 PCA 的說話人識別1 2( ) cos(2 )n btcg t at e f t 其中,cf 為濾波器的中心頻率; 表示相位偏移,通常取 0; a 為增益常數(shù)器階數(shù),通常 n 4;b 表示衰減因子,由以下公式給出: 1. 019*24.7*(4.37*1000 1)cb f多個不同中心頻率的 Gammatone 濾波器構(gòu)成一個濾波器組。和基于快速傅時頻譜分析類似,利用該濾波器組可以獲得原始信號在不同頻率分量上的特征學(xué)上,可以用等效矩陣帶寬來度量每個濾波器的帶寬:( ) 24.7 (4 .37/1000 1)ccERB ff其中,Q為漸進因子,通常取值為 9.26449;0B 為最小帶寬,通常設(shè)為 24.7Hz
【參考文獻(xiàn)】:
期刊論文
[1]《機器學(xué)習(xí)》[J]. 周志華. 中國民商. 2016(03)
[2]語音識別中聽覺特征的噪聲魯棒性分析[J]. 李銀國,歐陽希子,鄭方. 清華大學(xué)學(xué)報(自然科學(xué)版). 2013(08)
[3]基于MDT特征補償?shù)脑肼曯敯粽Z音識別算法[J]. 胡旭琰,鄒月嫻,王文敏. 清華大學(xué)學(xué)報(自然科學(xué)版). 2013(06)
[4]結(jié)合譜減和缺失特征重建的魯棒性話者識別[J]. 王寧,陸偉,戴蓓蒨,李輝. 數(shù)據(jù)采集與處理. 2009(02)
本文編號:2922708
【文章來源】:南京郵電大學(xué)江蘇省
【文章頁數(shù)】:75 頁
【學(xué)位級別】:碩士
【部分圖文】:
Mel濾波器組頻譜圖
南京郵電大學(xué)專業(yè)學(xué)位碩士研究生學(xué)位論文 第三章 基于 GFCC 和 PCA 的說話人識別1 2( ) cos(2 )n btcg t at e f t 其中,cf 為濾波器的中心頻率; 表示相位偏移,通常取 0; a 為增益常數(shù)器階數(shù),通常 n 4;b 表示衰減因子,由以下公式給出: 1. 019*24.7*(4.37*1000 1)cb f多個不同中心頻率的 Gammatone 濾波器構(gòu)成一個濾波器組。和基于快速傅時頻譜分析類似,利用該濾波器組可以獲得原始信號在不同頻率分量上的特征學(xué)上,可以用等效矩陣帶寬來度量每個濾波器的帶寬:( ) 24.7 (4 .37/1000 1)ccERB ff其中,Q為漸進因子,通常取值為 9.26449;0B 為最小帶寬,通常設(shè)為 24.7Hz
【參考文獻(xiàn)】:
期刊論文
[1]《機器學(xué)習(xí)》[J]. 周志華. 中國民商. 2016(03)
[2]語音識別中聽覺特征的噪聲魯棒性分析[J]. 李銀國,歐陽希子,鄭方. 清華大學(xué)學(xué)報(自然科學(xué)版). 2013(08)
[3]基于MDT特征補償?shù)脑肼曯敯粽Z音識別算法[J]. 胡旭琰,鄒月嫻,王文敏. 清華大學(xué)學(xué)報(自然科學(xué)版). 2013(06)
[4]結(jié)合譜減和缺失特征重建的魯棒性話者識別[J]. 王寧,陸偉,戴蓓蒨,李輝. 數(shù)據(jù)采集與處理. 2009(02)
本文編號:2922708
本文鏈接:http://sikaile.net/kejilunwen/wltx/2922708.html
最近更新
教材專著