噪聲環(huán)境下魯棒語音識別技術(shù)的研究
發(fā)布時間:2024-02-28 18:31
語音交流是人類最方便的交流方式。隨著科技的發(fā)展,以語音識別技術(shù)為核心的人機(jī)交互方式日益流行起來。經(jīng)過六十多年的發(fā)展,語音識別技術(shù)已經(jīng)有了極大的提升,在安靜環(huán)境下,語音識別系統(tǒng)的性能接近人類水平,而在有噪聲干擾的情況下,語音識別系統(tǒng)的識別準(zhǔn)確率大打折扣。在噪聲環(huán)境下提高語音識別系統(tǒng)的魯棒性已經(jīng)成為語音識別技術(shù)投入大規(guī)模使用的關(guān)鍵之一。本文主要針對噪聲環(huán)境下語音識別系統(tǒng)性能下降的情況,使用語音增強(qiáng)算法對輸入語音進(jìn)行降噪處理,提升輸入語音的質(zhì)量以提高語音識別系統(tǒng)的魯棒性。而傳統(tǒng)意義上的語音增強(qiáng)算法會使語音產(chǎn)生畸變和失真,因此需要針對自動語音識別系統(tǒng)的特性對語音增強(qiáng)算法進(jìn)行改進(jìn)。本文主要的工作有:(1)研究了基于人耳聽覺掩蔽效應(yīng)和諧波恢復(fù)原理的改進(jìn)維納濾波算法。首先研究了人耳的聽覺掩蔽效應(yīng),并對掩蔽閾值的求解方法進(jìn)行了介紹,其次對最小值統(tǒng)計(jì)噪聲估計(jì)(Minimum Stasistics,MS)算法和基于最小值約束的遞歸平均噪聲估計(jì)方法(Minima-Controlled Recrsive Average,MCRA)進(jìn)行了研究,然后提出改進(jìn)方案,第一步,結(jié)合掩蔽閾值調(diào)整噪聲能量譜的估計(jì);第二步,...
【文章頁數(shù)】:94 頁
【學(xué)位級別】:碩士
【部分圖文】:
本文編號:3913859
【文章頁數(shù)】:94 頁
【學(xué)位級別】:碩士
【部分圖文】:
圖1–3DNN,GMM系統(tǒng)在訓(xùn)練和測試的SNR失配時的性能下降Fig1–3PerformancedegradationofDNN,GMMsystemwhenSNRbetweentrainingandtestingmismatch
圖1–3DNN,GMM系統(tǒng)在訓(xùn)練和測試的SNR失配時的性能下降erformancedegradationofDNN,GMMsystemwhenSNRbetweentrainingandtesti復(fù)雜場景、噪聲環(huán)境下的魯棒語音識別已經(jīng)成為了語音識別領(lǐng)域....
圖2-1語音信號產(chǎn)生原理圖
11圖2-1語音信號產(chǎn)生原理圖為兩種激勵討論,濁音激勵和清音激
圖2-7DNN-HMM聲學(xué)模型示意圖
圖2-7DNN-HMM聲學(xué)模型示意圖介紹
圖3-11kHz出人耳的掩蔽效應(yīng)
圖3-11kHz出人耳的掩蔽效應(yīng)值計(jì)算能夠應(yīng)用到實(shí)際語音信號處理過程中去,那么必須求
本文編號:3913859
本文鏈接:http://sikaile.net/kejilunwen/wltx/3913859.html
最近更新
教材專著