一種低信噪比環(huán)境下的語音端點(diǎn)檢測(cè)算法
發(fā)布時(shí)間:2022-01-16 20:18
端點(diǎn)檢測(cè)技術(shù)是語音信號(hào)處理的關(guān)鍵技術(shù)之一,為提高低信噪比環(huán)境下端點(diǎn)檢測(cè)的準(zhǔn)確率和穩(wěn)健性,提出了一種非平穩(wěn)噪聲抑制和調(diào)制域譜減結(jié)合功率歸一化倒譜距離的端點(diǎn)檢測(cè)算法。該算法首先通過抑制非平穩(wěn)噪聲再采用調(diào)制域譜減消除殘余噪聲來提升信噪比,減少語音失真。然后再提取每幀信號(hào)的功率歸一化倒譜系數(shù),計(jì)算每幀信號(hào)與背景噪聲的功率歸一化倒譜距離。最后將該倒譜距離作為檢測(cè)參數(shù),采用雙門限判決方法進(jìn)行端點(diǎn)檢測(cè)。實(shí)驗(yàn)結(jié)果表明,該端點(diǎn)檢測(cè)算法對(duì)語音幀和噪聲幀具有較好的區(qū)分性。此外,在低信噪比環(huán)境下,所提出的算法對(duì)于不同類型的噪聲都具有較好的穩(wěn)健性。
【文章來源】:聲學(xué)技術(shù). 2020,39(05)北大核心CSCD
【文章頁數(shù)】:11 頁
【部分圖文】:
改進(jìn)的噪聲功率譜密度估計(jì)Fig.2Improvednoisepowerspectraldensityestimation
∽芎停?舫??兄翟蚺卸ǜ糜鏌艉?懈叢鈾蔡??擊噪聲,若不是則輸出含噪語音,后續(xù)算法可對(duì)其進(jìn)行消除。無需采用瞬態(tài)抑制,有效提高程序運(yùn)行速度、降低復(fù)雜度,若是則進(jìn)行瞬態(tài)噪聲抑制。1.3瞬態(tài)噪聲抑制由圖1流程圖所示總的噪聲干擾包括了背景噪聲(,)dλkl和瞬態(tài)干擾(,)tλkl,利用OM-LSA算法減小實(shí)際純凈語音和估計(jì)的純凈語音的差異,增強(qiáng)語音、抑制瞬態(tài)干擾[9]。瞬態(tài)干擾抑制的加入使得算法對(duì)鍵盤敲擊聲、敲門聲等非平穩(wěn)噪聲具有一定抑制作用,為了驗(yàn)證算法對(duì)非平穩(wěn)瞬態(tài)噪聲的抑制能力,圖3給出了信噪比為0dB的瞬態(tài)抑制前后波形圖,通過對(duì)比圖3(a)、3(b)、3(c),給出了非平穩(wěn)瞬態(tài)噪聲的一個(gè)有效估計(jì),圖3(d)中大部分瞬態(tài)沖擊噪聲被抑制,但(a)原始語音波形(b)信噪比為0dB的含噪(機(jī)械鍵盤噪聲)語音波形(c)估計(jì)的瞬態(tài)非平穩(wěn)噪聲(d)瞬態(tài)抑制后的輸出語音圖3語音增強(qiáng)前后波形對(duì)比圖Fig.3Waveformcomparisonchartbeforeandafterspeechenhancement是還存在一定的背景噪聲,后續(xù)引入調(diào)制域譜減法對(duì)其進(jìn)行消除。2調(diào)制域譜減法2.1調(diào)制域人們測(cè)試和分析信號(hào)一般通過時(shí)域和頻域來實(shí)現(xiàn)。近年來由于調(diào)頻技術(shù)的快速發(fā)展,調(diào)制域處理在語音編碼、語音識(shí)別等領(lǐng)域的應(yīng)用日益普及[10]。與頻域表示的是頻率與幅度間關(guān)系和時(shí)域表示時(shí)間和幅度間關(guān)系不同,調(diào)制域是時(shí)間和頻率之間的關(guān)系,其相互關(guān)系可表示如圖4[2]。圖4時(shí)域、頻域、調(diào)制域之間的關(guān)系Fig.4Theconnectionbetweentimedomain,frequencydomainandmodulationdomain2.2調(diào)制域譜減譜減法是一種直觀而有效的單通道降噪算法,但在低能量語音區(qū)域做譜減處理時(shí)會(huì)引入音樂噪聲,為了解決上述問題,Paliway等[6]在2010年?
氐悖?岫雜鏌粼斐杉?蟮母扇擰R虼頌岣咚惴?在復(fù)雜環(huán)境中的穩(wěn)健性具有廣泛的研究意義。1.1瞬態(tài)PSD估計(jì)利用語音、瞬態(tài)噪聲、背景噪聲的不同變化率,引入一個(gè)可跟蹤瞬態(tài)信號(hào)快速變化的最優(yōu)改進(jìn)對(duì)數(shù)譜幅度估計(jì)(Optimally-ModifiedLog-SpectralAmplitudeEstimator,OM-LSA)算法[8],通過分配一個(gè)較小的平滑參數(shù)來調(diào)整OM-LSA的噪聲PSD估計(jì)分量,以跟蹤輸入信號(hào)頻譜的瞬態(tài)變化。假設(shè)x(n)為語音信號(hào),d(n)為加性平穩(wěn)噪聲、t(n)為瞬態(tài)噪聲,被測(cè)信號(hào)y(n)表示如下:y(n)=x(n)+d(n)+t(n)(1)算法整體的流程圖如圖1所示。信號(hào)經(jīng)過加窗、快速傅里葉變換(FastFourierTransform,FFT)后可實(shí)現(xiàn)短時(shí)傅里葉變換(ShortTimeFourierTransform,SFFT),然后對(duì)最小控制遞歸平均(MinimaControlledRecursiveAveraging,MCRA)的平滑參數(shù)進(jìn)行調(diào)整再加入反因果窗區(qū)分瞬態(tài),可為修正的OM-LSA算法提供準(zhǔn)確的噪聲PSD估計(jì)。圖2為改進(jìn)的噪聲PSD估計(jì)算法流程圖,虛線框圖為調(diào)整部分,具體改進(jìn)如下:圖1瞬態(tài)噪聲抑制原理圖Fig.1Principlediagramoftransientnoisesuppression(1)平滑處理y(n)由瞬態(tài)分量和非瞬態(tài)分量(語音和噪聲)構(gòu)成,利用上述算法估計(jì)非瞬態(tài)分量的PSD,圖中Y、X分別表示含噪語音在時(shí)頻域做短時(shí)傅里葉變換的幅度值以及測(cè)量信號(hào)Y的估計(jì)值,、tdλλ則為瞬態(tài)噪聲的功率譜估計(jì)值以及平穩(wěn)噪聲信號(hào)的功率譜估計(jì)值,噪聲信號(hào)功率譜估計(jì)基于一個(gè)對(duì)頻譜幅度進(jìn)行時(shí)間遞歸平均獲得的周期圖,其中當(dāng)前幀含噪語音的功率譜S(k,l)可表示為2(,)(,1)+(1)(,)ssSkl=αSkl--αYkl(2)為了更快跟蹤采用一個(gè)較小的平滑參數(shù)sα,其值越低,對(duì)當(dāng)前時(shí)間的估計(jì)越準(zhǔn)確,瞬態(tài)信號(hào)能迅速被捕捉到,通過實(shí)驗(yàn)將其從0.9~0
【參考文獻(xiàn)】:
期刊論文
[1]低信噪比環(huán)境下語音端點(diǎn)檢測(cè)改進(jìn)方法[J]. 王瑤,曾慶寧,龍超,謝先明,毛維. 聲學(xué)技術(shù). 2018(05)
[2]基于多特征融合與動(dòng)態(tài)閾值的語音端點(diǎn)檢測(cè)方法[J]. 朱春利,李昕. 計(jì)算機(jī)工程. 2019(02)
[3]低信噪比下語音端點(diǎn)檢測(cè)算法的改進(jìn)研究[J]. 王群,曾慶寧,鄭展恒. 科學(xué)技術(shù)與工程. 2017(21)
[4]基于調(diào)制域譜減法的魯棒性說話人識(shí)別[J]. 程小偉,王健,曾慶寧,謝先明,龍超. 科學(xué)技術(shù)與工程. 2017(03)
[5]基于自適應(yīng)倒譜距離的強(qiáng)噪聲語音端點(diǎn)檢測(cè)[J]. 趙新燕,王煉紅,彭林哲. 計(jì)算機(jī)科學(xué). 2015(09)
[6]結(jié)合相位譜補(bǔ)償?shù)恼{(diào)制域譜減法[J]. 陳紫強(qiáng),李欣陽,謝躍雷. 信號(hào)處理. 2015(04)
[7]基于Mel倒譜特征順序統(tǒng)計(jì)濾波的語音端點(diǎn)檢測(cè)算法[J]. 陳振鋒,吳蔚瀾,劉加,夏善紅. 中國科學(xué)院大學(xué)學(xué)報(bào). 2014(04)
[8]強(qiáng)噪聲環(huán)境下改進(jìn)的語音端點(diǎn)檢測(cè)算法[J]. 魯遠(yuǎn)耀,周妮,肖珂,葉青. 計(jì)算機(jī)應(yīng)用. 2014(05)
[9]基于改進(jìn)PNCC特征和兩步區(qū)分性訓(xùn)練的錄音設(shè)備識(shí)別方法[J]. 賀前華,王志鋒,Alexander I Rudnicky,朱錚宇,李新超. 電子學(xué)報(bào). 2014(01)
[10]基于臨界帶功率譜方差的端點(diǎn)檢測(cè)[J]. 張春雷,曾向陽,王曙光. 聲學(xué)技術(shù). 2012(02)
碩士論文
[1]基于小波和PNCC特征參數(shù)的語音識(shí)別技術(shù)研究[D]. 張子濤.重慶大學(xué) 2018
本文編號(hào):3593352
【文章來源】:聲學(xué)技術(shù). 2020,39(05)北大核心CSCD
【文章頁數(shù)】:11 頁
【部分圖文】:
改進(jìn)的噪聲功率譜密度估計(jì)Fig.2Improvednoisepowerspectraldensityestimation
∽芎停?舫??兄翟蚺卸ǜ糜鏌艉?懈叢鈾蔡??擊噪聲,若不是則輸出含噪語音,后續(xù)算法可對(duì)其進(jìn)行消除。無需采用瞬態(tài)抑制,有效提高程序運(yùn)行速度、降低復(fù)雜度,若是則進(jìn)行瞬態(tài)噪聲抑制。1.3瞬態(tài)噪聲抑制由圖1流程圖所示總的噪聲干擾包括了背景噪聲(,)dλkl和瞬態(tài)干擾(,)tλkl,利用OM-LSA算法減小實(shí)際純凈語音和估計(jì)的純凈語音的差異,增強(qiáng)語音、抑制瞬態(tài)干擾[9]。瞬態(tài)干擾抑制的加入使得算法對(duì)鍵盤敲擊聲、敲門聲等非平穩(wěn)噪聲具有一定抑制作用,為了驗(yàn)證算法對(duì)非平穩(wěn)瞬態(tài)噪聲的抑制能力,圖3給出了信噪比為0dB的瞬態(tài)抑制前后波形圖,通過對(duì)比圖3(a)、3(b)、3(c),給出了非平穩(wěn)瞬態(tài)噪聲的一個(gè)有效估計(jì),圖3(d)中大部分瞬態(tài)沖擊噪聲被抑制,但(a)原始語音波形(b)信噪比為0dB的含噪(機(jī)械鍵盤噪聲)語音波形(c)估計(jì)的瞬態(tài)非平穩(wěn)噪聲(d)瞬態(tài)抑制后的輸出語音圖3語音增強(qiáng)前后波形對(duì)比圖Fig.3Waveformcomparisonchartbeforeandafterspeechenhancement是還存在一定的背景噪聲,后續(xù)引入調(diào)制域譜減法對(duì)其進(jìn)行消除。2調(diào)制域譜減法2.1調(diào)制域人們測(cè)試和分析信號(hào)一般通過時(shí)域和頻域來實(shí)現(xiàn)。近年來由于調(diào)頻技術(shù)的快速發(fā)展,調(diào)制域處理在語音編碼、語音識(shí)別等領(lǐng)域的應(yīng)用日益普及[10]。與頻域表示的是頻率與幅度間關(guān)系和時(shí)域表示時(shí)間和幅度間關(guān)系不同,調(diào)制域是時(shí)間和頻率之間的關(guān)系,其相互關(guān)系可表示如圖4[2]。圖4時(shí)域、頻域、調(diào)制域之間的關(guān)系Fig.4Theconnectionbetweentimedomain,frequencydomainandmodulationdomain2.2調(diào)制域譜減譜減法是一種直觀而有效的單通道降噪算法,但在低能量語音區(qū)域做譜減處理時(shí)會(huì)引入音樂噪聲,為了解決上述問題,Paliway等[6]在2010年?
氐悖?岫雜鏌粼斐杉?蟮母扇擰R虼頌岣咚惴?在復(fù)雜環(huán)境中的穩(wěn)健性具有廣泛的研究意義。1.1瞬態(tài)PSD估計(jì)利用語音、瞬態(tài)噪聲、背景噪聲的不同變化率,引入一個(gè)可跟蹤瞬態(tài)信號(hào)快速變化的最優(yōu)改進(jìn)對(duì)數(shù)譜幅度估計(jì)(Optimally-ModifiedLog-SpectralAmplitudeEstimator,OM-LSA)算法[8],通過分配一個(gè)較小的平滑參數(shù)來調(diào)整OM-LSA的噪聲PSD估計(jì)分量,以跟蹤輸入信號(hào)頻譜的瞬態(tài)變化。假設(shè)x(n)為語音信號(hào),d(n)為加性平穩(wěn)噪聲、t(n)為瞬態(tài)噪聲,被測(cè)信號(hào)y(n)表示如下:y(n)=x(n)+d(n)+t(n)(1)算法整體的流程圖如圖1所示。信號(hào)經(jīng)過加窗、快速傅里葉變換(FastFourierTransform,FFT)后可實(shí)現(xiàn)短時(shí)傅里葉變換(ShortTimeFourierTransform,SFFT),然后對(duì)最小控制遞歸平均(MinimaControlledRecursiveAveraging,MCRA)的平滑參數(shù)進(jìn)行調(diào)整再加入反因果窗區(qū)分瞬態(tài),可為修正的OM-LSA算法提供準(zhǔn)確的噪聲PSD估計(jì)。圖2為改進(jìn)的噪聲PSD估計(jì)算法流程圖,虛線框圖為調(diào)整部分,具體改進(jìn)如下:圖1瞬態(tài)噪聲抑制原理圖Fig.1Principlediagramoftransientnoisesuppression(1)平滑處理y(n)由瞬態(tài)分量和非瞬態(tài)分量(語音和噪聲)構(gòu)成,利用上述算法估計(jì)非瞬態(tài)分量的PSD,圖中Y、X分別表示含噪語音在時(shí)頻域做短時(shí)傅里葉變換的幅度值以及測(cè)量信號(hào)Y的估計(jì)值,、tdλλ則為瞬態(tài)噪聲的功率譜估計(jì)值以及平穩(wěn)噪聲信號(hào)的功率譜估計(jì)值,噪聲信號(hào)功率譜估計(jì)基于一個(gè)對(duì)頻譜幅度進(jìn)行時(shí)間遞歸平均獲得的周期圖,其中當(dāng)前幀含噪語音的功率譜S(k,l)可表示為2(,)(,1)+(1)(,)ssSkl=αSkl--αYkl(2)為了更快跟蹤采用一個(gè)較小的平滑參數(shù)sα,其值越低,對(duì)當(dāng)前時(shí)間的估計(jì)越準(zhǔn)確,瞬態(tài)信號(hào)能迅速被捕捉到,通過實(shí)驗(yàn)將其從0.9~0
【參考文獻(xiàn)】:
期刊論文
[1]低信噪比環(huán)境下語音端點(diǎn)檢測(cè)改進(jìn)方法[J]. 王瑤,曾慶寧,龍超,謝先明,毛維. 聲學(xué)技術(shù). 2018(05)
[2]基于多特征融合與動(dòng)態(tài)閾值的語音端點(diǎn)檢測(cè)方法[J]. 朱春利,李昕. 計(jì)算機(jī)工程. 2019(02)
[3]低信噪比下語音端點(diǎn)檢測(cè)算法的改進(jìn)研究[J]. 王群,曾慶寧,鄭展恒. 科學(xué)技術(shù)與工程. 2017(21)
[4]基于調(diào)制域譜減法的魯棒性說話人識(shí)別[J]. 程小偉,王健,曾慶寧,謝先明,龍超. 科學(xué)技術(shù)與工程. 2017(03)
[5]基于自適應(yīng)倒譜距離的強(qiáng)噪聲語音端點(diǎn)檢測(cè)[J]. 趙新燕,王煉紅,彭林哲. 計(jì)算機(jī)科學(xué). 2015(09)
[6]結(jié)合相位譜補(bǔ)償?shù)恼{(diào)制域譜減法[J]. 陳紫強(qiáng),李欣陽,謝躍雷. 信號(hào)處理. 2015(04)
[7]基于Mel倒譜特征順序統(tǒng)計(jì)濾波的語音端點(diǎn)檢測(cè)算法[J]. 陳振鋒,吳蔚瀾,劉加,夏善紅. 中國科學(xué)院大學(xué)學(xué)報(bào). 2014(04)
[8]強(qiáng)噪聲環(huán)境下改進(jìn)的語音端點(diǎn)檢測(cè)算法[J]. 魯遠(yuǎn)耀,周妮,肖珂,葉青. 計(jì)算機(jī)應(yīng)用. 2014(05)
[9]基于改進(jìn)PNCC特征和兩步區(qū)分性訓(xùn)練的錄音設(shè)備識(shí)別方法[J]. 賀前華,王志鋒,Alexander I Rudnicky,朱錚宇,李新超. 電子學(xué)報(bào). 2014(01)
[10]基于臨界帶功率譜方差的端點(diǎn)檢測(cè)[J]. 張春雷,曾向陽,王曙光. 聲學(xué)技術(shù). 2012(02)
碩士論文
[1]基于小波和PNCC特征參數(shù)的語音識(shí)別技術(shù)研究[D]. 張子濤.重慶大學(xué) 2018
本文編號(hào):3593352
本文鏈接:http://sikaile.net/kejilunwen/xinxigongchenglunwen/3593352.html
最近更新
教材專著