稀疏表示及區(qū)分性聯(lián)合字典學(xué)習(xí)語音降噪算法
發(fā)布時(shí)間:2021-01-26 13:49
經(jīng)過傳統(tǒng)的聯(lián)合字典學(xué)習(xí)算法所訓(xùn)練出來的語音字典會(huì)與相同算法下訓(xùn)練出來的噪聲字典之間形成相互干擾,殘留的噪聲以及波形失真都是降噪之后的語音容易產(chǎn)生的問題.針對(duì)這一問題,提出一種新的算法,其基于稀疏表示及區(qū)分性聯(lián)合字典學(xué)習(xí).為確保信號(hào)能夠在其對(duì)應(yīng)子字典上進(jìn)行正確稀疏表示,在字典的學(xué)習(xí)階段,這個(gè)算法添加了字典區(qū)分約束項(xiàng).最后利用基于區(qū)分性聯(lián)合字典得到的稀疏表示系數(shù)對(duì)純凈語音進(jìn)行估計(jì),有效避免了語音失真,獲得了更好的語音降噪效果.相比于傳統(tǒng)算法,實(shí)驗(yàn)結(jié)果表明,所提算法在兩種評(píng)測(cè)方式下均獲得了最優(yōu)的評(píng)價(jià)結(jié)果.
【文章來源】:小型微型計(jì)算機(jī)系統(tǒng). 2020,41(05)北大核心
【文章頁數(shù)】:5 頁
【部分圖文】:
平均表示誤差
圖1 平均表示誤差實(shí)驗(yàn)結(jié)果表明,兩種算法都具有優(yōu)越的性能,大約經(jīng)過15次迭代,兩種算法就都能讓原始字典中的大多數(shù)原子恢復(fù),隨著迭代次數(shù)的增加,這兩種算法下的平均表示誤差均呈現(xiàn)遞減的趨勢(shì),并最終都保持在0.1以下.從整個(gè)迭代過程來看,D-Sparse K-SVD算法的相對(duì)誤差和收斂速度都優(yōu)于K-SVD算法.
圖3為本文提出的稀疏表示及區(qū)分性聯(lián)合字典學(xué)習(xí)語音降噪算法的具體流程.首先,利用D-Sparse K-SVD算法得到初始字典D(0),在誤差還未達(dá)到收斂條件或者迭代次數(shù)之前,持續(xù)進(jìn)行稀疏分解與字典更新.在稀疏分解的過程中,重復(fù)稀疏分解和字典更新,直到誤差達(dá)到收斂條件或迭代次數(shù).LARC算法用于執(zhí)行在先前迭代中由訓(xùn)練樣本獲得的字典的稀疏分解以獲得稀疏系數(shù),在字典更新中利用L-BFGS算法優(yōu)化目標(biāo)函數(shù),得到更新后的聯(lián)合字典D(由純凈語音字典DS和噪聲字典DN組成).然后基于區(qū)分性聯(lián)合字典D,采用LARC算法對(duì)帶噪語音Y進(jìn)行稀疏表示,得到稀疏系數(shù)矩陣C,C=[CS;CN].估計(jì)的純凈語音幅度譜可以用^S=DS×CS來表示,將得到的^S乘上帶噪語音的相位,然后通過逆短時(shí)傅里葉變換恢復(fù)出純凈語音信號(hào).
【參考文獻(xiàn)】:
期刊論文
[1]改進(jìn)譜減法語音增強(qiáng)研究[J]. 屈曉旭,李朝輝,婁景藝. 通信技術(shù). 2017(09)
[2]基于自適應(yīng)逼近殘差的稀疏表示語音降噪方法[J]. 周偉力,賀前華,王亞樓,龐文豐. 電子與信息學(xué)報(bào). 2017(02)
博士論文
[1]復(fù)雜場(chǎng)景下基于深度學(xué)習(xí)的魯棒性語音識(shí)別的研究[D]. 屠彥輝.中國科學(xué)技術(shù)大學(xué) 2019
本文編號(hào):3001223
【文章來源】:小型微型計(jì)算機(jī)系統(tǒng). 2020,41(05)北大核心
【文章頁數(shù)】:5 頁
【部分圖文】:
平均表示誤差
圖1 平均表示誤差實(shí)驗(yàn)結(jié)果表明,兩種算法都具有優(yōu)越的性能,大約經(jīng)過15次迭代,兩種算法就都能讓原始字典中的大多數(shù)原子恢復(fù),隨著迭代次數(shù)的增加,這兩種算法下的平均表示誤差均呈現(xiàn)遞減的趨勢(shì),并最終都保持在0.1以下.從整個(gè)迭代過程來看,D-Sparse K-SVD算法的相對(duì)誤差和收斂速度都優(yōu)于K-SVD算法.
圖3為本文提出的稀疏表示及區(qū)分性聯(lián)合字典學(xué)習(xí)語音降噪算法的具體流程.首先,利用D-Sparse K-SVD算法得到初始字典D(0),在誤差還未達(dá)到收斂條件或者迭代次數(shù)之前,持續(xù)進(jìn)行稀疏分解與字典更新.在稀疏分解的過程中,重復(fù)稀疏分解和字典更新,直到誤差達(dá)到收斂條件或迭代次數(shù).LARC算法用于執(zhí)行在先前迭代中由訓(xùn)練樣本獲得的字典的稀疏分解以獲得稀疏系數(shù),在字典更新中利用L-BFGS算法優(yōu)化目標(biāo)函數(shù),得到更新后的聯(lián)合字典D(由純凈語音字典DS和噪聲字典DN組成).然后基于區(qū)分性聯(lián)合字典D,采用LARC算法對(duì)帶噪語音Y進(jìn)行稀疏表示,得到稀疏系數(shù)矩陣C,C=[CS;CN].估計(jì)的純凈語音幅度譜可以用^S=DS×CS來表示,將得到的^S乘上帶噪語音的相位,然后通過逆短時(shí)傅里葉變換恢復(fù)出純凈語音信號(hào).
【參考文獻(xiàn)】:
期刊論文
[1]改進(jìn)譜減法語音增強(qiáng)研究[J]. 屈曉旭,李朝輝,婁景藝. 通信技術(shù). 2017(09)
[2]基于自適應(yīng)逼近殘差的稀疏表示語音降噪方法[J]. 周偉力,賀前華,王亞樓,龐文豐. 電子與信息學(xué)報(bào). 2017(02)
博士論文
[1]復(fù)雜場(chǎng)景下基于深度學(xué)習(xí)的魯棒性語音識(shí)別的研究[D]. 屠彥輝.中國科學(xué)技術(shù)大學(xué) 2019
本文編號(hào):3001223
本文鏈接:http://sikaile.net/kejilunwen/xinxigongchenglunwen/3001223.html
最近更新
教材專著