基于稀疏表示與聯(lián)合字典學習的語音增強
發(fā)布時間:2020-12-09 11:19
語音是人類進行語言交流與信息傳播的重要媒介。然而,在現(xiàn)實生活中,語音信號不可避免地會被各種類型的噪聲所污染。被污染的語音嚴重影響了語音交流的質量,同時還會使人產(chǎn)生聽覺厭惡和疲勞。因此,研究有效的語音增強技術顯得尤為重要。語音增強目的是盡可能地抑制和消除被污染語音中的噪聲,從而提高語音的清晰度和可懂度。傳統(tǒng)的語音增強算法在平穩(wěn)噪聲環(huán)境下能取得較好的性能,而對非平穩(wěn)噪聲和類人聲噪聲的抑制能力有限。而現(xiàn)實生活中,非平穩(wěn)噪聲是普遍存在的,本文基于稀疏表示和字典學習理論,提出一種改進的區(qū)分性聯(lián)合字典學習方法以改善語音增強效果。本文首先介紹了一種聯(lián)合字典的語音增強方法,該方法主要分為兩個階段,分別是字典學習階段和語音增強階段。在字典學習階段,利用語音和噪聲樣本分別訓練語音字典與噪聲字典,并形成聯(lián)合字典。在語音增強階段,利用具有相干性終止準則的最小角回歸算法,實現(xiàn)語音與噪聲的分離。在仿真實驗中,將該方法與傳統(tǒng)的語音增強算法進行對比,并驗證了該方法的有效性。上述聯(lián)合字典方法沒有考慮兩類字典在表示語音樣本和噪聲樣本的區(qū)分能力。在字典學習過程中單獨地對每一類字典進行訓練,不可避免地會導致各類字典之間存在較...
【文章來源】:蘇州大學江蘇省
【文章頁數(shù)】:72 頁
【學位級別】:碩士
【部分圖文】:
稀疏表示圖示
平均表示誤差
圖 3-2 正確恢復原子的相對個數(shù)由于真實字典是已知的,那么就可以對估計的字典與原始字典的接近程度進上圖 3-2 給出了恢復的原子數(shù)量圖示。如果能從估計的字典中找到 ,與真的原子 相匹配,使得 ,則認為該原子 被恢復出來了。由以上兩個實驗可以看出,MOD算法和K-SVD算法的性能都非常好,采用2代,兩算法就能恢復出原始字典中的大部分原子。并且,這兩個算法都能夠示誤差降到 0.1 以下。在最終輸出的誤差以及收斂速度上來看,K-SVD 算法 MOD 算法。圖 3-3 分別給出了采用 MOD 算法與 K-SVD 算法學習得到的字典的圖形化。
【參考文獻】:
期刊論文
[1]基于進化算法低信噪比環(huán)境的基音頻率檢測[J]. 張小恒,李勇明,謝文賓. 現(xiàn)代電子技術. 2017(11)
[2]一種新的基于稀疏表示的單通道盲源分離算法[J]. 田元榮,王星,周一鵬. 電子與信息學報. 2017(06)
[3]基于圖像分解的稀疏去噪及優(yōu)化方法研究[J]. 鄒輝,吳奇峰,銀壯辰,吳巍,明德烈. 計算機與數(shù)字工程. 2016(12)
[4]一種基于修正倒譜平滑技術改進的維納濾波語音增強算法[J]. 李季碧,馬永保,夏杰,劉金剛. 重慶郵電大學學報(自然科學版). 2016(04)
[5]基于發(fā)音特征的漢語聲調建模方法及其在漢語語音識別中的應用[J]. 晁浩,楊占磊,劉文舉. 計算機應用. 2013(10)
[6]基于譜減和LMS的自適應語音增強[J]. 姜占才,孫燕,王得芳. 計算機工程與應用. 2012(07)
[7]基于小波變換的語音數(shù)據(jù)壓縮的研究[J]. 張璽君,王繼曾,藺瑩. 科學技術與工程. 2009(02)
[8]基于多脈沖激勵和卡爾曼濾波的語音增強算法[J]. 柳林,李輝,戴蓓蒨,陸偉. 數(shù)據(jù)采集與處理. 2009(01)
本文編號:2906787
【文章來源】:蘇州大學江蘇省
【文章頁數(shù)】:72 頁
【學位級別】:碩士
【部分圖文】:
稀疏表示圖示
平均表示誤差
圖 3-2 正確恢復原子的相對個數(shù)由于真實字典是已知的,那么就可以對估計的字典與原始字典的接近程度進上圖 3-2 給出了恢復的原子數(shù)量圖示。如果能從估計的字典中找到 ,與真的原子 相匹配,使得 ,則認為該原子 被恢復出來了。由以上兩個實驗可以看出,MOD算法和K-SVD算法的性能都非常好,采用2代,兩算法就能恢復出原始字典中的大部分原子。并且,這兩個算法都能夠示誤差降到 0.1 以下。在最終輸出的誤差以及收斂速度上來看,K-SVD 算法 MOD 算法。圖 3-3 分別給出了采用 MOD 算法與 K-SVD 算法學習得到的字典的圖形化。
【參考文獻】:
期刊論文
[1]基于進化算法低信噪比環(huán)境的基音頻率檢測[J]. 張小恒,李勇明,謝文賓. 現(xiàn)代電子技術. 2017(11)
[2]一種新的基于稀疏表示的單通道盲源分離算法[J]. 田元榮,王星,周一鵬. 電子與信息學報. 2017(06)
[3]基于圖像分解的稀疏去噪及優(yōu)化方法研究[J]. 鄒輝,吳奇峰,銀壯辰,吳巍,明德烈. 計算機與數(shù)字工程. 2016(12)
[4]一種基于修正倒譜平滑技術改進的維納濾波語音增強算法[J]. 李季碧,馬永保,夏杰,劉金剛. 重慶郵電大學學報(自然科學版). 2016(04)
[5]基于發(fā)音特征的漢語聲調建模方法及其在漢語語音識別中的應用[J]. 晁浩,楊占磊,劉文舉. 計算機應用. 2013(10)
[6]基于譜減和LMS的自適應語音增強[J]. 姜占才,孫燕,王得芳. 計算機工程與應用. 2012(07)
[7]基于小波變換的語音數(shù)據(jù)壓縮的研究[J]. 張璽君,王繼曾,藺瑩. 科學技術與工程. 2009(02)
[8]基于多脈沖激勵和卡爾曼濾波的語音增強算法[J]. 柳林,李輝,戴蓓蒨,陸偉. 數(shù)據(jù)采集與處理. 2009(01)
本文編號:2906787
本文鏈接:http://sikaile.net/kejilunwen/wltx/2906787.html
最近更新
教材專著