基于非負矩陣分解的雙通道語音增強方法研究
發(fā)布時間:2020-12-28 21:22
在惡劣的聲學環(huán)境下由于噪聲的影響,會讓得到的語音信號充滿雜質,質量和語音可懂度都會受到嚴重影響。因此,需要進行語音增強。在以前的語音增強算法當中,去除噪聲的同時很有可能刪除掉語音信號部分,影響語音處理系統(tǒng)的性能。目前信號處理被普遍應用于科學工程領域,特別是對于語音信號的研究已經(jīng)成為了最近幾年的熱門。作為語音信號處理的一大分支,語音增強算法的目標是為了提升由于各種原因造成信號干擾的語音質量和語音可懂度。在發(fā)展傳統(tǒng)語音增強算法的基礎上,這幾年結合機器學習又相繼的提出一些新的算法,而非負矩陣分解(Non-negative Matrix Factorization,NMF)又成為這些算法中被使用比較廣泛的一個。除了機器學習,麥克風陣列信號處理技術也被廣泛的應用于語音增強算法,如自適應波束形成。針對于此,本文把非負矩陣分解和麥克風陣列的相關算法結合起來,利用盲源分離的思想來進行語音信號增強,形成基于非負矩陣分解的雙通道語音信號增強方法研究,可以對聲音信號進行后期處理。首先,利用麥克風陣列的廣義互相關方法得到波達時延估計值。然后,進行非負矩陣方法的改進,改進了非負矩陣分解的初始化。傳統(tǒng)的非負矩陣分...
【文章來源】:遼寧大學遼寧省 211工程院校
【文章頁數(shù)】:75 頁
【學位級別】:碩士
【部分圖文】:
單源自由場模型
第2章語音增強相關技術8不管什么樣的公式都利用了傳感器分布的幾何形狀。對于一維線性均勻麥克風陣列,聲波在傳輸過程中與麥克風陣列形成的角度θ與兩個麥克風之間的傳輸時延有如下關系:cd/cos12(2.4)其中c為聲音在空氣中傳播的速度,通過公式(2.4)可知,時延估計和到達方向估計可以相互推導。2.1.2單源混響模型單源混響模型又被稱為語音增強的實際模型,兼顧到了語音信號在封閉環(huán)境中的反射影響,已經(jīng)接受到的語音信號因為反射現(xiàn)象又收到了自身信號的置后信號,比較貼近現(xiàn)實中的語音信號,如下圖2-2所示:圖2-2單源混響模型第n個麥克風信號為:1,2.....Nn),()(x)()()(ykvkkvksgknnnnn(2.5)ng為源信號到第n個麥克風的通道沖擊反應,公式(2.5)也可以寫成矩陣的樣式:kkkGyN1,2,......n)()()(nnnvs(2.6)式中
第2章語音增強相關技術91,0,1,0,00LnnLnnnggggGTskskskkLksLs)]22()1()1()([)(TLkvkvk)]1()([)(nnnvL是通道沖激響應的最長長度,并且在其中,假設噪音和源信號以及其他麥克風的噪音不相關。和理想模型相比,混響模型顯然更復雜,也更難一些。2.2短時傅里葉變換語音信號被麥克風等設備收集并被轉換成數(shù)字信號,這樣一段數(shù)字信號,不僅和時間有關系,而且還和頻率有關系,快速傅里葉變換就是把語音信號從時域信號變換到頻域信號的有效方法。如下圖所示為一段語音信號在時域上的波形與轉換后的頻譜,相比于在時域上的復雜,在頻域上的信號就要簡潔許多。圖2-3信號的時域和頻域圖雖然語音信號可以用快速傅里葉變換進行處理,但它還是帶著缺陷,由于語音信號是非穩(wěn)定過程,這就有可能造成時域上區(qū)別很大的信號在頻域上卻很相似。平穩(wěn)信號的產(chǎn)生大部分因為人有意制造的,自然界中大部分是不平穩(wěn)的。必須考慮更為現(xiàn)實的使用。上文提到過說話人聲音信號10到30ms是平穩(wěn)的,針對于此,提出了短時短時傅里葉變換(Short-timeFourierTransform,STFT)。
【參考文獻】:
期刊論文
[1]基于廣義二次互相關的低信噪比信號時延估計[J]. 錢隆彥,陳衛(wèi)松,肖夢迪. 無線電通信技術. 2020(01)
[2]改進的多窗譜譜減法語音增強研究[J]. 姚遠,李亞偉,白天皓. 電子測試. 2019(14)
[3]采用性別相關的深度神經(jīng)網(wǎng)絡及非負矩陣分解模型用于單通道語音增強[J]. 李煦,王子騰,王曉飛,付強,顏永紅. 聲學學報. 2019(02)
[4]聯(lián)合稀疏非負矩陣分解和神經(jīng)網(wǎng)絡的語音增強[J]. 時文華,倪永婧,張雄偉,鄒霞,孫蒙,閔剛. 計算機研究與發(fā)展. 2018(11)
[5]基于SCOT雙加權二次相關的時延估計算法[J]. 張宇,嚴天峰. 全球定位系統(tǒng). 2018(05)
[6]基于廣義二次相關的稀疏傅里葉變換時延估計算法[J]. 張宇,嚴天峰. 電光與控制. 2019(03)
[7]基于稀疏約束非負矩陣分解的K-Means聚類算法[J]. 韓素青,賈茹. 數(shù)據(jù)采集與處理. 2017(06)
[8]基于改進能熵比的維納濾波語音增強算法[J]. 王帥,蒲寶明,李相澤,張笑東,姚愷豐. 計算機系統(tǒng)應用. 2017(11)
[9]L1/2稀疏約束卷積非負矩陣分解的單通道語音增強方法[J]. 路成,田猛,周健,王華彬,陶亮. 聲學學報. 2017(03)
[10]改進的參數(shù)自適應的維納濾波語音增強算法[J]. 孟欣,馬建芬,張雪英. 計算機工程與設計. 2017(03)
碩士論文
[1]基于自適應波束成形的語音增強算法研究與實現(xiàn)[D]. 續(xù)嬌.北京交通大學 2019
[2]GSC自適應波束形成的后置濾波算法研究[D]. 張祿.哈爾濱工業(yè)大學 2018
[3]基于自適應波束形成的語音增強方法研究[D]. 汪洪濤.遼寧大學 2018
[4]空-時自適應濾波遠程語音增強方法及實現(xiàn)研究[D]. 胡玥.浙江大學 2017
[5]麥克風陣列自適應波束形成及后置濾波技術研究[D]. 夏杰.重慶郵電大學 2017
[6]基于麥克風陣列的語音增強方法研究[D]. 倪忠.湖南大學 2017
[7]基于單鏈接和期望最大化規(guī)則聚類的包分類技術[D]. 王小慧.湖南師范大學 2016
[8]基于麥克風陣列的語音增強系統(tǒng)設計[D]. 朱興宇.北京化工大學 2012
本文編號:2944413
【文章來源】:遼寧大學遼寧省 211工程院校
【文章頁數(shù)】:75 頁
【學位級別】:碩士
【部分圖文】:
單源自由場模型
第2章語音增強相關技術8不管什么樣的公式都利用了傳感器分布的幾何形狀。對于一維線性均勻麥克風陣列,聲波在傳輸過程中與麥克風陣列形成的角度θ與兩個麥克風之間的傳輸時延有如下關系:cd/cos12(2.4)其中c為聲音在空氣中傳播的速度,通過公式(2.4)可知,時延估計和到達方向估計可以相互推導。2.1.2單源混響模型單源混響模型又被稱為語音增強的實際模型,兼顧到了語音信號在封閉環(huán)境中的反射影響,已經(jīng)接受到的語音信號因為反射現(xiàn)象又收到了自身信號的置后信號,比較貼近現(xiàn)實中的語音信號,如下圖2-2所示:圖2-2單源混響模型第n個麥克風信號為:1,2.....Nn),()(x)()()(ykvkkvksgknnnnn(2.5)ng為源信號到第n個麥克風的通道沖擊反應,公式(2.5)也可以寫成矩陣的樣式:kkkGyN1,2,......n)()()(nnnvs(2.6)式中
第2章語音增強相關技術91,0,1,0,00LnnLnnnggggGTskskskkLksLs)]22()1()1()([)(TLkvkvk)]1()([)(nnnvL是通道沖激響應的最長長度,并且在其中,假設噪音和源信號以及其他麥克風的噪音不相關。和理想模型相比,混響模型顯然更復雜,也更難一些。2.2短時傅里葉變換語音信號被麥克風等設備收集并被轉換成數(shù)字信號,這樣一段數(shù)字信號,不僅和時間有關系,而且還和頻率有關系,快速傅里葉變換就是把語音信號從時域信號變換到頻域信號的有效方法。如下圖所示為一段語音信號在時域上的波形與轉換后的頻譜,相比于在時域上的復雜,在頻域上的信號就要簡潔許多。圖2-3信號的時域和頻域圖雖然語音信號可以用快速傅里葉變換進行處理,但它還是帶著缺陷,由于語音信號是非穩(wěn)定過程,這就有可能造成時域上區(qū)別很大的信號在頻域上卻很相似。平穩(wěn)信號的產(chǎn)生大部分因為人有意制造的,自然界中大部分是不平穩(wěn)的。必須考慮更為現(xiàn)實的使用。上文提到過說話人聲音信號10到30ms是平穩(wěn)的,針對于此,提出了短時短時傅里葉變換(Short-timeFourierTransform,STFT)。
【參考文獻】:
期刊論文
[1]基于廣義二次互相關的低信噪比信號時延估計[J]. 錢隆彥,陳衛(wèi)松,肖夢迪. 無線電通信技術. 2020(01)
[2]改進的多窗譜譜減法語音增強研究[J]. 姚遠,李亞偉,白天皓. 電子測試. 2019(14)
[3]采用性別相關的深度神經(jīng)網(wǎng)絡及非負矩陣分解模型用于單通道語音增強[J]. 李煦,王子騰,王曉飛,付強,顏永紅. 聲學學報. 2019(02)
[4]聯(lián)合稀疏非負矩陣分解和神經(jīng)網(wǎng)絡的語音增強[J]. 時文華,倪永婧,張雄偉,鄒霞,孫蒙,閔剛. 計算機研究與發(fā)展. 2018(11)
[5]基于SCOT雙加權二次相關的時延估計算法[J]. 張宇,嚴天峰. 全球定位系統(tǒng). 2018(05)
[6]基于廣義二次相關的稀疏傅里葉變換時延估計算法[J]. 張宇,嚴天峰. 電光與控制. 2019(03)
[7]基于稀疏約束非負矩陣分解的K-Means聚類算法[J]. 韓素青,賈茹. 數(shù)據(jù)采集與處理. 2017(06)
[8]基于改進能熵比的維納濾波語音增強算法[J]. 王帥,蒲寶明,李相澤,張笑東,姚愷豐. 計算機系統(tǒng)應用. 2017(11)
[9]L1/2稀疏約束卷積非負矩陣分解的單通道語音增強方法[J]. 路成,田猛,周健,王華彬,陶亮. 聲學學報. 2017(03)
[10]改進的參數(shù)自適應的維納濾波語音增強算法[J]. 孟欣,馬建芬,張雪英. 計算機工程與設計. 2017(03)
碩士論文
[1]基于自適應波束成形的語音增強算法研究與實現(xiàn)[D]. 續(xù)嬌.北京交通大學 2019
[2]GSC自適應波束形成的后置濾波算法研究[D]. 張祿.哈爾濱工業(yè)大學 2018
[3]基于自適應波束形成的語音增強方法研究[D]. 汪洪濤.遼寧大學 2018
[4]空-時自適應濾波遠程語音增強方法及實現(xiàn)研究[D]. 胡玥.浙江大學 2017
[5]麥克風陣列自適應波束形成及后置濾波技術研究[D]. 夏杰.重慶郵電大學 2017
[6]基于麥克風陣列的語音增強方法研究[D]. 倪忠.湖南大學 2017
[7]基于單鏈接和期望最大化規(guī)則聚類的包分類技術[D]. 王小慧.湖南師范大學 2016
[8]基于麥克風陣列的語音增強系統(tǒng)設計[D]. 朱興宇.北京化工大學 2012
本文編號:2944413
本文鏈接:http://sikaile.net/kejilunwen/xinxigongchenglunwen/2944413.html
最近更新
教材專著