基于彈性網(wǎng)正則的稀疏先驗多通道語音去混響
發(fā)布時間:2021-04-06 15:52
在室內(nèi)和車內(nèi)等聲學環(huán)境密閉的地方,麥克風采集到的語音信號中會包含混響噪聲。作為語音增強的一個重要組成部分,語音去混響算法可以為語音識別等技術(shù)進行預(yù)處理,去除語音信號中的混響噪聲,提高語音信號的質(zhì)量和可懂度。本文基于多通道線性預(yù)測(MCLP)語音去混響算法,做了如下幾部分的研究:(1)分析了傳統(tǒng)的加權(quán)預(yù)測誤差(WPE)算法。傳統(tǒng)的WPE算法是對期望的原始語音信號的短時傅里葉變換系數(shù)進行統(tǒng)計建模,發(fā)現(xiàn)其符合時變高斯模型,然后利用最大似然估計的方法求出期望語音信號。改進的算法是利用更能逼近真實語音信號的廣義高斯分布先驗概率模型來估計期望語音信號。本文研究改進型WPE算法發(fā)現(xiàn),在利用最大似然估計法求未知參數(shù)時,對概率模型方差的估計不夠準確。因此引入了非負矩陣分解方法,利用I-S散度求解非負矩陣分解優(yōu)化的方差參數(shù),從而提高了去混響效果。(2)根據(jù)原始語音信號的稀疏特性,利用稀疏重構(gòu)的方法求解WPE算法中的預(yù)測濾波器系數(shù)。方法是將期望語音信號改寫為稀疏表示模型,利用迭代加權(quán)最小二乘(IRLS)算法求解目標函數(shù)。本文研究了該算法的求解過程,發(fā)現(xiàn)如果麥克風矩陣比較緊密,會導致觀測矩陣產(chǎn)生奇異值,降低稀...
【文章來源】:大連海事大學遼寧省 211工程院校
【文章頁數(shù)】:71 頁
【學位級別】:碩士
【部分圖文】:
圖2.1室內(nèi)混響過程示意圖\??Fig.?2.1?Schematic?diagram?of?room?reverberation?process??
環(huán)境??中房間各表面反射系數(shù)/,進而求得仿真房間的房間沖激響應(yīng)i??利用ISM仿真模型,本文搭建了一個仿真平臺。在一個長4.5米,寬3.5米,高2.7??米的空曠矩形房間內(nèi),聲源位置的坐標(1.25,1.75,1.5),麥克風位置的坐標(3.25,1.75,1.5)。??設(shè)置本仿真平臺的混響時間通過式(2.9)可以求出仿真房間內(nèi)各個表面的反??射系數(shù)通過式(2_8)即可求出仿真房間的房間沖激響應(yīng)A(Z)。通過ISM仿真模型進行??仿真的混響時間/?7;=500ot房間沖激響應(yīng)波形圖如圖2.2所示。??0.4?n?■????.???0.3??0.2??謹。I?VI?????02?|??-0.3?^??0?50?100?150?200?250??時間(毫秒)??圖2.2房間沖激響應(yīng)波形圖??Fig.?2.2?Room?impulse?response?waveform??從圖2.2中可以清晰地看出混響信號包括的三個部分:直達聲、早期混響和晚期混??響。左側(cè)延時最短、振幅最高的語音信號表示聲源直接到達麥克風的直達聲,直達聲到??達麥克風以后、50ms之前到達麥克風的早期混響和50ms以后到達麥克風的晚期混響。??-10?-??
更具有嚴謹性。本文采用主觀語音質(zhì)量評估((Perceptual?Evaluation?of?Speech?Quality,??PESQ)和語音混響調(diào)制能量比(Speech-to-Reverberation?Modulation?Energy?Ratio,SRMR)??兩種語音增強技術(shù)常用的客觀評價指標。??(1)?PESQ??PESQ是由ITU-T(國際電信聯(lián)盟電信標準化部)提出的-種可靠的客觀MOS值評價??方法。.其評估流程為:首先輸入原始語音信號作為參考信號,輸入處理后的語音信號作??為待測信號。對參考信號和待測信號進行電平調(diào)整和短時傅里葉變換濾波的預(yù)處理。然??后將兩路信號進行時間上的對齊處理。然后通過聽覺轉(zhuǎn)換處理,聽覺轉(zhuǎn)換處理是對系統(tǒng)??中線性濾波的補償和均衡。然后通過擾動處理計算兩路信號之間的差值。最后擾動處理??后的信號通過設(shè)計好的認知模型得出PESQ的評價值。若在擾動處理中出現(xiàn)壞的區(qū)間,??則需要對壞的區(qū)間再次進行時間上的對弁處理。PESQ評估的流程圖如圖2.10所示。??????I??????
【參考文獻】:
期刊論文
[1]一種基于正交非負矩陣分解的多通道線性預(yù)測語音去混響方法[J]. 何沖,王冬霞,王旭東,蔣茂松. 聲學技術(shù). 2018(05)
[2]基于反冪法和卡爾曼濾波的自適應(yīng)語音去混響方法[J]. 梅鐵民. 信號處理. 2018(07)
[3]語音去混響技術(shù)的研究進展與展望[J]. 張雄偉,李軼南,鄭昌艷,曹鐵勇,孫蒙,閔剛. 數(shù)據(jù)采集與處理. 2017(06)
[4]融合解析模型和綜合模型的壓縮感知算法[J]. 練秋生,韓敏,石保順,陳書貞. 電子學報. 2016(03)
[5]混響效應(yīng)與去混響方法[J]. 曲萬春,梅鐵民. 自動化與儀器儀表. 2015(06)
[6]Gammatone濾波器修正的多級線性預(yù)測去混響[J]. 趙紅,李雙田. 信號處理. 2014(09)
[7]改進的多級線性預(yù)測晚期混響抑制算法[J]. 趙紅,李雙田. 信號處理. 2014(06)
[8]基于最小相位分解的語音去混響[J]. 廖啟鵬,孔榮,沈圓圓,顧濟華,趙鶴鳴,陶智. 通信技術(shù). 2011(06)
[9]壓縮傳感理論與重構(gòu)算法[J]. 楊海蓉,張成,丁大為,韋穗. 電子學報. 2011(01)
[10]單通道的語音盲去混響[J]. 沈希忠,孟光. 上海交通大學學報. 2010(02)
博士論文
[1]基于深度神經(jīng)網(wǎng)絡(luò)的語音去混響方法研究[D]. 吳渤.西安電子科技大學 2018
碩士論文
[1]單麥克風語音去混響算法研究[D]. 李玉.西安電子科技大學 2018
[2]基于EM的多通道去混響和降噪算法的改進[D]. 韓柳.中國科學技術(shù)大學 2018
[3]求解彈性網(wǎng)絡(luò)模型的廣義ADMM算法的研究[D]. 侯倩.華中科技大學 2018
[4]基于NMF的MCLP語音去混響方法研究[D]. 何沖.遼寧工業(yè)大學 2018
[5]語音信號去混響技術(shù)研究[D]. 牛莉莉.蘭州交通大學 2017
[6]基于Cosparse解析模型的壓縮感知算法及其應(yīng)用研究[D]. 韓敏.燕山大學 2015
[7]房間混響消除的方法研究[D]. 行鵬程.沈陽理工大學 2013
[8]基于Gammatone聽覺濾波器組和復(fù)倒譜盲解卷積的語音去混響研究[D]. 廖啟鵬.蘇州大學 2012
[9]語音去混響研究[D]. 蘇先禮.四川大學 2006
本文編號:3121701
【文章來源】:大連海事大學遼寧省 211工程院校
【文章頁數(shù)】:71 頁
【學位級別】:碩士
【部分圖文】:
圖2.1室內(nèi)混響過程示意圖\??Fig.?2.1?Schematic?diagram?of?room?reverberation?process??
環(huán)境??中房間各表面反射系數(shù)/,進而求得仿真房間的房間沖激響應(yīng)i??利用ISM仿真模型,本文搭建了一個仿真平臺。在一個長4.5米,寬3.5米,高2.7??米的空曠矩形房間內(nèi),聲源位置的坐標(1.25,1.75,1.5),麥克風位置的坐標(3.25,1.75,1.5)。??設(shè)置本仿真平臺的混響時間通過式(2.9)可以求出仿真房間內(nèi)各個表面的反??射系數(shù)通過式(2_8)即可求出仿真房間的房間沖激響應(yīng)A(Z)。通過ISM仿真模型進行??仿真的混響時間/?7;=500ot房間沖激響應(yīng)波形圖如圖2.2所示。??0.4?n?■????.???0.3??0.2??謹。I?VI?????02?|??-0.3?^??0?50?100?150?200?250??時間(毫秒)??圖2.2房間沖激響應(yīng)波形圖??Fig.?2.2?Room?impulse?response?waveform??從圖2.2中可以清晰地看出混響信號包括的三個部分:直達聲、早期混響和晚期混??響。左側(cè)延時最短、振幅最高的語音信號表示聲源直接到達麥克風的直達聲,直達聲到??達麥克風以后、50ms之前到達麥克風的早期混響和50ms以后到達麥克風的晚期混響。??-10?-??
更具有嚴謹性。本文采用主觀語音質(zhì)量評估((Perceptual?Evaluation?of?Speech?Quality,??PESQ)和語音混響調(diào)制能量比(Speech-to-Reverberation?Modulation?Energy?Ratio,SRMR)??兩種語音增強技術(shù)常用的客觀評價指標。??(1)?PESQ??PESQ是由ITU-T(國際電信聯(lián)盟電信標準化部)提出的-種可靠的客觀MOS值評價??方法。.其評估流程為:首先輸入原始語音信號作為參考信號,輸入處理后的語音信號作??為待測信號。對參考信號和待測信號進行電平調(diào)整和短時傅里葉變換濾波的預(yù)處理。然??后將兩路信號進行時間上的對齊處理。然后通過聽覺轉(zhuǎn)換處理,聽覺轉(zhuǎn)換處理是對系統(tǒng)??中線性濾波的補償和均衡。然后通過擾動處理計算兩路信號之間的差值。最后擾動處理??后的信號通過設(shè)計好的認知模型得出PESQ的評價值。若在擾動處理中出現(xiàn)壞的區(qū)間,??則需要對壞的區(qū)間再次進行時間上的對弁處理。PESQ評估的流程圖如圖2.10所示。??????I??????
【參考文獻】:
期刊論文
[1]一種基于正交非負矩陣分解的多通道線性預(yù)測語音去混響方法[J]. 何沖,王冬霞,王旭東,蔣茂松. 聲學技術(shù). 2018(05)
[2]基于反冪法和卡爾曼濾波的自適應(yīng)語音去混響方法[J]. 梅鐵民. 信號處理. 2018(07)
[3]語音去混響技術(shù)的研究進展與展望[J]. 張雄偉,李軼南,鄭昌艷,曹鐵勇,孫蒙,閔剛. 數(shù)據(jù)采集與處理. 2017(06)
[4]融合解析模型和綜合模型的壓縮感知算法[J]. 練秋生,韓敏,石保順,陳書貞. 電子學報. 2016(03)
[5]混響效應(yīng)與去混響方法[J]. 曲萬春,梅鐵民. 自動化與儀器儀表. 2015(06)
[6]Gammatone濾波器修正的多級線性預(yù)測去混響[J]. 趙紅,李雙田. 信號處理. 2014(09)
[7]改進的多級線性預(yù)測晚期混響抑制算法[J]. 趙紅,李雙田. 信號處理. 2014(06)
[8]基于最小相位分解的語音去混響[J]. 廖啟鵬,孔榮,沈圓圓,顧濟華,趙鶴鳴,陶智. 通信技術(shù). 2011(06)
[9]壓縮傳感理論與重構(gòu)算法[J]. 楊海蓉,張成,丁大為,韋穗. 電子學報. 2011(01)
[10]單通道的語音盲去混響[J]. 沈希忠,孟光. 上海交通大學學報. 2010(02)
博士論文
[1]基于深度神經(jīng)網(wǎng)絡(luò)的語音去混響方法研究[D]. 吳渤.西安電子科技大學 2018
碩士論文
[1]單麥克風語音去混響算法研究[D]. 李玉.西安電子科技大學 2018
[2]基于EM的多通道去混響和降噪算法的改進[D]. 韓柳.中國科學技術(shù)大學 2018
[3]求解彈性網(wǎng)絡(luò)模型的廣義ADMM算法的研究[D]. 侯倩.華中科技大學 2018
[4]基于NMF的MCLP語音去混響方法研究[D]. 何沖.遼寧工業(yè)大學 2018
[5]語音信號去混響技術(shù)研究[D]. 牛莉莉.蘭州交通大學 2017
[6]基于Cosparse解析模型的壓縮感知算法及其應(yīng)用研究[D]. 韓敏.燕山大學 2015
[7]房間混響消除的方法研究[D]. 行鵬程.沈陽理工大學 2013
[8]基于Gammatone聽覺濾波器組和復(fù)倒譜盲解卷積的語音去混響研究[D]. 廖啟鵬.蘇州大學 2012
[9]語音去混響研究[D]. 蘇先禮.四川大學 2006
本文編號:3121701
本文鏈接:http://sikaile.net/shoufeilunwen/xixikjs/3121701.html
最近更新
教材專著