基于麥克風(fēng)陣列的語音增強(qiáng)算法研究
發(fā)布時間:2019-09-29 05:04
【摘要】: 和單個孤立麥克風(fēng)相比,麥克風(fēng)陣列在時頻域的基礎(chǔ)上增加了一個空間域,對來自空間不同方位的信號進(jìn)行空時頻聯(lián)合處理。因此,它可以彌補單個孤立的麥克風(fēng)在噪聲處理、聲源定位跟蹤、語音提取分離等方面存在的不足,能夠廣泛應(yīng)用于各種具有嘈雜背景的語音通信環(huán)境(如會場、多媒體教室、助聽器,車載免提電話、戰(zhàn)場等),以提高語音通信質(zhì)量。麥克風(fēng)陣列研究是陣列信號處理的新方向,具有廣闊的市場應(yīng)用前景。 本論文結(jié)合陣列信號處理和語音信號處理的特點,研究了如何利用自適應(yīng)波束形成技術(shù)進(jìn)行語音增強(qiáng)。即自適應(yīng)的形成一個波束指向目標(biāo)聲源,并且在干擾源的方位形成零點,達(dá)到語音增強(qiáng)的目的。其中,主要研究如何克服陣列模型誤差(如聲源定位誤差,陣列拓?fù)湔`差,通道響應(yīng)誤差等)對波束性能的影響,即提高波束的魯棒性。 論文的第一章是引言,介紹了該領(lǐng)域的研究背景、研究現(xiàn)狀和待解決的問題、以及本文的研究內(nèi)容和創(chuàng)新點等等。 第二章以球面波動方程為基礎(chǔ),建立了基于麥克風(fēng)陣列的語音信號處理通用模型(the General Signal Model of Microphone Arrays,GSMMA)。和傳統(tǒng)的陣列模型相比,GSMMA不再使用窄帶和遠(yuǎn)場假設(shè),將語音信號看作是寬帶非平穩(wěn)信號,并且考慮了各通道由于傳播路徑的不同引起的幅度衰減差異。傳統(tǒng)的陣列模型可以看作是GSMMA的一個特例。 第三章從降低目標(biāo)聲源定位誤差出發(fā),研究如何保證自適應(yīng)波束形成算法的性能,提出了一種基于雙重加權(quán)的寬帶MUSIC聲源定位算法(Doubly WeightedBroadband MUSIC,DWB-MUSIC)。DWB-MUSIC以寬帶MUSIC算法為基礎(chǔ),在各頻點利用子空間分解原理對聲源進(jìn)行定位。算法首先對各頻點噪聲子空間進(jìn)行加權(quán),降低單頻點定位誤差的方差。其次,再利用各頻點的信噪比信息,對各頻點的定位結(jié)果進(jìn)行二次加權(quán),得到最終的寬帶聲源定位結(jié)果。 第四章提出了一種利用陣列旋轉(zhuǎn)不變性的寬帶盲波束算法(BroadbandDeterministic Blind Beamforming,B-DBBF),避開了聲源定位問題,在陣列滿足旋轉(zhuǎn)不變性的假設(shè)下,進(jìn)行語音增強(qiáng)。針對寬帶波束各頻點分離序列可能出現(xiàn)的通道互換和幅度模糊,提出了一種基于相鄰頻點分離序列相關(guān)性的通道重排方案,確保分離序列的頻域一致性。另外,通過調(diào)整權(quán)矩陣的模,消除了幅度模糊,使分離的序列沒有幅度失真。 第五章研究如何處理一般的方向矢量(或?qū)蚴噶縮teering vector)誤差,重點研究了基于對角加載的魯棒自適應(yīng)波束形成算法(robust adaptive beamforming,RABF)。本章解決了該類算法的關(guān)鍵問題,即如何選擇對角加載因子。在引入一系列假設(shè)后,本章推導(dǎo)出了最優(yōu)對角加載因子的近似解析解。和迭代求解的方法相比,該結(jié)果不但降低了運算量,,還揭示了哪些因素可以影響最優(yōu)加載因子,以及如何影響。在此基礎(chǔ)上,對該算法進(jìn)行了性能分析。 第六章提出了一種基于聯(lián)合最壞情況性能優(yōu)化的RABF算法(Joint Worst-CaseRABF,JW-RABF)。針對語音信號非平穩(wěn)以及算法處理的實時性要求,提出的JW-RABF算法具有對有限樣本數(shù)效應(yīng)(finite sample effect)和方向矢量誤差的雙重魯棒性。該算法也屬于對角加載類算法,和W-RABF不同,JW-RABF通過對目標(biāo)函數(shù)以及限制條件進(jìn)行聯(lián)合最壞情況性能優(yōu)化來確定最優(yōu)加載因子。本章同樣推導(dǎo)出了其最優(yōu)加載因子的近似解析解。在此基礎(chǔ)上,結(jié)合頻率聚焦技術(shù),提出了寬帶JW-RABF算法。該算法在相應(yīng)頻帶上形成一個寬帶波束,滿足波束圖隨頻率的變化在最小二乘意義下最小,并且,還可以有效處理寬帶相干干擾源。 第七章對全文進(jìn)行了總結(jié),比較了提出的各算法的優(yōu)缺點,分析了存在的不足,提出了相應(yīng)的解決方案,并且對后期的研究工作進(jìn)行了展望。
【圖文】:
電子科技大學(xué)博士學(xué)位論文性月目目粵目月懇早月奧耳只月典目目腳草典月典皿卑單皿亙口皿皿皿皿亙皿皿魚國旦里皿旦旦旦皿魚魚魚旦魚魚旦旦旦旦旦旦旦魚坦魚魚魚魚魚里魚魚魚魚旦國里里旦里巨里里里里里口還有背景噪聲、具有方向性的強(qiáng)干擾源,墻壁的回音和反射等,如圖1一2所示。這些噪聲的統(tǒng)計特性各不相同,特別是具有方向性的強(qiáng)干擾源和墻壁的回音,對語音通信質(zhì)量的影響很大。強(qiáng)干擾往往可以蓋過感興趣的聲音信號,而墻壁的回音則是和目標(biāo)聲源相干的干擾,使用常規(guī)的方法處理它們非常困難。臺U一M冉U
本文編號:2543705
【圖文】:
電子科技大學(xué)博士學(xué)位論文性月目目粵目月懇早月奧耳只月典目目腳草典月典皿卑單皿亙口皿皿皿皿亙皿皿魚國旦里皿旦旦旦皿魚魚魚旦魚魚旦旦旦旦旦旦旦魚坦魚魚魚魚魚里魚魚魚魚旦國里里旦里巨里里里里里口還有背景噪聲、具有方向性的強(qiáng)干擾源,墻壁的回音和反射等,如圖1一2所示。這些噪聲的統(tǒng)計特性各不相同,特別是具有方向性的強(qiáng)干擾源和墻壁的回音,對語音通信質(zhì)量的影響很大。強(qiáng)干擾往往可以蓋過感興趣的聲音信號,而墻壁的回音則是和目標(biāo)聲源相干的干擾,使用常規(guī)的方法處理它們非常困難。臺U一M冉U
本文編號:2543705
本文鏈接:http://sikaile.net/kejilunwen/wltx/2543705.html
最近更新
教材專著