基于稀疏表示的語音盲解卷積和房間脈沖響應建模方法研究
發(fā)布時間:2021-07-04 06:12
語音盲解卷積是語音信號處理領域極具挑戰(zhàn)的研究課題之一。語音盲解卷積的目的是根據(jù)觀測混響信號實現(xiàn)對源信號和聲學信道的恢復,其意義不僅在于消除混響效應對自動語音識別、免提電話、助聽器等應用的不利影響,同時通過所估計的聲學信道還可以獲得系統(tǒng)的聲學特性,這對聲學信道相關的聲重放、語音增強等應用至關重要。然而,由于盲解卷積問題的非適定性,必須要為問題的求解提供一定的先驗信息,如何獲取這樣的信息就成為問題求解的關鍵。本文研究了單輸入單輸出室內(nèi)聲學系統(tǒng)的語音盲解卷積問題,從挖掘和利用聲學信道特性入手,圍繞描述聲學信道的房間脈沖響應展開工作,通過對房間脈沖響應施加正則約束和進行聲學建模兩種方式來獲取先驗信息,求解語音盲解卷積問題。本文主要研究內(nèi)容如下:首先,研究了基于稀疏約束的語音盲解卷積問題。針對混響較低聲學系統(tǒng),提出了一種基于稀疏約束的語音盲解卷積模型,并給出了相應的求解方法。當混響較低時,房間脈沖響應可認為僅包含稀疏的前期反射部分。為此,所提模型采用了一個l1范數(shù)正則項對房間脈沖響應的稀疏特性進行約束;還采用了一個指示函數(shù)對源信號的動態(tài)范圍進行約束,以進一步降低解空間維度。實驗結(jié)果表明,所提方法...
【文章來源】:哈爾濱工業(yè)大學黑龍江省 211工程院校 985工程院校
【文章頁數(shù)】:127 頁
【學位級別】:博士
【部分圖文】:
圖1-1封閉環(huán)境聲音傳播示例??Fig.?1-1?Illustration?of?sound?propagation?in?an?enclosed?environment??
聲#研宄的核心問題,具有極其重要的研宄價值。而本文工怍則是對源信號和房??間脈沖響應進行估計,以及房間脈沖響應建模的研宄。??圖1-2給出了一個房間脈沖響應信號的縮略示例圖,其中橫坐標表示時間、縱??坐標表示脈沖信號在該時刻的幅值信息,該圖反映了房間脈沖響應信號的幅值隨??時間衰減變化的過程。房間脈沖響應通常可分為三部分:憲達聲s前期反射和后期??反射(也稱后期混響),它描述了聲音由聲源至麥克風的傳播過程。當源信號與房??間脈沖響應這三部分進行卷積時分別產(chǎn)生接收信號的直達聲.、前期混響和后期混??響。如圖1-2所錄,房間脈沖響應前期反射部分的各個脈沖之間具有較明顯的時間??延遲,隨時間建現(xiàn)分立排列;而后期反射部分則在時間上呈現(xiàn)較為密集的連續(xù)分??布。房間脈沖響應的反射能量隨時間逐漸衰減,其描述了'聲源停止發(fā)生后,聲音不??斷反射逐漸衰變的過程,通常情況下房間脈沖響應的反射能量M指數(shù)衰減?。需??要強調(diào)的是,很多時候房間脈沖響應的直達聲和前期反射所組成的前期部分統(tǒng)稱??為前期反射
量和可理解性會因過大的后期反射而降低。通常在一些場景中,如靜音室等經(jīng)過??吸聲處理的低反射聲學環(huán)境,房間混響相對較低,則可認為房間脈沖響應僅包含相??對稀疏的前期反射部分(圖2-1中紅色虛線部分),而后期反射部分可以忽略不計,??則該種情況下的聲學系統(tǒng)是稀疏的。因此,通過借助房間脈沖響應的稀疏性,可以??使用稀疏盲解卷積的方法實現(xiàn)語音信號和房間脈沖響應的估計。??本章對稀疏聲學系統(tǒng)進行語音盲解卷積的研究,提出了一種基于稀疏約束的??語音盲解卷積模型。該模型不僅使用了聲學系統(tǒng)的稀疏特性作為問題求解先驗信??息,同時還使用了信號的動態(tài)范圍以進一步降低盲解卷積解空間的范圍。為了優(yōu)??-13?-??
【參考文獻】:
博士論文
[1]基于深度學習的說話人無關單通道語音分離[D]. 王燕南.中國科學技術大學 2017
[2]基于深層神經(jīng)網(wǎng)絡的語音增強方法研究[D]. 徐勇.中國科學技術大學 2015
[3]中國民族音樂廳堂ITDG和IACC的主觀優(yōu)選研究[D]. 郭天葵.華南理工大學 2013
[4]圖像反卷積算法研究[D]. 楊航.吉林大學 2012
[5]雙耳可聽化質(zhì)量及其影響因素的研究[D]. 饒丹.華南理工大學 2009
本文編號:3264203
【文章來源】:哈爾濱工業(yè)大學黑龍江省 211工程院校 985工程院校
【文章頁數(shù)】:127 頁
【學位級別】:博士
【部分圖文】:
圖1-1封閉環(huán)境聲音傳播示例??Fig.?1-1?Illustration?of?sound?propagation?in?an?enclosed?environment??
聲#研宄的核心問題,具有極其重要的研宄價值。而本文工怍則是對源信號和房??間脈沖響應進行估計,以及房間脈沖響應建模的研宄。??圖1-2給出了一個房間脈沖響應信號的縮略示例圖,其中橫坐標表示時間、縱??坐標表示脈沖信號在該時刻的幅值信息,該圖反映了房間脈沖響應信號的幅值隨??時間衰減變化的過程。房間脈沖響應通常可分為三部分:憲達聲s前期反射和后期??反射(也稱后期混響),它描述了聲音由聲源至麥克風的傳播過程。當源信號與房??間脈沖響應這三部分進行卷積時分別產(chǎn)生接收信號的直達聲.、前期混響和后期混??響。如圖1-2所錄,房間脈沖響應前期反射部分的各個脈沖之間具有較明顯的時間??延遲,隨時間建現(xiàn)分立排列;而后期反射部分則在時間上呈現(xiàn)較為密集的連續(xù)分??布。房間脈沖響應的反射能量隨時間逐漸衰減,其描述了'聲源停止發(fā)生后,聲音不??斷反射逐漸衰變的過程,通常情況下房間脈沖響應的反射能量M指數(shù)衰減?。需??要強調(diào)的是,很多時候房間脈沖響應的直達聲和前期反射所組成的前期部分統(tǒng)稱??為前期反射
量和可理解性會因過大的后期反射而降低。通常在一些場景中,如靜音室等經(jīng)過??吸聲處理的低反射聲學環(huán)境,房間混響相對較低,則可認為房間脈沖響應僅包含相??對稀疏的前期反射部分(圖2-1中紅色虛線部分),而后期反射部分可以忽略不計,??則該種情況下的聲學系統(tǒng)是稀疏的。因此,通過借助房間脈沖響應的稀疏性,可以??使用稀疏盲解卷積的方法實現(xiàn)語音信號和房間脈沖響應的估計。??本章對稀疏聲學系統(tǒng)進行語音盲解卷積的研究,提出了一種基于稀疏約束的??語音盲解卷積模型。該模型不僅使用了聲學系統(tǒng)的稀疏特性作為問題求解先驗信??息,同時還使用了信號的動態(tài)范圍以進一步降低盲解卷積解空間的范圍。為了優(yōu)??-13?-??
【參考文獻】:
博士論文
[1]基于深度學習的說話人無關單通道語音分離[D]. 王燕南.中國科學技術大學 2017
[2]基于深層神經(jīng)網(wǎng)絡的語音增強方法研究[D]. 徐勇.中國科學技術大學 2015
[3]中國民族音樂廳堂ITDG和IACC的主觀優(yōu)選研究[D]. 郭天葵.華南理工大學 2013
[4]圖像反卷積算法研究[D]. 楊航.吉林大學 2012
[5]雙耳可聽化質(zhì)量及其影響因素的研究[D]. 饒丹.華南理工大學 2009
本文編號:3264203
本文鏈接:http://sikaile.net/kejilunwen/xinxigongchenglunwen/3264203.html
最近更新
教材專著