天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

基于稀疏表示和字典學(xué)習(xí)的語(yǔ)音增強(qiáng)算法研究

發(fā)布時(shí)間:2017-04-13 21:32

  本文關(guān)鍵詞:基于稀疏表示和字典學(xué)習(xí)的語(yǔ)音增強(qiáng)算法研究,由筆耕文化傳播整理發(fā)布。


【摘要】:語(yǔ)音是人們進(jìn)行語(yǔ)言交流的重要信息載體,但是在現(xiàn)實(shí)環(huán)境里,語(yǔ)音信號(hào)往往會(huì)被各種類(lèi)型的干擾和噪聲所污染。被污染的語(yǔ)音不僅會(huì)在主觀上使人產(chǎn)生聽(tīng)覺(jué)厭惡和疲勞,而且還會(huì)嚴(yán)重影響語(yǔ)音信號(hào)的可懂度。語(yǔ)音增強(qiáng)的目的就是抑制和消除被污染語(yǔ)音中的干擾和噪聲,從而提高語(yǔ)音的質(zhì)量和可懂度。根據(jù)污染源類(lèi)型的不同,可以將語(yǔ)音增強(qiáng)分為語(yǔ)音分離和語(yǔ)音降噪問(wèn)題,其中前者的污染源是干擾語(yǔ)音,而后者的污染源是背景噪聲。傳統(tǒng)的語(yǔ)音分離和語(yǔ)音降噪算法在一定條件下能取得比較好的性能,但是也存在一定的局限性。例如,源信號(hào)個(gè)數(shù)比混合信號(hào)多的欠定語(yǔ)音分離問(wèn)題一直是一個(gè)難題;在語(yǔ)音降噪問(wèn)題中,傳統(tǒng)方法對(duì)非平穩(wěn)噪聲的抑制能力往往有限。本文結(jié)合稀疏表示和字典學(xué)習(xí)理論,針對(duì)上述兩個(gè)難題開(kāi)展研究,提出了若干算法用于語(yǔ)音分離和降噪,主要的工作和創(chuàng)新點(diǎn)包括: 首先,針對(duì)欠定語(yǔ)音分離問(wèn)題,提出了基于語(yǔ)音雙層稀疏模型的欠定語(yǔ)音分離算法。該算法包含兩步,在第一步,我們首先對(duì)混合信號(hào)每個(gè)時(shí)頻點(diǎn)鄰域平均得到協(xié)方差矩陣,然后對(duì)該矩陣進(jìn)行奇異值分解,篩選出能夠較好滿(mǎn)足窗聯(lián)合正交假設(shè)的時(shí)頻點(diǎn)進(jìn)行聚類(lèi),得到較為精確的混合矩陣估計(jì)。在第二步,基于語(yǔ)音信號(hào)能量都集中在低頻的特性,提出了雙層稀疏模型,把語(yǔ)音信號(hào)分解成低頻和高頻兩層。將基于此模型訓(xùn)練出的雙層字典用于語(yǔ)音分離,能夠降低不同源信號(hào)在字典上投影支撐集的重合度,以提高分離性能。在仿真實(shí)驗(yàn),我們將所提的混合矩陣估計(jì)算法和基于雙層稀疏模型的語(yǔ)音分離算法與傳統(tǒng)方法進(jìn)行了比較,以驗(yàn)證所提算法的有效性。 其次,針對(duì)單通道語(yǔ)音分離問(wèn)題,提出了基于區(qū)分性字典學(xué)習(xí)和基于分層字典學(xué)習(xí)的單通道語(yǔ)音分離算法。傳統(tǒng)方法分別獨(dú)立地學(xué)習(xí)每個(gè)源對(duì)應(yīng)的子字典,而沒(méi)有同時(shí)利用不同子字典之間的相互約束關(guān)系,從而將源信號(hào)在復(fù)合字典上進(jìn)行稀疏表示的時(shí)候,其部分成分會(huì)投影在非對(duì)應(yīng)子字典上,即混淆投影存在,此時(shí)字典區(qū)分性不夠,分離性能不佳。針對(duì)此問(wèn)題,我們提出了區(qū)分性字典學(xué)習(xí)方法,即聯(lián)合考慮不同子字典之間的關(guān)系,使得每個(gè)源信號(hào)能夠在復(fù)合字典中的對(duì)應(yīng)子字典上進(jìn)行稀疏表示,而抑制其在非對(duì)應(yīng)子字典上的表示。進(jìn)一步,考慮到單層區(qū)分性字典學(xué)習(xí)方法在單通道語(yǔ)音分離中還是留有一定的混淆投影,我們又提出了分層字典學(xué)習(xí)方法,在多個(gè)層次上對(duì)字典進(jìn)行約束,減少混淆投影,增加字典的區(qū)分性。為了驗(yàn)證所提算法的優(yōu)越性,我們給出了仿真實(shí)驗(yàn),對(duì)比所提的區(qū)分性字典學(xué)習(xí)及分層字典學(xué)習(xí)和傳統(tǒng)方法的單通道語(yǔ)音分離性能。 最后,針對(duì)語(yǔ)音降噪問(wèn)題,提出了語(yǔ)音和噪聲聯(lián)合字典學(xué)習(xí)方法和信號(hào)-特征字典學(xué)習(xí)方法。傳統(tǒng)方法獨(dú)立的學(xué)習(xí)一個(gè)語(yǔ)音字典和一個(gè)噪聲字典,再將語(yǔ)音和噪聲的混合信號(hào)在復(fù)合字典上進(jìn)行稀疏表示來(lái)達(dá)到降噪的目的。但是這樣做會(huì)導(dǎo)致較為嚴(yán)重的源混淆,即部分語(yǔ)音成分會(huì)被噪聲字典解釋,而部分噪聲成分會(huì)被語(yǔ)音字典解釋。為了增加語(yǔ)音字典和噪聲字典的區(qū)分性和差異性,我們利用帶噪信號(hào)和干凈信號(hào)的訓(xùn)練樣本,約束訓(xùn)練樣本在對(duì)應(yīng)字典上稀疏表示的近似誤差和字典之間的相干性,聯(lián)合訓(xùn)練語(yǔ)音字典和噪聲字典,從而使得它們?cè)谠鰪?qiáng)階段能夠盡量減少語(yǔ)音和噪聲的混淆。另外,為了利用語(yǔ)音和噪聲信號(hào)每個(gè)時(shí)頻點(diǎn)及其鄰域的相關(guān)性,提出了一種基于鄰域權(quán)重信息的特征提取方法,并且通過(guò)約束信號(hào)和特征在對(duì)應(yīng)的信號(hào)字典和特征字典上具有相同的稀疏表示系數(shù),來(lái)聯(lián)合學(xué)習(xí)信號(hào)字典和特征字典,然后在增強(qiáng)階段,直接利用信號(hào)字典估計(jì)出一路語(yǔ)音信號(hào),利用特征字典生成的時(shí)頻掩碼可以估計(jì)出另一路語(yǔ)音信號(hào),將這兩路語(yǔ)音信號(hào)進(jìn)行加權(quán),從而得到最終增強(qiáng)的語(yǔ)音。仿真實(shí)驗(yàn)對(duì)比了所提的聯(lián)合字典學(xué)習(xí)和信號(hào)-特征字典學(xué)習(xí)相比于傳統(tǒng)方法對(duì)非平穩(wěn)噪聲的抑制能力。
【關(guān)鍵詞】:語(yǔ)音增強(qiáng) 語(yǔ)音分離 語(yǔ)音降噪 稀疏表示 字典學(xué)習(xí) 雙層稀疏模型 時(shí)頻掩碼 區(qū)分性字典學(xué)習(xí) 分層字典學(xué)習(xí) 聯(lián)合字典學(xué)習(xí) 信號(hào)-特征字典學(xué)習(xí)
【學(xué)位授予單位】:中國(guó)科學(xué)技術(shù)大學(xué)
【學(xué)位級(jí)別】:博士
【學(xué)位授予年份】:2015
【分類(lèi)號(hào)】:TN912.3
【目錄】:
  • 摘要5-7
  • Abstract7-10
  • 常用數(shù)學(xué)符號(hào)10-11
  • 目錄11-14
  • 第一章 緒論14-22
  • 1.1 研究背景及意義14-16
  • 1.2 國(guó)內(nèi)外發(fā)展現(xiàn)狀16-19
  • 1.3 論文主要研究?jī)?nèi)容19-20
  • 1.4 論文章節(jié)安排20-22
  • 第二章 稀疏表示和字典學(xué)習(xí)22-32
  • 2.1 稀疏22-23
  • 2.2 稀疏表示23-26
  • 2.2.1 OMP25-26
  • 2.2.2 BP26
  • 2.2.3 LARC26
  • 2.3 字典學(xué)習(xí)26-30
  • 2.3.1 K-SVD27-28
  • 2.3.2 近似K-SVD28-29
  • 2.3.3 貪婪自適應(yīng)字典29-30
  • 2.4 常用的語(yǔ)音信號(hào)變換30-32
  • 第三章 基于雙層稀疏模型的欠定語(yǔ)音分離算法研究32-54
  • 3.1 引言32-33
  • 3.2 基于時(shí)頻掩碼的語(yǔ)音分離算法33-37
  • 3.2.1 DUET33-35
  • 3.2.2 基于語(yǔ)音諧波特性的DUET改進(jìn)算法35-36
  • 3.2.3 允許信號(hào)重疊的DUET改進(jìn)算法36-37
  • 3.3 基于語(yǔ)音稀疏表示的語(yǔ)音分離方法37-40
  • 3.4 基于SVD的混合矩陣估計(jì)算法40-41
  • 3.5 基于雙層稀疏模型的語(yǔ)音分離算法41-45
  • 3.6 對(duì)比實(shí)驗(yàn)45-52
  • 3.6.1 實(shí)驗(yàn)準(zhǔn)備45-48
  • 3.6.2 混合矩陣估計(jì)對(duì)比試驗(yàn)48-50
  • 3.6.3 語(yǔ)音分離對(duì)比實(shí)驗(yàn)50-52
  • 3.7 本章小結(jié)52-54
  • 第四章 基于區(qū)分性字典學(xué)習(xí)的單通道語(yǔ)音分離算法研究54-80
  • 4.1 引言54
  • 4.2 計(jì)算聽(tīng)覺(jué)場(chǎng)景分析54-56
  • 4.3 基于模型的方法56-60
  • 4.3.1 基于模型的方法綜述56
  • 4.3.2 基于稀疏非負(fù)矩陣分解的單通道語(yǔ)音分離算法56-59
  • 4.3.3 基于稀疏復(fù)數(shù)矩陣分解的單通道語(yǔ)音分離算法59-60
  • 4.4 區(qū)分性字典學(xué)習(xí)60-68
  • 4.4.1 傳統(tǒng)方法的缺點(diǎn)60-62
  • 4.4.2 區(qū)分性字典學(xué)習(xí)方法62-66
  • 4.4.3 基于區(qū)分性字典學(xué)習(xí)的單通道語(yǔ)音分離算法66-68
  • 4.5 對(duì)比實(shí)驗(yàn)68-76
  • 4.5.1 實(shí)驗(yàn)準(zhǔn)備68-69
  • 4.5.2 收斂性、有效性驗(yàn)證和參數(shù)選取討論69-72
  • 4.5.3 分離性能對(duì)比72-76
  • 4.6 分層字典學(xué)習(xí)76-78
  • 4.6.1 單層學(xué)習(xí)與多層學(xué)習(xí)76
  • 4.6.2 分層字典學(xué)習(xí)76-78
  • 4.6.3 實(shí)驗(yàn)仿真78
  • 4.7 本章小結(jié)78-80
  • 第五章 基于聯(lián)合字典學(xué)習(xí)和信號(hào)-特征字典學(xué)習(xí)的語(yǔ)音降噪算法研究80-98
  • 5.1 引言80
  • 5.2 傳統(tǒng)的語(yǔ)音降噪算法80-84
  • 5.2.1 譜減法80-82
  • 5.2.2 基于統(tǒng)計(jì)模型的方法82-83
  • 5.2.3 子空間方法83-84
  • 5.3 生成性字典學(xué)習(xí)84-86
  • 5.4 基于聯(lián)合字典學(xué)習(xí)的語(yǔ)音降噪方法86-92
  • 5.4.1 聯(lián)合字典學(xué)習(xí)86-89
  • 5.4.2 仿真實(shí)驗(yàn)89-92
  • 5.5 基于特征和信號(hào)字典學(xué)習(xí)的語(yǔ)音降噪算法92-97
  • 5.5.1 特征提取92-93
  • 5.5.2 信號(hào)-特征字典學(xué)習(xí)和語(yǔ)音降噪算法93-96
  • 5.5.3 仿真實(shí)驗(yàn)96-97
  • 5.6 本章小結(jié)97-98
  • 第六章 總結(jié)和展望98-102
  • 6.1 全文內(nèi)容總結(jié)98-99
  • 6.2 研究展望99-102
  • 參考文獻(xiàn)102-110
  • 致謝110-112
  • 在讀期間發(fā)表的學(xué)術(shù)論文與取得的其他研究成果11

【參考文獻(xiàn)】

中國(guó)期刊全文數(shù)據(jù)庫(kù) 前3條

1 石光明;劉丹華;高大化;劉哲;林杰;王良君;;壓縮感知理論及其研究進(jìn)展[J];電子學(xué)報(bào);2009年05期

2 徐義芳,張金杰,姚開(kāi)盛,曹志剛,王勇前;語(yǔ)音增強(qiáng)用于抗噪聲語(yǔ)音識(shí)別[J];清華大學(xué)學(xué)報(bào)(自然科學(xué)版);2001年01期

3 馬峰;張寧;戴禮榮;;基于語(yǔ)音信號(hào)稀疏性的FDICA初始化和后處理方法[J];數(shù)據(jù)采集與處理;2012年02期


  本文關(guān)鍵詞:基于稀疏表示和字典學(xué)習(xí)的語(yǔ)音增強(qiáng)算法研究,,由筆耕文化傳播整理發(fā)布。



本文編號(hào):304486

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/shoufeilunwen/xxkjbs/304486.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶(hù)6365b***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com