聲學回聲消除與波束成形語音增強方法研究
發(fā)布時間:2021-08-08 23:51
語音是人類最自然的交互方式。近年來,智能音箱得到市場認可,發(fā)展迅速,方便了人們的生活。但是,當人們距離智能設(shè)備較遠時,麥克風陣列采集的語音信號的信噪比較低,若不經(jīng)過語音增強處理而直接進行識別,其語音識別效果會很差。此外,當智能設(shè)備本身播放聲音時進行語音關(guān)鍵詞喚醒,其難度較大,而若應(yīng)用聲學回聲消除技術(shù),這會明顯提高喚醒率。單聲道語音增強方法雖然能夠有效地抑制背景噪聲,但會對期望信號造成畸變,而麥克風陣列波束成形技術(shù)則可以有效地增強語音信號且語音失真度較小。本文利用麥克風陣列信號估計聲場傳遞函數(shù)比,進行語音分離,然后進一步用維納濾波進行降噪處理。此外,研究了聲學回聲消除技術(shù)。本文的主要工作如下:(1)介紹了麥克風陣列語音增強算法的國內(nèi)外研究現(xiàn)狀和聲學回聲消除的背景,簡述了幾種聲源定位和語音重疊幀檢測算法。(2)基于WebRTC開源代碼中的AEC模塊,實現(xiàn)了聲學回聲消除。特別是,在算法實現(xiàn)過程中,采用分塊頻域自適應(yīng)濾波算法,并在歸一化最小均方算法中加入防梯度爆炸處理,保證了算法的實時性和回聲消除性能。此外,應(yīng)用非線性處理技術(shù),去除殘余回聲,省去了雙端檢測處理。實驗結(jié)果表明,本文的聲學回聲消除...
【文章來源】:大連理工大學遼寧省 211工程院校 985工程院校 教育部直屬院校
【文章頁數(shù)】:59 頁
【學位級別】:碩士
【文章目錄】:
摘要
Abstract
1 緒論
1.1 選題的背景及意義
1.2 麥克風陣列技術(shù)
1.3 發(fā)展歷程及研究現(xiàn)狀
1.3.1 波束成形
1.3.2 語音重疊幀檢測
1.3.3 聲源定位
1.4 本文結(jié)構(gòu)安排
2 相關(guān)背景知識
2.1 信號處理數(shù)學基礎(chǔ)
2.2 回聲消除背景知識
2.2.1 自適應(yīng)濾波器
2.2.2 LMS算法
2.2.3 NLMS算法
2.3 麥克風陣列聲源測向算法
2.3.1 傳統(tǒng)譜估計法
2.3.2 Capon最小方差算法
2.3.3 MUSIC算法測向
3 聲學回聲消除
3.1 基于WebRTC的AEC算法
3.1.1 算法簡介
3.1.2 AEC算法流程
3.1.3 遠端和近端信號延時對齊
3.1.4 非線性處理(NLP)
3.2 改進算法
3.2.1 分塊頻域自適應(yīng)濾波算法
3.2.2 聯(lián)合最優(yōu)NLMS算法
3.2.3 改進算法
3.3 性能評估
3.3.1 實驗條件
3.3.2 實驗波形圖
3.3.3 ERLE和SER測試
3.3.4 歸一化失配率
4 改進LCMV結(jié)合WPF波束成形算法
4.1 波束成形算法
4.1.1 波束成形最優(yōu)權(quán)重矢量
4.1.2 MVDR算法
4.1.3 LCMV算法
4.1.4 GSC結(jié)構(gòu)
4.2 基于LCMV和后置濾波的波束成形算法
4.2.1 改進的自適應(yīng)波束成形
4.2.2 語音重疊幀檢測算法
4.2.3 說話人索引
4.3 性能評估
4.3.1 實驗條件
4.3.2 實際錄音增強
4.3.3 語音分離能力評估
4.3.4 輸出信干噪比評估
4.3.5 增強語音MOS值
結(jié)論
參考文獻
致謝
本文編號:3330925
【文章來源】:大連理工大學遼寧省 211工程院校 985工程院校 教育部直屬院校
【文章頁數(shù)】:59 頁
【學位級別】:碩士
【文章目錄】:
摘要
Abstract
1 緒論
1.1 選題的背景及意義
1.2 麥克風陣列技術(shù)
1.3 發(fā)展歷程及研究現(xiàn)狀
1.3.1 波束成形
1.3.2 語音重疊幀檢測
1.3.3 聲源定位
1.4 本文結(jié)構(gòu)安排
2 相關(guān)背景知識
2.1 信號處理數(shù)學基礎(chǔ)
2.2 回聲消除背景知識
2.2.1 自適應(yīng)濾波器
2.2.2 LMS算法
2.2.3 NLMS算法
2.3 麥克風陣列聲源測向算法
2.3.1 傳統(tǒng)譜估計法
2.3.2 Capon最小方差算法
2.3.3 MUSIC算法測向
3 聲學回聲消除
3.1 基于WebRTC的AEC算法
3.1.1 算法簡介
3.1.2 AEC算法流程
3.1.3 遠端和近端信號延時對齊
3.1.4 非線性處理(NLP)
3.2 改進算法
3.2.1 分塊頻域自適應(yīng)濾波算法
3.2.2 聯(lián)合最優(yōu)NLMS算法
3.2.3 改進算法
3.3 性能評估
3.3.1 實驗條件
3.3.2 實驗波形圖
3.3.3 ERLE和SER測試
3.3.4 歸一化失配率
4 改進LCMV結(jié)合WPF波束成形算法
4.1 波束成形算法
4.1.1 波束成形最優(yōu)權(quán)重矢量
4.1.2 MVDR算法
4.1.3 LCMV算法
4.1.4 GSC結(jié)構(gòu)
4.2 基于LCMV和后置濾波的波束成形算法
4.2.1 改進的自適應(yīng)波束成形
4.2.2 語音重疊幀檢測算法
4.2.3 說話人索引
4.3 性能評估
4.3.1 實驗條件
4.3.2 實際錄音增強
4.3.3 語音分離能力評估
4.3.4 輸出信干噪比評估
4.3.5 增強語音MOS值
結(jié)論
參考文獻
致謝
本文編號:3330925
本文鏈接:http://sikaile.net/kejilunwen/wltx/3330925.html
最近更新
教材專著