噪聲環(huán)境下的語音激活檢測算法研究
發(fā)布時間:2017-03-19 03:08
本文關(guān)鍵詞:噪聲環(huán)境下的語音激活檢測算法研究,,由筆耕文化傳播整理發(fā)布。
【摘要】:變速率語音編碼技術(shù)在陸地蜂窩移動通信、衛(wèi)星移動通信、VoIP等數(shù)字通信系統(tǒng)中有著廣泛的應(yīng)用前景,而語音激活檢測(Voice Activity Detection,VAD)算法是實現(xiàn)變速率語音編碼的關(guān)鍵技術(shù)之一。采用VAD算法實現(xiàn)的變速率聲碼器能在合成語音質(zhì)量和帶寬資源之間取得靈活的折衷,因此,研究出穩(wěn)健、可靠的VAD算法,尤其是在噪聲環(huán)境下,對變速率語音編碼技術(shù)的發(fā)展具有重要的意義。目前,語音激活檢測方面已有不少的研究成果,其中,基于隱馬爾科夫模型(Hidden Markov Model,HMM)的VAD算法能夠較好地區(qū)分話音信號和背景噪聲信號,是目前數(shù)字語音信號處理重點研究課題。本文從課題的研究背景與現(xiàn)狀入手,簡要闡述了VAD算法的基本原理和噪聲特性,介紹了自適應(yīng)多速率編碼(Adaptive Multi-Rate,AMR)標準中和G.729B編碼標準中的VAD算法的實現(xiàn)過程,并分析其優(yōu)缺點。然后重點研究了基于HMM模型的VAD算法并進行改進。最后將其應(yīng)用到了低速率聲碼器中,實現(xiàn)了一種可變速率的聲碼器。具體工作如下:1.為了改善現(xiàn)有基于HMM模型VAD算法對噪聲的跟蹤性能,本文采用Baum-Welch算法對具有不同特性的噪聲進行訓練,并生成相應(yīng)的噪聲模型,建立了噪聲模型庫。在檢測時,根據(jù)待測語音背景噪聲的不同,動態(tài)地匹配噪聲庫中的噪聲模型。同時,本文對閾值計算方法進行改進,提高算法判決準確率。實驗結(jié)果表明,本文算法具有較高的檢測準確率及較好的噪聲跟蹤能力。2.將改進后的VAD算法通過非連續(xù)傳輸技術(shù)應(yīng)用到4kb/s混合激勵線性預(yù)測(Mixed Excitation Linear Prediction,MELP)聲碼器中。編碼器端對VAD判決出的話音幀采用全速率編碼,而對判決出的背景噪聲幀采用較低速率編碼或者不編碼,從而實現(xiàn)了一種可變速率聲碼器。性能測試結(jié)果表明,本文實現(xiàn)的可變速率聲碼器在保證合成語音語音質(zhì)量情況下,平均編碼速率大幅度降低,說明了本文VAD算法在實時語音中具有良好的實用性。
【關(guān)鍵詞】:變速率語音編碼 MELP VAD HMM
【學位授予單位】:重慶郵電大學
【學位級別】:碩士
【學位授予年份】:2016
【分類號】:TN912.3
【目錄】:
- 摘要3-4
- Abstract4-11
- 注釋表11-12
- 第1章 緒論12-19
- 1.1 論文的研究背景及意義12-13
- 1.2 國內(nèi)外研究現(xiàn)狀13-15
- 1.3 評價指標15-17
- 1.3.1 VAD算法的評價指標15-16
- 1.3.2 變速率聲碼器性能評價指標16-17
- 1.4 論文的組織結(jié)構(gòu)17-19
- 第2章 語音激活檢測算法分析19-33
- 2.1 語音激活檢測算法的基本原理19-25
- 2.1.1 預(yù)處理模塊19-20
- 2.1.2 特征參數(shù)提取20-24
- 2.1.3 判決方法24
- 2.1.4 VAD輸出24-25
- 2.2 噪聲特性及分類25-28
- 2.2.1 噪聲特性25-26
- 2.2.2 噪聲分類26-28
- 2.3 語音編碼標準中的VAD算法28-32
- 2.3.1 AMR中的VAD算法28-30
- 2.3.2 G.729B中的VAD算法30-32
- 2.4 本章小結(jié)32-33
- 第3章 基于HMM模型的語音激活檢測算法33-54
- 3.1 HMM模型的基本原理33-40
- 3.1.1 HMM模型的定義33-34
- 3.1.2 HMM模型的三個基本問題34-39
- 3.1.3 連續(xù)的HMM模型39-40
- 3.2 基于HMM模型的VAD算法基本原理40-42
- 3.2.1 訓練模塊40-41
- 3.2.2 檢測模塊41-42
- 3.3 改進的基于HMM模型的VAD算法42-46
- 3.4 實驗結(jié)果及分析46-52
- 3.5 本章小結(jié)52-54
- 第4章 基于HMM模型的VAD算法在語音編碼中的應(yīng)用54-70
- 4.1 4kb/s MELP聲碼器的實現(xiàn)54-57
- 4.1.1 MELP編碼器原理54-55
- 4.1.2 MELP解碼器原理55-56
- 4.1.3 4kb/s MELP聲碼器的實現(xiàn)56-57
- 4.2 變速率聲碼器的實現(xiàn)57-61
- 4.2.1 DTX技術(shù)57-59
- 4.2.2 舒適噪聲生成59
- 4.2.3 編解碼器的實現(xiàn)59-61
- 4.3 性能測試及分析61-68
- 4.3.1 仿真結(jié)果61-64
- 4.3.2 PESQ值測試64-66
- 4.3.3 平均編碼速率估算66-68
- 4.4 本章小結(jié)68-70
- 第5章 總結(jié)與展望70-72
- 5.1 論文總結(jié)70-71
- 5.2 后續(xù)工作研究71-72
- 參考文獻72-76
- 致謝76-77
- 攻讀碩士學位期間從事的科研工作及取得的成果77
【參考文獻】
中國期刊全文數(shù)據(jù)庫 前3條
1 張金榜;尹冬梅;;基于統(tǒng)計模型的語音激活檢測算法改進[J];微型機與應(yīng)用;2015年12期
2 肖佳林;趙聿晴;王英;;基于HMM與SVM的語音活動檢測[J];計算機工程;2014年01期
3 王民;任雪妮;孫潔;;一種高效的基音檢測與評估算法[J];計算機工程與應(yīng)用;2014年14期
本文關(guān)鍵詞:噪聲環(huán)境下的語音激活檢測算法研究,由筆耕文化傳播整理發(fā)布。
本文編號:255435
本文鏈接:http://sikaile.net/kejilunwen/xinxigongchenglunwen/255435.html
最近更新
教材專著