基于深度神經(jīng)網(wǎng)絡(luò)和循環(huán)神經(jīng)網(wǎng)絡(luò)的語音增強方法研究
發(fā)布時間:2021-05-22 00:38
語音增強是指從含有噪聲的語音信號中恢復(fù)純凈語音信號的任務(wù)。語音增強的目的是為了提高被噪聲干擾的語音信號的語音質(zhì)量和可懂度。語音增強有很多的應(yīng)用領(lǐng)域,包括移動語音通信、助聽器設(shè)計、自動語音識別和自動說話人識別等。在過去的幾十年里,科學(xué)家們提出了很多語音增強方法。例如譜減法和維納濾波法,但這兩種經(jīng)典方法的一個共同問題是將“音樂噪聲”引入到了增強后的語音中;直到Malah等人提出了基于最小均方誤差估計的語音增強模型,才取得了優(yōu)于譜減法和維納濾波的性能,音樂噪聲的問題也得到了有效改善;在此之后,眾多的基于最小均方誤差的語音增強方法被科學(xué)家們提出,例如基于最小均方誤差準則的對數(shù)譜幅度估計算法和最優(yōu)改進的對數(shù)譜幅度估計算法。在這些傳統(tǒng)方法中,大部分方法都假設(shè)噪聲頻譜的估計是可用而且準確的,然而在低信噪比的條件下,噪聲模型卻很難被準確估計,這樣就會導(dǎo)致語音增強后的信號出現(xiàn)失真現(xiàn)象。為了克服傳統(tǒng)語音增強方法的不足,基于深度學(xué)習(xí)的語音增強方法近些年來發(fā)展迅速,深度神經(jīng)網(wǎng)絡(luò)已被成功地應(yīng)用于語音增強模型的訓(xùn)練。這些新方法使用的訓(xùn)練網(wǎng)絡(luò)主要包括深度神經(jīng)網(wǎng)絡(luò)、卷積神經(jīng)網(wǎng)絡(luò)、遞歸神經(jīng)網(wǎng)絡(luò)、生成對抗網(wǎng)絡(luò)等。此外,還...
【文章來源】:中國工程物理研究院北京市
【文章頁數(shù)】:55 頁
【學(xué)位級別】:碩士
【文章目錄】:
摘要
Abstract
第1章 緒論
1.1 課題研究背景及意義
1.2 語音增強
1.2.1 語音增強定義
1.2.2 語音增強分類
1.3 語音增強方法
1.3.1 傳統(tǒng)語音增強方法
1.3.2 基于監(jiān)督的語音增強方法
1.4 論文的研究內(nèi)容和結(jié)構(gòu)安排
1.4.1 主要研究內(nèi)容
1.4.2 論文結(jié)構(gòu)安排
第2章 基于深度神經(jīng)網(wǎng)絡(luò)的語音增強方法
2.1 引言
2.2 深度神經(jīng)網(wǎng)絡(luò)框架
2.3 基于有監(jiān)督學(xué)習(xí)的網(wǎng)絡(luò)訓(xùn)練
2.4 深度神經(jīng)網(wǎng)絡(luò)的目標優(yōu)化函數(shù)
2.4.1 基于特征映射的語音增強方法
2.4.2 基于時頻掩蔽的語音增強方法
2.5 本章小結(jié)
第3章 基于循環(huán)神經(jīng)網(wǎng)絡(luò)的語音分類方法
3.1 引言
3.2 循環(huán)神經(jīng)網(wǎng)絡(luò)框架
3.3 基于有監(jiān)督學(xué)習(xí)的網(wǎng)絡(luò)訓(xùn)練
3.4 循環(huán)神經(jīng)網(wǎng)絡(luò)的優(yōu)化方法
3.4.1 梯度爆炸和梯度消失
3.4.2 門控循環(huán)單元網(wǎng)絡(luò)
3.5 本章小結(jié)
第4章 基于深度神經(jīng)網(wǎng)絡(luò)和循環(huán)神經(jīng)網(wǎng)絡(luò)的語音增強方法
4.1 引言
4.2 系統(tǒng)框圖
4.3 特征提取
4.3.1 頻域特征
4.3.2 時域特征
4.4 增強模型訓(xùn)練
4.4.1 基于深度神經(jīng)網(wǎng)絡(luò)的增強模型訓(xùn)練
4.4.2 基于循環(huán)神經(jīng)網(wǎng)絡(luò)的分類模型訓(xùn)練
4.5 模型融合
4.6 本章小結(jié)
第5章 實驗配置和結(jié)果分析
5.1 實驗配置
5.1.1 樣本數(shù)據(jù)配置
5.1.2 訓(xùn)練模型參數(shù)配置
5.2 結(jié)果分析
5.2.1 實驗結(jié)果
5.2.2 數(shù)據(jù)分析
第6章 總結(jié)與展望
6.1 本文的主要研究工作和創(chuàng)新點
6.2 后續(xù)研究工作展望
致謝
參考文獻
發(fā)表論文與科研情況說明
本文編號:3200651
【文章來源】:中國工程物理研究院北京市
【文章頁數(shù)】:55 頁
【學(xué)位級別】:碩士
【文章目錄】:
摘要
Abstract
第1章 緒論
1.1 課題研究背景及意義
1.2 語音增強
1.2.1 語音增強定義
1.2.2 語音增強分類
1.3 語音增強方法
1.3.1 傳統(tǒng)語音增強方法
1.3.2 基于監(jiān)督的語音增強方法
1.4 論文的研究內(nèi)容和結(jié)構(gòu)安排
1.4.1 主要研究內(nèi)容
1.4.2 論文結(jié)構(gòu)安排
第2章 基于深度神經(jīng)網(wǎng)絡(luò)的語音增強方法
2.1 引言
2.2 深度神經(jīng)網(wǎng)絡(luò)框架
2.3 基于有監(jiān)督學(xué)習(xí)的網(wǎng)絡(luò)訓(xùn)練
2.4 深度神經(jīng)網(wǎng)絡(luò)的目標優(yōu)化函數(shù)
2.4.1 基于特征映射的語音增強方法
2.4.2 基于時頻掩蔽的語音增強方法
2.5 本章小結(jié)
第3章 基于循環(huán)神經(jīng)網(wǎng)絡(luò)的語音分類方法
3.1 引言
3.2 循環(huán)神經(jīng)網(wǎng)絡(luò)框架
3.3 基于有監(jiān)督學(xué)習(xí)的網(wǎng)絡(luò)訓(xùn)練
3.4 循環(huán)神經(jīng)網(wǎng)絡(luò)的優(yōu)化方法
3.4.1 梯度爆炸和梯度消失
3.4.2 門控循環(huán)單元網(wǎng)絡(luò)
3.5 本章小結(jié)
第4章 基于深度神經(jīng)網(wǎng)絡(luò)和循環(huán)神經(jīng)網(wǎng)絡(luò)的語音增強方法
4.1 引言
4.2 系統(tǒng)框圖
4.3 特征提取
4.3.1 頻域特征
4.3.2 時域特征
4.4 增強模型訓(xùn)練
4.4.1 基于深度神經(jīng)網(wǎng)絡(luò)的增強模型訓(xùn)練
4.4.2 基于循環(huán)神經(jīng)網(wǎng)絡(luò)的分類模型訓(xùn)練
4.5 模型融合
4.6 本章小結(jié)
第5章 實驗配置和結(jié)果分析
5.1 實驗配置
5.1.1 樣本數(shù)據(jù)配置
5.1.2 訓(xùn)練模型參數(shù)配置
5.2 結(jié)果分析
5.2.1 實驗結(jié)果
5.2.2 數(shù)據(jù)分析
第6章 總結(jié)與展望
6.1 本文的主要研究工作和創(chuàng)新點
6.2 后續(xù)研究工作展望
致謝
參考文獻
發(fā)表論文與科研情況說明
本文編號:3200651
本文鏈接:http://sikaile.net/shoufeilunwen/xixikjs/3200651.html
最近更新
教材專著