基于生成對抗網(wǎng)絡(luò)合成噪聲的語音增強方法研究
發(fā)布時間:2023-02-15 19:59
在語音增強領(lǐng)域,深度神經(jīng)網(wǎng)絡(luò)通過對大量含有不同噪聲的語音以監(jiān)督學(xué)習(xí)方式進行訓(xùn)練建模,從而提升網(wǎng)絡(luò)的語音增強能力。然而不同類型噪聲的獲取成本較大,噪聲類型難以全面采集,影響了模型的泛化能力。針對這個問題,提出一種基于生成對抗網(wǎng)絡(luò)(Generative Adversarial Networks,GAN)的噪聲數(shù)據(jù)樣本增強方法,該方法對真實噪聲數(shù)據(jù)進行學(xué)習(xí),根據(jù)數(shù)據(jù)特征合成虛擬噪聲,以此擴充訓(xùn)練集中噪聲數(shù)據(jù)的數(shù)量和類型。通過實驗驗證,所采用的噪聲合成方法能夠有效擴展訓(xùn)練集中噪聲來源,增強模型的泛化能力,有效提高語音信號去噪處理后的信噪比和可理解性。
【文章頁數(shù)】:5 頁
【文章目錄】:
0 引言
1 生成對抗網(wǎng)絡(luò)
1.1 GAN的簡單介紹
1.2 噪聲生成網(wǎng)絡(luò)WGAN
1.2.1 輸入和輸出
1.2.2 網(wǎng)絡(luò)結(jié)構(gòu)
1.3 語音增強網(wǎng)絡(luò)SEGAN
2 實驗
2.1 實驗配置
2.2 實驗結(jié)果
2.2.1 生成噪音數(shù)據(jù)樣本
2.2.2 基于SEGAN模型的語音增強性能比較
3 結(jié)論
本文編號:3743752
【文章頁數(shù)】:5 頁
【文章目錄】:
0 引言
1 生成對抗網(wǎng)絡(luò)
1.1 GAN的簡單介紹
1.2 噪聲生成網(wǎng)絡(luò)WGAN
1.2.1 輸入和輸出
1.2.2 網(wǎng)絡(luò)結(jié)構(gòu)
1.3 語音增強網(wǎng)絡(luò)SEGAN
2 實驗
2.1 實驗配置
2.2 實驗結(jié)果
2.2.1 生成噪音數(shù)據(jù)樣本
2.2.2 基于SEGAN模型的語音增強性能比較
3 結(jié)論
本文編號:3743752
本文鏈接:http://sikaile.net/kejilunwen/wltx/3743752.html
最近更新
教材專著