基于SI-SDR優(yōu)化的生成對(duì)抗網(wǎng)絡(luò)語(yǔ)音增強(qiáng)方法
發(fā)布時(shí)間:2025-02-06 19:34
為了解決現(xiàn)有的生成對(duì)抗網(wǎng)絡(luò)(GAN)語(yǔ)音增強(qiáng)方法模型訓(xùn)練不穩(wěn)定、生成語(yǔ)音質(zhì)量不高的問(wèn)題,提出一種尺度不變信號(hào)失真比(SI-SDR)優(yōu)化的相對(duì)平均生成對(duì)抗網(wǎng)絡(luò)(Ra GAN)語(yǔ)音增強(qiáng)方法.首先,構(gòu)建一個(gè)基于生成對(duì)抗網(wǎng)絡(luò)的端到端語(yǔ)音增強(qiáng)模型;然后,在模型中加入相對(duì)平均判別器,將真實(shí)數(shù)據(jù)和生成數(shù)據(jù)得分的差值作為模型訓(xùn)練的參考,顯著增強(qiáng)了模型訓(xùn)練的穩(wěn)定性;最后,采用SI-SDR直接度量生成語(yǔ)音的質(zhì)量得分,并改進(jìn)生成器訓(xùn)練的損失函數(shù),將提高生成語(yǔ)音質(zhì)量作為模型優(yōu)化的目標(biāo).實(shí)驗(yàn)結(jié)果表明:相比基線方法,該方法可以有效提高未知噪聲和低信噪比條件下的語(yǔ)音增強(qiáng)性能,增強(qiáng)后的語(yǔ)音具有更好的聽覺(jué)質(zhì)量和可懂性.
【文章頁(yè)數(shù)】:7 頁(yè)
本文編號(hào):4030804
【文章頁(yè)數(shù)】:7 頁(yè)
本文編號(hào):4030804
本文鏈接:http://sikaile.net/kejilunwen/xinxigongchenglunwen/4030804.html
最近更新
教材專著