非平行文本下基于變分自編碼器和輔助分類器生成對抗網(wǎng)絡(luò)的語音轉(zhuǎn)換
發(fā)布時間:2024-01-16 18:43
提出了1種基于變分自編碼器和輔助分類器生成對抗網(wǎng)絡(luò)的語音轉(zhuǎn)換方法,實(shí)現(xiàn)了非平行文本條件下多對多的高質(zhì)量語音轉(zhuǎn)換.在該方法中,利用輔助分類器生成對抗網(wǎng)絡(luò)替代基于變分自編碼器和生成對抗網(wǎng)絡(luò)模型中的Wasserstein生成對抗網(wǎng)絡(luò).由于輔助分類器生成對抗網(wǎng)絡(luò)將特征樣本的類別標(biāo)簽作為輔助信息,其鑒別器不僅能預(yù)測樣本真假,還能預(yù)測生成樣本所屬的類別,從而提高了生成對抗網(wǎng)絡(luò)的生成效果.充分的客觀和主觀評價表明:本文提出的方法明顯優(yōu)于基準(zhǔn)模型,在顯著改善語音質(zhì)量的同時也有效提升了說話人個性的相似度.
【文章頁數(shù)】:8 頁
本文編號:3879002
【文章頁數(shù)】:8 頁
本文編號:3879002
本文鏈接:http://sikaile.net/kejilunwen/xinxigongchenglunwen/3879002.html
最近更新
教材專著