天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁(yè) > 科技論文 > 信息工程論文 >

非平行文本條件下基于i-vector、VAE和GAN的多對(duì)多語(yǔ)音轉(zhuǎn)換算法研究

發(fā)布時(shí)間:2024-03-10 15:02
  語(yǔ)音轉(zhuǎn)換是一種將源語(yǔ)音中的說(shuō)話人身份轉(zhuǎn)換為目標(biāo)說(shuō)話人身份,同時(shí)保留源語(yǔ)音語(yǔ)義信息的技術(shù)。作為一門交叉性較強(qiáng)的學(xué)科,語(yǔ)音轉(zhuǎn)換技術(shù)目前已經(jīng)在文語(yǔ)轉(zhuǎn)換、通信保密、多媒體應(yīng)用、醫(yī)療輔助和語(yǔ)言翻譯等方面得到了重要應(yīng)用,并且在其他領(lǐng)域展現(xiàn)出了廣泛的應(yīng)用前景。目前語(yǔ)音轉(zhuǎn)換模型主要存在兩個(gè)問(wèn)題:一方面是轉(zhuǎn)換后語(yǔ)音的個(gè)性相似度不高,另一方面則是轉(zhuǎn)換后語(yǔ)音的音質(zhì)不夠理想。本文重點(diǎn)研究了基于變分自編碼器和生成對(duì)抗網(wǎng)絡(luò)的語(yǔ)音轉(zhuǎn)換模型,并且針對(duì)上述兩個(gè)問(wèn)題進(jìn)行了相應(yīng)的探討與改進(jìn)。首先,為了實(shí)現(xiàn)更好的說(shuō)話人個(gè)性相似度的語(yǔ)音轉(zhuǎn)換,本文將身份向量i-vector應(yīng)用在基于變分自編碼器和生成對(duì)抗網(wǎng)絡(luò)的語(yǔ)音轉(zhuǎn)換模型中,利用i-vector可以表征說(shuō)話人個(gè)性特征的特性提升了轉(zhuǎn)換后語(yǔ)音的個(gè)性相似度。經(jīng)主觀和客觀評(píng)價(jià)表明,本文提出的方法比基于變分自編碼器和生成對(duì)抗網(wǎng)絡(luò)的方法轉(zhuǎn)換后的語(yǔ)音的平均MCD值降低了3.22%,平均MOS值提升了2.63%,平均ABX值提升了7.35%,說(shuō)明本文提出的方法在提升說(shuō)話人個(gè)性相似度的同時(shí)也改善了語(yǔ)音音質(zhì)。其次,為了實(shí)現(xiàn)更好音質(zhì)的語(yǔ)音轉(zhuǎn)換,本文利用生成性能更好的相對(duì)生成對(duì)抗網(wǎng)絡(luò)改進(jìn)了基于變分自編...

【文章頁(yè)數(shù)】:73 頁(yè)

【學(xué)位級(jí)別】:碩士

【部分圖文】:

圖2.1發(fā)聲器官分區(qū)示意圖

圖2.1發(fā)聲器官分區(qū)示意圖

信號(hào)模型又是以發(fā)聲系統(tǒng)的聲學(xué)原理為基礎(chǔ)而建立首先要對(duì)發(fā)聲系統(tǒng)有一定的了解。本章主要介紹了析了語(yǔ)音轉(zhuǎn)換的基本原理、語(yǔ)音信號(hào)的頻譜轉(zhuǎn)換和價(jià)標(biāo)準(zhǔn)。生機(jī)制的生理機(jī)制動(dòng)產(chǎn)生的聲波,其最低頻率為50Hz,最高頻率為帶產(chǎn)生聲波,經(jīng)聲道發(fā)生共鳴,再經(jīng)口唇輻射,從音,這就是語(yǔ)音。該過(guò)程由肺、氣管....


圖3.1VAE模型結(jié)構(gòu)原理圖

圖3.1VAE模型結(jié)構(gòu)原理圖

圖3.1VAE模型結(jié)構(gòu)原理圖去逼近真實(shí)的后驗(yàn)概率上,KL散度常用來(lái)求兩個(gè)分布間,為了使與的K:(|)(|)))[log(|)log(|)=[log(|)log(|)qzxqzxEqzxpzxEqz....


圖4.6SF3-TM1轉(zhuǎn)換情形下不同系統(tǒng)轉(zhuǎn)換語(yǔ)音的語(yǔ)譜圖

圖4.6SF3-TM1轉(zhuǎn)換情形下不同系統(tǒng)轉(zhuǎn)換語(yǔ)音的語(yǔ)譜圖

換語(yǔ)音與源語(yǔ)音、目標(biāo)語(yǔ)音的語(yǔ)譜圖對(duì)比。從圖4.6可以看出,VAWGAN模型AWGAN+i-vector模型的語(yǔ)譜圖和源語(yǔ)音的語(yǔ)譜圖差別較大,VAWGAN+i-vector模型的轉(zhuǎn)音的語(yǔ)譜圖比VAWGAN模型的轉(zhuǎn)換語(yǔ)音的語(yǔ)譜圖更接近目標(biāo)語(yǔ)音的語(yǔ)譜圖,說(shuō)AWGAN+i-....



本文編號(hào):3924975

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/xinxigongchenglunwen/3924975.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶c6816***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com