非平行文本條件下基于i-vector、VAE和GAN的多對(duì)多語(yǔ)音轉(zhuǎn)換算法研究
【文章頁(yè)數(shù)】:73 頁(yè)
【學(xué)位級(jí)別】:碩士
【部分圖文】:
圖2.1發(fā)聲器官分區(qū)示意圖
信號(hào)模型又是以發(fā)聲系統(tǒng)的聲學(xué)原理為基礎(chǔ)而建立首先要對(duì)發(fā)聲系統(tǒng)有一定的了解。本章主要介紹了析了語(yǔ)音轉(zhuǎn)換的基本原理、語(yǔ)音信號(hào)的頻譜轉(zhuǎn)換和價(jià)標(biāo)準(zhǔn)。生機(jī)制的生理機(jī)制動(dòng)產(chǎn)生的聲波,其最低頻率為50Hz,最高頻率為帶產(chǎn)生聲波,經(jīng)聲道發(fā)生共鳴,再經(jīng)口唇輻射,從音,這就是語(yǔ)音。該過(guò)程由肺、氣管....
圖3.1VAE模型結(jié)構(gòu)原理圖
圖3.1VAE模型結(jié)構(gòu)原理圖去逼近真實(shí)的后驗(yàn)概率上,KL散度常用來(lái)求兩個(gè)分布間,為了使與的K:(|)(|)))[log(|)log(|)=[log(|)log(|)qzxqzxEqzxpzxEqz....
圖4.6SF3-TM1轉(zhuǎn)換情形下不同系統(tǒng)轉(zhuǎn)換語(yǔ)音的語(yǔ)譜圖
換語(yǔ)音與源語(yǔ)音、目標(biāo)語(yǔ)音的語(yǔ)譜圖對(duì)比。從圖4.6可以看出,VAWGAN模型AWGAN+i-vector模型的語(yǔ)譜圖和源語(yǔ)音的語(yǔ)譜圖差別較大,VAWGAN+i-vector模型的轉(zhuǎn)音的語(yǔ)譜圖比VAWGAN模型的轉(zhuǎn)換語(yǔ)音的語(yǔ)譜圖更接近目標(biāo)語(yǔ)音的語(yǔ)譜圖,說(shuō)AWGAN+i-....
本文編號(hào):3924975
本文鏈接:http://sikaile.net/kejilunwen/xinxigongchenglunwen/3924975.html