基于雙因子高斯過(guò)程動(dòng)態(tài)模型的聲道譜轉(zhuǎn)換方法
本文關(guān)鍵詞:基于雙因子高斯過(guò)程動(dòng)態(tài)模型的聲道譜轉(zhuǎn)換方法 出處:《自動(dòng)化學(xué)報(bào)》2014年06期 論文類型:期刊論文
更多相關(guān)文章: 聲道譜轉(zhuǎn)換 高斯過(guò)程隱變量模型 雙因子模型 隱馬爾科夫模型 語(yǔ)音動(dòng)態(tài)特征
【摘要】:針對(duì)作者已經(jīng)提出的雙因子高斯過(guò)程隱變量模型(Two-factorGaussianprocesslatentvariablemodel,TF-GPLVM)用于語(yǔ)音轉(zhuǎn)換時(shí)未考慮語(yǔ)音的動(dòng)態(tài)特征,并且模型訓(xùn)練時(shí)需要估計(jì)的參數(shù)較多的問(wèn)題,提出引入隱馬爾科夫模型(Hidden Markov model,HMM)對(duì)語(yǔ)音動(dòng)態(tài)特征進(jìn)行建模,并利用HMM隱狀態(tài)對(duì)各幀語(yǔ)音進(jìn)行關(guān)于語(yǔ)義內(nèi)容的概率軟分類,建立了分離精度更高、運(yùn)算負(fù)荷較小的雙因子高斯過(guò)程動(dòng)態(tài)模型(Two-factor Gaussian process dynamic model,TF-GPDM).基于此模型,設(shè)計(jì)了一種全新的基于說(shuō)話人特征替換的語(yǔ)音聲道譜轉(zhuǎn)換方案.主、客觀實(shí)驗(yàn)結(jié)果表明,無(wú)論是與傳統(tǒng)的統(tǒng)計(jì)映射和頻率彎折轉(zhuǎn)換方法相比,還是與雙因子高斯過(guò)程隱變量模型方法相比,本文方法都獲得了語(yǔ)音質(zhì)量和轉(zhuǎn)換相似度的提升,以及兩項(xiàng)性能的更佳平衡.
[Abstract]:Aiming at the two-factor Gao Si process hidden variable model proposed by the author, the Two-factor Gaussian process variable model is proposed. TF-GPLVM) does not take into account the dynamic features of speech when it is used in speech conversion, and the model training needs to estimate more parameters. A Hidden Markov model (HMMM) is proposed to model speech dynamic features. And the HMM hidden state is used to classify each frame of speech with probability soft classification about semantic content, and the separation accuracy is higher. Two-factor Gaussian process dynamic model, a two-factor Gaussian process dynamic model with low computational load. Based on this model, a novel speech channel spectrum conversion scheme based on speaker feature replacement is designed. Compared with the traditional statistical mapping and frequency bending transformation methods, or compared with the hidden variable model of two-factor Gaussian process, the proposed method can improve the speech quality and transform similarity. And a better balance between the two properties.
【作者單位】: 解放軍理工大學(xué)通信工程學(xué)院;解放軍理工大學(xué)指揮信息系統(tǒng)學(xué)院;
【基金】:國(guó)家自然科學(xué)基金(61072042) 江蘇省自然科學(xué)基金(BK2012510) 解放軍理工大學(xué)預(yù)先研究基金(20110205,20110211)資助~~
【分類號(hào)】:TN912.3
【正文快照】: 語(yǔ)音轉(zhuǎn)換(Voice conversion,VC)是在保持語(yǔ)義內(nèi)容信息不變的前提下,通過(guò)改變語(yǔ)音中源說(shuō)話 人聲音特征,使之具有目標(biāo)說(shuō)話人聲音特征的處理技術(shù)[1].語(yǔ)音轉(zhuǎn)換在個(gè)性化人機(jī)交互、信息安全、多媒體娛樂(lè)等領(lǐng)域有廣泛的應(yīng)用前景.例如,將語(yǔ)音轉(zhuǎn)換和文語(yǔ)轉(zhuǎn)換(Text-to-speech,TTS)技術(shù)
【共引文獻(xiàn)】
相關(guān)期刊論文 前2條
1 XU Ning;BAO JingYi;LIU XiaoFeng;JIANG AiMing;TANG YiBing;;Voice conversion towards modeling dynamic characteristics using switching state space model[J];Science China(Information Sciences);2013年12期
2 王志衛(wèi);徐寧;劉小峰;;一種基于碼書映射的高效語(yǔ)音轉(zhuǎn)換方法[J];微處理機(jī);2014年01期
相關(guān)會(huì)議論文 前1條
1 宋鵬;王浩;趙力;;基于混合高斯歸一化的語(yǔ)音轉(zhuǎn)換算法[A];第十二屆全國(guó)人機(jī)語(yǔ)音通訊學(xué)術(shù)會(huì)議(NCMMSC'2013)論文集[C];2013年
相關(guān)博士學(xué)位論文 前1條
1 陳凌輝;說(shuō)話人轉(zhuǎn)換建模方法研究[D];中國(guó)科學(xué)技術(shù)大學(xué);2013年
相關(guān)碩士學(xué)位論文 前1條
1 李冰潔;采用譜—韻律雙變換的語(yǔ)音情感轉(zhuǎn)換[D];蘇州大學(xué);2013年
,本文編號(hào):1417234
本文鏈接:http://sikaile.net/kejilunwen/wltx/1417234.html