采用STRAIGHT模型和深度信念網(wǎng)絡(luò)的語音轉(zhuǎn)換方法
發(fā)布時間:2017-04-17 19:12
本文關(guān)鍵詞:采用STRAIGHT模型和深度信念網(wǎng)絡(luò)的語音轉(zhuǎn)換方法,由筆耕文化傳播整理發(fā)布。
【摘要】:提出一種將STRAIGHT模型和深度信念網(wǎng)絡(luò)DBN相結(jié)合實現(xiàn)語音轉(zhuǎn)換的方式。首先,通過STRAIGHT模型提取出源說話人和目標(biāo)說話人的語音頻譜參數(shù),用提取的頻譜參數(shù)分別訓(xùn)練兩個DBN得到語音高階空間的個性特征信息;然后,用人工神經(jīng)網(wǎng)絡(luò)ANN將兩個具有高階特征的空間連接并進(jìn)行特征轉(zhuǎn)換;最后,用基于目標(biāo)說話人數(shù)據(jù)訓(xùn)練出的DBN來對轉(zhuǎn)換后的特征信息進(jìn)行逆處理得到語音頻譜參數(shù),并用STRAIGHT模型合成具有目標(biāo)說話人個性化特征的語音。實驗結(jié)果表明,采用此種方式獲得的語音轉(zhuǎn)換效果要比傳統(tǒng)的采用GMM實現(xiàn)語音轉(zhuǎn)換更好,轉(zhuǎn)換后的語音音質(zhì)和相似度與目標(biāo)語音更接近。
【作者單位】: 西安建筑科技大學(xué)信息與控制工程學(xué)院;
【關(guān)鍵詞】: 語音轉(zhuǎn)換 STRAIGHT模型 深度信念網(wǎng)絡(luò) 高階空間
【基金】:住房城鄉(xiāng)建設(shè)部科學(xué)技術(shù)項目計劃(2016-R2-045) 西安市碑林區(qū)2014年科技計劃項目(GX1412)
【分類號】:TN912.3
【正文快照】: 1引言語音轉(zhuǎn)換就是在語義保持不變的前提下,改動語音的個性特點,使一個人的語音聽起來像另外一個人的語音。當(dāng)前國外的學(xué)者在語音轉(zhuǎn)換方面進(jìn)行了很多研究,比較經(jīng)典的方法有:采用隱馬爾可夫模型HMM(Hidden Markov Model)[1]、頻譜彎折FW(Frequency Warping)[2]、碼書映射CM(Co-
【相似文獻(xiàn)】
中國期刊全文數(shù)據(jù)庫 前2條
1 張正軍;楊衛(wèi)英;陳贊;;基于STRAIGHT模型和人工神經(jīng)網(wǎng)絡(luò)的語音轉(zhuǎn)換[J];電聲技術(shù);2010年09期
2 ;[J];;年期
本文關(guān)鍵詞:采用STRAIGHT模型和深度信念網(wǎng)絡(luò)的語音轉(zhuǎn)換方法,,由筆耕文化傳播整理發(fā)布。
本文編號:314107
本文鏈接:http://sikaile.net/kejilunwen/xinxigongchenglunwen/314107.html
最近更新
教材專著