基于深度學(xué)習(xí)的彝語語音合成的研究
【文章頁數(shù)】:47 頁
【學(xué)位級別】:碩士
【部分圖文】:
圖4.2基線E2E模型在使用實驗數(shù)據(jù)A時的損失收斂圖
第4章彝語語音合成的實驗23為0.5,在進行到40k步時進行衰減。訓(xùn)練均進行100k步,訓(xùn)練過程中進行觀察,每5k步進行一次驗證集的驗證,保證訓(xùn)練的模型不會有太大偏差。沒訓(xùn)練好的模型在預(yù)測時,G&L算法的能量參數(shù)設(shè)置為1.2,而其迭代上限為60次。4.2.3實驗評測本文對基于E2....
圖4.4帶有文本分析的E2E模型在使用實驗數(shù)據(jù)A時的損失收斂圖
第4章彝語語音合成的實驗24對于帶有文本分析的E2E模型框架,由于加入了專家知識,網(wǎng)絡(luò)結(jié)構(gòu)多出一部分,參數(shù)訓(xùn)練相對變多。當(dāng)實驗數(shù)據(jù)僅為A時,在35k步左右才趨于平緩,也在70k步左右基本收斂,而使用全部數(shù)據(jù)時,收斂仍在35k不左右趨于平緩,而在70k步左右基本收斂?偟脕碚f,當(dāng)實....
圖4.3基線E2E模型在使用實驗數(shù)據(jù)A、B時的損失收斂圖
第4章彝語語音合成的實驗24對于帶有文本分析的E2E模型框架,由于加入了專家知識,網(wǎng)絡(luò)結(jié)構(gòu)多出一部分,參數(shù)訓(xùn)練相對變多。當(dāng)實驗數(shù)據(jù)僅為A時,在35k步左右才趨于平緩,也在70k步左右基本收斂,而使用全部數(shù)據(jù)時,收斂仍在35k不左右趨于平緩,而在70k步左右基本收斂?偟脕碚f,當(dāng)實....
圖4.5帶有文本分析的E2E模型在使用實驗數(shù)據(jù)A、B時的損失收斂圖
第4章彝語語音合成的實驗25表4.4為針對兩個實驗在不同實驗數(shù)據(jù)下,產(chǎn)生不同結(jié)果后計算所得的MCD,表中結(jié)果分為在驗證集上的結(jié)果和在測試集中的結(jié)果。由表4.4可以看出實驗語料數(shù)量的增多可以有效地降低MCD,即有效地提高合成語音和原始語音的相似度,同時還可以觀察出帶有文本分析的E2....
本文編號:3978876
本文鏈接:http://sikaile.net/kejilunwen/zidonghuakongzhilunwen/3978876.html