深度學(xué)習(xí)語音合成技術(shù)研究
發(fā)布時間:2021-04-04 00:18
語音合成在人機(jī)交互中扮演著重要角色,伴隨著深度學(xué)習(xí)的發(fā)展,語音合成也進(jìn)入新的發(fā)展階段。文章對基于深度學(xué)習(xí)的語音合成系統(tǒng)進(jìn)行研究,總結(jié)分析深度學(xué)習(xí)語音合成特點,并詳細(xì)介紹四個深度學(xué)習(xí)語音合成系統(tǒng)。這四個系統(tǒng)包含了單說話人、多說話人和任意說話人的語音合成,分析這些系統(tǒng)可以學(xué)習(xí)基于深度學(xué)習(xí)語音合成系統(tǒng)的原理,為研究人員提供重要的參考價值。
【文章來源】:計算機(jī)時代. 2020,(09)
【文章頁數(shù)】:5 頁
【部分圖文】:
Wavenet模型
音頻采樣點通常比較大,采用普通卷積方式計算量非常大。對此,Wavenet引入了因果卷積,如圖2所示,因果卷積可以在不增加計算復(fù)雜度同時增加卷積所關(guān)聯(lián)的時間范圍。因果卷積增大了卷積感受野,但需要較多的卷積層,這增大模型規(guī)模和計算復(fù)雜度。為此,Wavenet進(jìn)一步采用了帶洞卷積,如圖3所示,帶洞卷積每隔幾個輸入卷積,這樣既增加卷積感受野也減少了卷積層數(shù)。
因果卷積增大了卷積感受野,但需要較多的卷積層,這增大模型規(guī)模和計算復(fù)雜度。為此,Wavenet進(jìn)一步采用了帶洞卷積,如圖3所示,帶洞卷積每隔幾個輸入卷積,這樣既增加卷積感受野也減少了卷積層數(shù)。2.3 Wavenet聲碼器
本文編號:3117361
【文章來源】:計算機(jī)時代. 2020,(09)
【文章頁數(shù)】:5 頁
【部分圖文】:
Wavenet模型
音頻采樣點通常比較大,采用普通卷積方式計算量非常大。對此,Wavenet引入了因果卷積,如圖2所示,因果卷積可以在不增加計算復(fù)雜度同時增加卷積所關(guān)聯(lián)的時間范圍。因果卷積增大了卷積感受野,但需要較多的卷積層,這增大模型規(guī)模和計算復(fù)雜度。為此,Wavenet進(jìn)一步采用了帶洞卷積,如圖3所示,帶洞卷積每隔幾個輸入卷積,這樣既增加卷積感受野也減少了卷積層數(shù)。
因果卷積增大了卷積感受野,但需要較多的卷積層,這增大模型規(guī)模和計算復(fù)雜度。為此,Wavenet進(jìn)一步采用了帶洞卷積,如圖3所示,帶洞卷積每隔幾個輸入卷積,這樣既增加卷積感受野也減少了卷積層數(shù)。2.3 Wavenet聲碼器
本文編號:3117361
本文鏈接:http://sikaile.net/kejilunwen/wltx/3117361.html
最近更新
教材專著