天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

端到端的深度卷積神經(jīng)網(wǎng)絡(luò)語(yǔ)音識(shí)別

發(fā)布時(shí)間:2021-06-30 20:18
  卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Networks,CNN)是目前流行的語(yǔ)音識(shí)別模型之一,其特有卷積結(jié)構(gòu)保證了語(yǔ)音信號(hào)時(shí)域和頻域的平移不變性。但是CNN存在著對(duì)語(yǔ)音信號(hào)建模能力有所不足的問(wèn)題。為此,將鏈接時(shí)序準(zhǔn)則(CTC)應(yīng)用在CNN結(jié)構(gòu)中,構(gòu)建端到端卷積神經(jīng)網(wǎng)絡(luò)(CTC-CNN)模型。同時(shí),引入殘差塊結(jié)構(gòu),提出一種新的端到端深度卷積神經(jīng)網(wǎng)絡(luò)(CTC-DCNN)模型,并利用maxout激活函數(shù)對(duì)其進(jìn)行優(yōu)化。通過(guò)TIMIT和Thchs-30語(yǔ)音庫(kù)測(cè)試實(shí)驗(yàn),結(jié)果表明在中英文識(shí)別中,采用該模型比現(xiàn)有卷積神經(jīng)網(wǎng)絡(luò)模型,準(zhǔn)確率分別提高約4.7%和6.3%。 

【文章來(lái)源】:計(jì)算機(jī)應(yīng)用與軟件. 2020,37(04)北大核心

【文章頁(yè)數(shù)】:5 頁(yè)

【部分圖文】:

端到端的深度卷積神經(jīng)網(wǎng)絡(luò)語(yǔ)音識(shí)別


CTC-CNN模型

模型圖,模型,聲學(xué)模型,語(yǔ)音識(shí)別


CTC-DCNN模型

殘差圖,殘差,激活函數(shù),卷積和


殘差塊結(jié)構(gòu)中,通過(guò)shortcut連接,能夠?qū)⒃嫉妮斎胫抵苯觽鬏數(shù)胶竺娴膶?減少過(guò)深的卷積層數(shù)帶來(lái)的訓(xùn)練誤差。殘差塊中,通常采用的激活函數(shù)是ReLU函數(shù),本文提出通過(guò)maxout函數(shù)優(yōu)化殘差網(wǎng)絡(luò)中,改善原本激活函數(shù)可能存在的死機(jī)現(xiàn)象,具體改進(jìn)結(jié)構(gòu)如圖3所示。其中:X是a[l-1]層的輸入,經(jīng)過(guò)卷積和激活函數(shù)后輸出特征進(jìn)入a[l]層。這些層的表示如下:

【參考文獻(xiàn)】:
期刊論文
[1]Geospatial Data to Images: A Deep-Learning Framework for Traffic Forecasting[J]. Weiwei Jiang,Lin Zhang.  Tsinghua Science and Technology. 2019(01)
[2]平穩(wěn)小波域深度殘差CNN用于低劑量CT圖像估計(jì)[J]. 高凈植,劉祎,白旭,張權(quán),桂志國(guó).  計(jì)算機(jī)應(yīng)用. 2018(12)
[3]基于改進(jìn)卷積神經(jīng)網(wǎng)絡(luò)算法的語(yǔ)音識(shí)別[J]. 楊洋,汪毓鐸.  應(yīng)用聲學(xué). 2018(06)
[4]基于雙向長(zhǎng)短時(shí)記憶-聯(lián)結(jié)時(shí)序分類(lèi)和加權(quán)有限狀態(tài)轉(zhuǎn)換器的端到端中文語(yǔ)音識(shí)別系統(tǒng)[J]. 姚煜,RYAD Chellali.  計(jì)算機(jī)應(yīng)用. 2018(09)
[5]基于動(dòng)態(tài)BLSTM和CTC的瀕危語(yǔ)言語(yǔ)音識(shí)別研究[J]. 于重重,陳運(yùn)兵,孫沁瑤,劉暢,徐世璇,尹蔚彬.  計(jì)算機(jī)應(yīng)用研究. 2019(11)
[6]語(yǔ)音識(shí)別中神經(jīng)網(wǎng)絡(luò)聲學(xué)模型的說(shuō)話(huà)人自適應(yīng)研究[J]. 金超,龔鋮,李輝.  計(jì)算機(jī)應(yīng)用與軟件. 2018(02)
[7]基于端到端技術(shù)的藏語(yǔ)語(yǔ)音識(shí)別[J]. 王慶楠,郭武,解傳棟.  模式識(shí)別與人工智能. 2017(04)
[8]基于卷積神經(jīng)網(wǎng)絡(luò)的維吾爾語(yǔ)語(yǔ)音識(shí)別[J]. 梁玉龍,屈丹,李真,張文林.  信息工程大學(xué)學(xué)報(bào). 2017(01)
[9]語(yǔ)音識(shí)別中卷積神經(jīng)網(wǎng)絡(luò)優(yōu)化算法[J]. 劉長(zhǎng)征,張磊.  哈爾濱理工大學(xué)學(xué)報(bào). 2016(03)



本文編號(hào):3258424

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/wltx/3258424.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶(hù)d71a2***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com