天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

基于LSTM神經(jīng)網(wǎng)絡(luò)的語(yǔ)音模型優(yōu)化研究

發(fā)布時(shí)間:2020-07-17 14:11
【摘要】:在機(jī)器智能技術(shù)日新月異的發(fā)展,語(yǔ)音智能識(shí)別技術(shù)作為提高人機(jī)交互效率的一種手段,已經(jīng)成為機(jī)器智能技術(shù)領(lǐng)域中不可分割的一部分,其應(yīng)用性日漸提高,受到大眾普遍認(rèn)可與廣泛使用。然而,在開發(fā)語(yǔ)音識(shí)別模型階段時(shí)所需消耗大量的計(jì)算資源與訓(xùn)練時(shí)間,成為限制語(yǔ)音識(shí)別技術(shù)進(jìn)一步完善和發(fā)展的因素。因此,如何在語(yǔ)音識(shí)別模型開發(fā)階段快速訓(xùn)練模型和降低所需計(jì)算資源要求是具有重要的理論及實(shí)際意義。本文主要研究了在基于長(zhǎng)短時(shí)記憶循環(huán)神經(jīng)網(wǎng)絡(luò)的語(yǔ)音識(shí)別模型開發(fā)階段中,造成長(zhǎng)短時(shí)記憶循環(huán)神經(jīng)網(wǎng)絡(luò)訓(xùn)練速度慢的主要因素和如何加快網(wǎng)絡(luò)的訓(xùn)練速度和減少網(wǎng)絡(luò)所需的計(jì)算資源。本文主要工作如下:1.本文提出在基礎(chǔ)循環(huán)神經(jīng)網(wǎng)絡(luò)輸出層添加分類器的方法來(lái)分解輸出層計(jì)算過(guò)程,改善循環(huán)神經(jīng)網(wǎng)絡(luò)輸出層運(yùn)算過(guò)程復(fù)雜的問(wèn)題,達(dá)到降低網(wǎng)絡(luò)輸出層計(jì)算復(fù)雜度的目的。實(shí)驗(yàn)結(jié)果表明在網(wǎng)絡(luò)輸出層添加分類器的優(yōu)化輸出層結(jié)構(gòu)的方法是可以降低網(wǎng)絡(luò)輸出層的運(yùn)算復(fù)雜度的。2.針對(duì)長(zhǎng)短時(shí)記憶循環(huán)神經(jīng)網(wǎng)絡(luò)中的門激活值是稀疏的,而且某些門激活值之間呈現(xiàn)出一定的線性關(guān)系。本文提出一種線性表示負(fù)向關(guān)系門激活值的方法,來(lái)變相縮減們的數(shù)量,降低網(wǎng)絡(luò)門整體的計(jì)算復(fù)雜度,提高網(wǎng)絡(luò)學(xué)習(xí)效率。實(shí)驗(yàn)結(jié)果表明,本文方法在保證一定的識(shí)別精度前提下提高了網(wǎng)絡(luò)訓(xùn)練效率。3.本文改進(jìn)的長(zhǎng)短時(shí)記憶循環(huán)神經(jīng)網(wǎng)絡(luò)與CNN神經(jīng)網(wǎng)絡(luò)、FSMN神經(jīng)網(wǎng)絡(luò)進(jìn)行了實(shí)驗(yàn)分析,實(shí)驗(yàn)結(jié)果表明:基于改進(jìn)后的長(zhǎng)短時(shí)記憶循環(huán)神經(jīng)網(wǎng)絡(luò)的語(yǔ)音識(shí)別模型的識(shí)別性能更好。
【學(xué)位授予單位】:廣西師范學(xué)院
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2018
【分類號(hào)】:TP183;TN912.34
【圖文】:

模型圖,語(yǔ)音識(shí)別,模型,語(yǔ)音信號(hào)特征


圖 2-1 語(yǔ)音識(shí)別模型概括圖所示就是一個(gè) 語(yǔ)音識(shí)別模型的基本流 程,就是通過(guò)提取語(yǔ)音信號(hào)特征而組成練聲學(xué)模型的向量矩陣的過(guò)程。一個(gè)訓(xùn)練好的聲學(xué)模型與語(yǔ)言模型配合對(duì)需進(jìn)行評(píng)測(cè),再通過(guò)解碼過(guò)程獲得最大可能性的序列。

示意圖,語(yǔ)音識(shí)別,模型,測(cè)試集


圖 2-2 語(yǔ)音識(shí)別模型中 c - level和H level網(wǎng)絡(luò)示意圖2.3 語(yǔ)音模型性能評(píng)測(cè)準(zhǔn)則語(yǔ)音識(shí)別模型性能的測(cè)試需要包含測(cè)試集與語(yǔ)音標(biāo)注文本兩部分,通過(guò)對(duì)測(cè)試集進(jìn)行

結(jié)構(gòu)圖,循環(huán)神經(jīng)網(wǎng)絡(luò),結(jié)構(gòu)圖,隱含層


圖 3-1 循環(huán)神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)圖上圖可以看出,網(wǎng)絡(luò)將會(huì)循環(huán)積累上一時(shí)刻隱含層的輸出,作為下一次隱含層輸分,以便在新的輸入中融入過(guò)往的輸入信息,達(dá)到更好的掌握長(zhǎng)時(shí)序信息的學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)中隱含層 的輸入的數(shù)學(xué)計(jì)算表達(dá)式為:In put (t) Word(t) h(t 1)(3 1

【參考文獻(xiàn)】

相關(guān)期刊論文 前6條

1 王威;胡桂明;楊麗;黃東芳;周楊;;基于ELM和PCA的漢語(yǔ)數(shù)字語(yǔ)音識(shí)別研究[J];電聲技術(shù);2015年11期

2 張晴晴;劉勇;潘接林;顏永紅;;基于卷積神經(jīng)網(wǎng)絡(luò)的連續(xù)語(yǔ)音識(shí)別[J];工程科學(xué)學(xué)報(bào);2015年09期

3 王山海;景新幸;楊海燕;;基于深度學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)的孤立詞語(yǔ)音識(shí)別的研究[J];計(jì)算機(jī)應(yīng)用研究;2015年08期

4 王昊;李思舒;鄧三鴻;;基于N-Gram的文本語(yǔ)種識(shí)別研究[J];現(xiàn)代圖書情報(bào)技術(shù);2013年04期

5 陳存寶;趙力;;嵌入時(shí)延神經(jīng)網(wǎng)絡(luò)的高斯混合模型說(shuō)話人辨認(rèn)[J];聲學(xué)技術(shù);2010年03期

6 史笑興,顧明亮,王太君,何振亞;一種CDHMM/MLP混合模型及其在語(yǔ)音識(shí)別中的應(yīng)用[J];電路與系統(tǒng)學(xué)報(bào);1998年04期

相關(guān)博士學(xué)位論文 前3條

1 陳斌;連續(xù)語(yǔ)音識(shí)別特征提取與聲學(xué)模型訓(xùn)練區(qū)分性技術(shù)研究[D];解放軍信息工程大學(xué);2015年

2 楊南;基于神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)的統(tǒng)計(jì)機(jī)器翻譯研究[D];中國(guó)科學(xué)技術(shù)大學(xué);2014年

3 吳婭輝;語(yǔ)音識(shí)別中區(qū)分性訓(xùn)練算法研究[D];北京郵電大學(xué);2009年

相關(guān)碩士學(xué)位論文 前7條

1 高雪;語(yǔ)音識(shí)別技術(shù)在人機(jī)交互中的應(yīng)用研究[D];北方工業(yè)大學(xué);2017年

2 李萬(wàn)芬;基于語(yǔ)音語(yǔ)料庫(kù)的樂(lè)府詩(shī)翻譯的語(yǔ)音象似性研究[D];江蘇大學(xué);2017年

3 袁翔;基于HMM和DNN的語(yǔ)音識(shí)別算法研究與實(shí)現(xiàn)[D];江西理工大學(xué);2017年

4 康健;音頻質(zhì)量評(píng)價(jià)和語(yǔ)音識(shí)別預(yù)處理技術(shù)的研究及實(shí)現(xiàn)[D];北京郵電大學(xué);2017年

5 胡寶花;基于HMM-ANN模型的語(yǔ)音識(shí)別技術(shù)研究[D];南昌航空大學(xué);2016年

6 崔天宇;基于HMM的語(yǔ)音識(shí)別系統(tǒng)的研究與實(shí)現(xiàn)[D];吉林大學(xué);2016年

7 熊瑋;自助語(yǔ)音識(shí)別流程編輯器的設(shè)計(jì)與實(shí)現(xiàn)[D];電子科技大學(xué);2015年



本文編號(hào):2759539

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/wltx/2759539.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶c1e78***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com