天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當前位置:主頁 > 科技論文 > 信息工程論文 >

基于循環(huán)神經(jīng)網(wǎng)絡(luò)的音素識別研究

發(fā)布時間:2018-05-31 05:46

  本文選題:語音識別 + 連接時序分類; 參考:《微電子學與計算機》2017年08期


【摘要】:基于隱馬爾科夫模型(HMM)和循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)的HMM-RNN混合模型在語音識別中取得了很大的成功.由于RNN的計算過程本身就是上下文相關(guān)的,相鄰幀的重合部分增加了整個系統(tǒng)的訓(xùn)練時間.針對上述問題,使用連接時序分類(CTC)來代替HMM跟RNN結(jié)合,并在語音分幀過程中去除相鄰幀之間的重合部分,使用TIMIT語音數(shù)據(jù)集,進行音素上的識別任務(wù),并且實驗結(jié)果表明CTC-BLSTM模型在音素上的識別率要高于HMM-BLSTM混合模型,CTC-BSLTM在去除幀重合后能夠大幅提高系統(tǒng)的訓(xùn)練效率并且保證識別率大致相同.
[Abstract]:The HMM-RNN hybrid model based on Hidden Markov model (HMM) and recurrent neural network (RNN) has achieved great success in speech recognition. Because the computing process of RNN itself is context dependent, the coincidence of adjacent frames increases the training time of the whole system. In view of the above problems, the connection time sequence classification (CTC) is used instead of HMM. Combining with RNN and removing the overlap between adjacent frames during the speech segmentation, the TIMIT voice data set is used to recognize the phoneme recognition task, and the experimental results show that the recognition rate of the CTC-BLSTM model on the phoneme is higher than the HMM-BLSTM mixed model. CTC-BSLTM can greatly improve the training efficiency of the system after removing the frame reclosing. And ensure that the recognition rate is approximately the same.
【作者單位】: 武漢理工大學計算機科學與技術(shù)學院;
【分類號】:TN912.34

【相似文獻】

相關(guān)期刊論文 前10條

1 楊家興;弱信號檢測的神經(jīng)網(wǎng)絡(luò)方法[J];數(shù)據(jù)采集與處理;1992年S1期

2 沈偉,馮瑞,邵惠鶴;網(wǎng)絡(luò)流量的神經(jīng)網(wǎng)絡(luò)直接自適應(yīng)控制[J];計算機工程;2003年07期

3 王萍,單超;神經(jīng)網(wǎng)絡(luò)在通信中的應(yīng)用[J];現(xiàn)代電子技術(shù);2003年13期

4 楊冠魯;曹瑞;裴勃生;官俊杰;黃小彬;;一種神經(jīng)網(wǎng)絡(luò)非線性噪聲消除方法[J];系統(tǒng)工程與電子技術(shù);2006年06期

5 李輝;張安;沈瑩;程t$;;神經(jīng)網(wǎng)絡(luò)在多機動目標跟蹤中的應(yīng)用[J];傳感技術(shù)學報;2006年06期

6 任志山;;神經(jīng)網(wǎng)絡(luò)在網(wǎng)絡(luò)通信中的應(yīng)用[J];龍巖學院學報;2006年06期

7 鄭建彬;許楠;張新盛;;一種基于神經(jīng)網(wǎng)絡(luò)的在線簽名驗證方法[J];中國水運(理論版);2006年03期

8 楊曉燕;陳軍;吳桂芹;;基于灰色關(guān)聯(lián)度神經(jīng)網(wǎng)絡(luò)的雷達型號識別模型[J];計算機仿真;2007年10期

9 李香萍;;基于神經(jīng)網(wǎng)絡(luò)的說話人識別算法的研究與實驗[J];電子測量技術(shù);2007年11期

10 馬曾;趙時;;神經(jīng)網(wǎng)絡(luò)在網(wǎng)絡(luò)通信中的應(yīng)用研究[J];福建電腦;2008年03期

相關(guān)會議論文 前10條

1 張森嘉;簡世杰;彭吳忠謀;;以遞回式神經(jīng)網(wǎng)絡(luò)為基礎(chǔ)的電話通道效應(yīng)補償方法[A];第五屆全國人機語音通訊學術(shù)會議論文集[C];1998年

2 劉豐;姜建新;程俊;易克初;;一種用于語音識別的神經(jīng)網(wǎng)絡(luò)[A];第二屆全國人機語音通訊學術(shù)會議論文集[C];1992年

3 杜健;費?;劉穎;潘高田;姚國政;;基于神經(jīng)網(wǎng)絡(luò)的導(dǎo)航裝備維修能力評估研究[A];第二屆中國衛(wèi)星導(dǎo)航學術(shù)年會電子文集[C];2011年

4 李明;楊承;舒宇;楊成梧;;PID神經(jīng)網(wǎng)絡(luò)的信號流圖在線學習算法[A];2009中國控制與決策會議論文集(2)[C];2009年

5 單顯明;張鵬;劉彬斌;;基于神經(jīng)網(wǎng)絡(luò)的炮兵雷達故障診斷專家系統(tǒng)[A];江蘇省電子學會2010年學術(shù)年會論文集[C];2010年

6 陳道文;黃泰翼;;面向語音處理的神經(jīng)網(wǎng)絡(luò)發(fā)展綜述[A];第三屆全國人機語音通訊學術(shù)會議論文集[C];1994年

7 錢小聰;鄭寶玉;穆明鑫;;神經(jīng)網(wǎng)絡(luò)聯(lián)機手寫簽名驗證[A];第十屆全國信號處理學術(shù)年會(CCSP-2001)論文集[C];2001年

8 童峰;許天增;;基于神經(jīng)網(wǎng)絡(luò)的窄帶噪聲處理[A];2001年中國智能自動化會議論文集(下冊)[C];2001年

9 俞鐵城;周健來;宋巖濤;;基于神經(jīng)網(wǎng)絡(luò)/隱馬爾可夫模型的混合語音識別方法的研究現(xiàn)狀[A];第五屆全國人機語音通訊學術(shù)會議論文集[C];1998年

10 李何;張立毅;;神經(jīng)網(wǎng)絡(luò)盲均衡[A];無線傳感器網(wǎng)及網(wǎng)絡(luò)信息處理技術(shù)——2006年通信理論與信號處理年會論文集[C];2006年

相關(guān)博士學位論文 前10條

1 李素芳;基于神經(jīng)網(wǎng)絡(luò)的無線通信算法研究[D];山東大學;2015年

2 胡文憑;基于深層神經(jīng)網(wǎng)絡(luò)的口語發(fā)音檢測與錯誤分析[D];中國科學技術(shù)大學;2016年

3 楊一;神經(jīng)網(wǎng)絡(luò)優(yōu)化方法及其在組合導(dǎo)航中的應(yīng)用研究[D];西北工業(yè)大學;2016年

4 萬敏;獨立分量分析的神經(jīng)網(wǎng)絡(luò)方法[D];電子科技大學;2011年

5 張素花;神經(jīng)網(wǎng)絡(luò)內(nèi)電振蕩活動特性的研究[D];河北工業(yè)大學;2006年

6 李勁;基于神經(jīng)網(wǎng)絡(luò)的SIW器件優(yōu)化研究[D];華中科技大學;2013年

7 周盼;基于深層神經(jīng)網(wǎng)絡(luò)的語音識別聲學建模研究[D];中國科學技術(shù)大學;2014年

8 茍飛;隨機信號處理的新方法[D];華南理工大學;1995年

9 包葉波;基于深層神經(jīng)網(wǎng)絡(luò)的聲學特征提取及其在LVCSR系統(tǒng)中的應(yīng)用[D];中國科學技術(shù)大學;2014年

10 蔣兵;語種識別深度學習方法研究[D];中國科學技術(shù)大學;2015年

相關(guān)碩士學位論文 前10條

1 李文婷;基于BP神經(jīng)網(wǎng)絡(luò)和SVM的信號分類方法的研究[D];南京師范大學;2015年

2 田碩;基于局部嵌入算法和神經(jīng)網(wǎng)絡(luò)的WLAN室內(nèi)定位算法研究[D];哈爾濱工業(yè)大學;2015年

3 安健;基于極化合成孔徑雷達圖像分類算法研究[D];電子科技大學;2014年

4 俞秀婷;基于神經(jīng)網(wǎng)絡(luò)的話務(wù)量預(yù)測模型研究[D];新疆大學;2015年

5 祝嘉聲;基于DNN的漢語語音識別聲學模型的研究[D];哈爾濱工業(yè)大學;2015年

6 趙天坤;基于深度神經(jīng)網(wǎng)絡(luò)的音樂信息檢索[D];北京郵電大學;2015年

7 孔飛;基于小波變換和神經(jīng)網(wǎng)絡(luò)的心電圖分類識別研究[D];電子科技大學;2015年

8 羅小勇;基于聯(lián)合神經(jīng)網(wǎng)絡(luò)的WSN節(jié)點和網(wǎng)絡(luò)故障診斷研究[D];電子科技大學;2014年

9 王永毅;基于子空間和神經(jīng)網(wǎng)絡(luò)的雷達目標識別軟件設(shè)計[D];電子科技大學;2014年

10 王勇;非法調(diào)頻廣播信號識別系統(tǒng)的研究與實現(xiàn)[D];西華大學;2015年

,

本文編號:1958524

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/xinxigongchenglunwen/1958524.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶13879***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com