天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁(yè) > 科技論文 > 信息工程論文 >

基于時(shí)域建模的自動(dòng)語(yǔ)音識(shí)別

發(fā)布時(shí)間:2018-06-13 09:14

  本文選題:卷積神經(jīng)網(wǎng)絡(luò) + 遞歸神經(jīng)網(wǎng)絡(luò) ; 參考:《計(jì)算機(jī)工程與應(yīng)用》2017年20期


【摘要】:端到端神經(jīng)網(wǎng)絡(luò)能夠根據(jù)特定的任務(wù)自動(dòng)學(xué)習(xí)從原始數(shù)據(jù)到特征的變換,解決人工設(shè)計(jì)的特征與任務(wù)不匹配的問(wèn)題。以往語(yǔ)音識(shí)別的端到端網(wǎng)絡(luò)采用一層時(shí)域卷積網(wǎng)絡(luò)作為特征提取模型,遞歸神經(jīng)網(wǎng)絡(luò)和全連接前饋深度神經(jīng)網(wǎng)絡(luò)作為聲學(xué)模型的方式,在效果和效率兩個(gè)方面具有一定的局限性。從特征提取模塊的效果以及聲學(xué)模型的訓(xùn)練效率角度,提出多時(shí)間頻率分辨率卷積網(wǎng)絡(luò)與帶記憶模塊的前饋神經(jīng)網(wǎng)絡(luò)相結(jié)合的端到端語(yǔ)音識(shí)別模型。實(shí)驗(yàn)結(jié)果表明,所提方法語(yǔ)音識(shí)別在真實(shí)錄制數(shù)據(jù)集上較傳統(tǒng)方法字錯(cuò)誤率下降10%,訓(xùn)練時(shí)間減少80%。
[Abstract]:The end-to-end neural network can automatically learn the transformation from the original data to the feature according to the specific task, and solve the problem that the artificial design features and tasks do not match. In the past, the end-to-end network of speech recognition used a layer of time domain convolution network as the feature extraction model, and a recurrent neural network and a fully connected feedforward depth neural network were used as acoustic models. There are some limitations in effect and efficiency. From the point of view of the effect of feature extraction module and the training efficiency of acoustic model, an end-to-end speech recognition model combining multi-time frequency resolution convolution network with feedforward neural network with memory module is proposed. The experimental results show that the proposed method reduces the word-error rate and the training time by 10% and 80% respectively on the real recorded data set compared with the traditional method.
【作者單位】: 科大訊飛股份有限公司研究院;
【基金】:國(guó)家重點(diǎn)研發(fā)計(jì)劃(No.2016YFC0800806)
【分類號(hào)】:TN912.34;TP183

【相似文獻(xiàn)】

相關(guān)期刊論文 前10條

1 朱文育 ,王炳錫;語(yǔ)音編碼中的遞歸神經(jīng)網(wǎng)絡(luò)技術(shù)研究[J];微計(jì)算機(jī)信息;2005年23期

2 肖懷鐵,莊釗文,郭桂蓉;基于遞歸神經(jīng)網(wǎng)絡(luò)的飛機(jī)目標(biāo)識(shí)別方法[J];國(guó)防科技大學(xué)學(xué)報(bào);1997年04期

3 申建國(guó),王暖臣;語(yǔ)音識(shí)別程序的開發(fā)與應(yīng)用[J];計(jì)算機(jī)應(yīng)用研究;2000年12期

4 郭遠(yuǎn)瓊;提高語(yǔ)音識(shí)別率點(diǎn)滴[J];電腦技術(shù);2000年03期

5 邢文;語(yǔ)音識(shí)別[J];個(gè)人電腦;2000年02期

6 ;語(yǔ)音識(shí)別的真相[J];個(gè)人電腦;2001年12期

7 ;語(yǔ)音識(shí)別漸入佳境[J];個(gè)人電腦;2002年03期

8 ;微軟語(yǔ)音識(shí)別軟件可與人直接對(duì)話[J];自動(dòng)化博覽;2003年04期

9 ;語(yǔ)音識(shí)別[J];印刷世界;2004年01期

10 韓紀(jì)慶,王歡良,李海峰,鄭鐵然;基于語(yǔ)音識(shí)別的發(fā)音學(xué)習(xí)技術(shù)[J];電聲技術(shù);2004年09期

相關(guān)會(huì)議論文 前10條

1 張歆奕;吳今培;張其善;;語(yǔ)音的共性特征及其在語(yǔ)音識(shí)別中的應(yīng)用[A];第十屆全國(guó)信號(hào)處理學(xué)術(shù)年會(huì)(CCSP-2001)論文集[C];2001年

2 杜樹木;何良華;;一種新的基于段長(zhǎng)分布的語(yǔ)音識(shí)別模型[A];2009年通信理論與信號(hào)處理學(xué)術(shù)年會(huì)論文集[C];2009年

3 李楨;高萬(wàn)林;歐文浩;徐山川;;基于關(guān)鍵詞語(yǔ)音識(shí)別的農(nóng)業(yè)信息語(yǔ)音服務(wù)系統(tǒng)的研究與實(shí)現(xiàn)[A];中國(guó)農(nóng)業(yè)工程學(xué)會(huì)電氣信息與自動(dòng)化專業(yè)委員會(huì)、中國(guó)電機(jī)工程學(xué)會(huì)農(nóng)村電氣化分會(huì)科技與教育專委會(huì)2010年學(xué)術(shù)年會(huì)論文摘要[C];2010年

4 張冰;龍長(zhǎng)才;羅海風(fēng);;熟悉掩蔽音背景下的目標(biāo)語(yǔ)音識(shí)別[A];泛在信息社會(huì)中的聲學(xué)——中國(guó)聲學(xué)學(xué)會(huì)2010年全國(guó)會(huì)員代表大會(huì)暨學(xué)術(shù)會(huì)議論文集[C];2010年

5 王承發(fā);趙德彬;金山;苗百利;朱志瑩;;語(yǔ)音識(shí)別應(yīng)用中抗噪聲干擾方法的初步探討[A];第二屆全國(guó)人機(jī)語(yǔ)音通訊學(xué)術(shù)會(huì)議論文集[C];1992年

6 杜笑平;楊啟綱;楊家沅;;過(guò)零周期轉(zhuǎn)移概率矩陣語(yǔ)音識(shí)別部件的研制[A];第二屆全國(guó)人機(jī)語(yǔ)音通訊學(xué)術(shù)會(huì)議論文集[C];1992年

7 季宏;劉志文;杜燕玲;黃曾陽(yáng);;語(yǔ)音識(shí)別中的音字轉(zhuǎn)換[A];第三屆全國(guó)人機(jī)語(yǔ)音通訊學(xué)術(shù)會(huì)議論文集[C];1994年

8 葛余博;楊大利;曾德超;;噪聲環(huán)境下語(yǔ)音識(shí)別的幾個(gè)問(wèn)題(一)[A];第三屆全國(guó)人機(jī)語(yǔ)音通訊學(xué)術(shù)會(huì)議論文集[C];1994年

9 朱奇峰;俞鐵城;;聽(tīng)覺(jué)中的協(xié)同現(xiàn)象和其對(duì)語(yǔ)音識(shí)別影響的探討[A];第四屆全國(guó)人機(jī)語(yǔ)音通訊學(xué)術(shù)會(huì)議論文集[C];1996年

10 姚磊;黃泰翼;陳景東;;一種高魯棒性語(yǔ)音識(shí)別的通用自適應(yīng)方法研究[A];第四屆全國(guó)人機(jī)語(yǔ)音通訊學(xué)術(shù)會(huì)議論文集[C];1996年

相關(guān)重要報(bào)紙文章 前10條

1 閆婷;語(yǔ)音識(shí)別 理想與現(xiàn)實(shí)的距離[N];計(jì)算機(jī)世界;2007年

2 樂(lè)天;語(yǔ)音識(shí)別:讓你的手機(jī)更聰明[N];計(jì)算機(jī)世界;2011年

3 雨夏;語(yǔ)音識(shí)別重在應(yīng)用[N];計(jì)算機(jī)世界;2001年

4 王向東 欒煥博 林守勛 錢躍良;語(yǔ)音識(shí)別:抗噪音能力有待加強(qiáng)[N];計(jì)算機(jī)世界;2006年

5 本報(bào)記者 操秀英;顏永紅:“搜索”語(yǔ)音識(shí)別的未來(lái)[N];科技日?qǐng)?bào);2010年

6 本報(bào)記者 李映;語(yǔ)音識(shí)別飛入尋常百姓家?[N];中國(guó)電子報(bào);2012年

7 清華大學(xué) 劉加;語(yǔ)音識(shí)別應(yīng)用促進(jìn)技術(shù)發(fā)展[N];計(jì)算機(jī)世界;2006年

8 劉權(quán);OSR提升語(yǔ)音識(shí)別率[N];中國(guó)計(jì)算機(jī)報(bào);2004年

9 ;Intel涉足語(yǔ)音識(shí)別[N];計(jì)算機(jī)世界;2003年

10 本報(bào)記者 馬文方;用互聯(lián)網(wǎng)思維做語(yǔ)音識(shí)別[N];中國(guó)計(jì)算機(jī)報(bào);2013年

相關(guān)博士學(xué)位論文 前10條

1 許金普;農(nóng)產(chǎn)品市場(chǎng)信息采集的語(yǔ)音識(shí)別魯棒性方法研究[D];中國(guó)農(nóng)業(yè)科學(xué)院;2015年

2 包希日莫;面向蒙古語(yǔ)的語(yǔ)音識(shí)別聲學(xué)建模研究[D];內(nèi)蒙古大學(xué);2016年

3 吳斌;語(yǔ)音識(shí)別中的后處理技術(shù)研究[D];北京郵電大學(xué);2008年

4 奉小慧;音頻噪聲環(huán)境下唇動(dòng)信息在語(yǔ)音識(shí)別中的應(yīng)用技術(shù)研究[D];華南理工大學(xué);2010年

5 孫f,

本文編號(hào):2013505


資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/xinxigongchenglunwen/2013505.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶5d547***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com