天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當前位置:主頁 > 科技論文 > 信息工程論文 >

采用長短時記憶網(wǎng)絡(luò)的低資源語音識別方法

發(fā)布時間:2018-03-15 20:09

  本文選題:語音識別 切入點:低資源 出處:《西安交通大學(xué)學(xué)報》2017年10期  論文類型:期刊論文


【摘要】:針對低資源環(huán)境下由于標注訓(xùn)練數(shù)據(jù)不足、造成語音識別系統(tǒng)識別率急劇下降的問題,提出一種采用長短時記憶網(wǎng)絡(luò)的低資源語音識別(LSTM-LRASR)方法。該方法采用長短時記憶網(wǎng)絡(luò)構(gòu)建聲學(xué)模型,從特征提取、數(shù)據(jù)擴展及模型優(yōu)化3個方面提高低資源語音識別性能。在特征提取方面,提取語言無關(guān)的高層穩(wěn)健特征參數(shù),降低聲學(xué)模型對訓(xùn)練數(shù)據(jù)的依賴;在數(shù)據(jù)擴展方面,對已有標注數(shù)據(jù)進行語速擾動,對無標注數(shù)據(jù)進行自動識別,從而自動獲取更多標注數(shù)據(jù);在模型優(yōu)化方面,通過序貫區(qū)分性訓(xùn)練技術(shù)提高模型對易混淆音素的區(qū)分能力,利用最小風(fēng)險貝葉斯解碼對多個系統(tǒng)進行融合,進一步提高識別性能。對OpenKWS16評測數(shù)據(jù)的實驗結(jié)果表明,采用LSTMLRASR方法搭建的低資源語音識別系統(tǒng)的詞錯率相對基線系統(tǒng)下降了29.9%,所有查詢詞的查詢項權(quán)重代價提升了60.3%。
[Abstract]:Aiming at the problem that the recognition rate of speech recognition system drops sharply due to the shortage of training data in low resource environment, In this paper, a LSTM-LRASR method based on LSTM-LRASR is proposed, which uses LSTM-LRASR to construct acoustic model and extract features from LSTM-LRASR. Data expansion and model optimization improve the performance of low resource speech recognition. In feature extraction, we extract high-level robust feature parameters independent of language to reduce the dependence of acoustic model on training data. In the aspect of model optimization, the ability of model to distinguish confusing phoneme is improved by sequential discriminant training technology. The minimum risk Bayesian decoding is used to fuse multiple systems to further improve the recognition performance. The experimental results of OpenKWS16 data evaluation show that, The word-error rate of the low resource speech recognition system based on LSTMLRASR method is 29.9m lower than that of the baseline system, and the cost of the query item weight of all the query words is increased by 60.3%.
【作者單位】: 解放軍信息工程大學(xué)信息系統(tǒng)工程學(xué)院;中國科學(xué)技術(shù)大學(xué)信息科學(xué)技術(shù)學(xué)院;
【基金】:國家自然科學(xué)基金資助項目(61673395,61403415,61302107) 河南省自然科學(xué)基金資助項目(162300410331)
【分類號】:TN912.34

【相似文獻】

相關(guān)期刊論文 前10條

1 申建國,王暖臣;語音識別程序的開發(fā)與應(yīng)用[J];計算機應(yīng)用研究;2000年12期

2 郭遠瓊;提高語音識別率點滴[J];電腦技術(shù);2000年03期

3 邢文;語音識別[J];個人電腦;2000年02期

4 ;語音識別的真相[J];個人電腦;2001年12期

5 ;語音識別漸入佳境[J];個人電腦;2002年03期

6 ;微軟語音識別軟件可與人直接對話[J];自動化博覽;2003年04期

7 ;語音識別[J];印刷世界;2004年01期

8 韓紀慶,王歡良,李海峰,鄭鐵然;基于語音識別的發(fā)音學(xué)習(xí)技術(shù)[J];電聲技術(shù);2004年09期

9 陳孝強;語音識別擬起新潮[J];微電腦世界;2005年07期

10 韓紀慶;張磊;鄭鐵然;;網(wǎng)絡(luò)環(huán)境下的語音識別方法[J];計算機科學(xué);2005年01期

相關(guān)會議論文 前10條

1 張歆奕;吳今培;張其善;;語音的共性特征及其在語音識別中的應(yīng)用[A];第十屆全國信號處理學(xué)術(shù)年會(CCSP-2001)論文集[C];2001年

2 杜樹木;何良華;;一種新的基于段長分布的語音識別模型[A];2009年通信理論與信號處理學(xué)術(shù)年會論文集[C];2009年

3 李楨;高萬林;歐文浩;徐山川;;基于關(guān)鍵詞語音識別的農(nóng)業(yè)信息語音服務(wù)系統(tǒng)的研究與實現(xiàn)[A];中國農(nóng)業(yè)工程學(xué)會電氣信息與自動化專業(yè)委員會、中國電機工程學(xué)會農(nóng)村電氣化分會科技與教育專委會2010年學(xué)術(shù)年會論文摘要[C];2010年

4 張冰;龍長才;羅海風(fēng);;熟悉掩蔽音背景下的目標語音識別[A];泛在信息社會中的聲學(xué)——中國聲學(xué)學(xué)會2010年全國會員代表大會暨學(xué)術(shù)會議論文集[C];2010年

5 王承發(fā);趙德彬;金山;苗百利;朱志瑩;;語音識別應(yīng)用中抗噪聲干擾方法的初步探討[A];第二屆全國人機語音通訊學(xué)術(shù)會議論文集[C];1992年

6 杜笑平;楊啟綱;楊家沅;;過零周期轉(zhuǎn)移概率矩陣語音識別部件的研制[A];第二屆全國人機語音通訊學(xué)術(shù)會議論文集[C];1992年

7 季宏;劉志文;杜燕玲;黃曾陽;;語音識別中的音字轉(zhuǎn)換[A];第三屆全國人機語音通訊學(xué)術(shù)會議論文集[C];1994年

8 葛余博;楊大利;曾德超;;噪聲環(huán)境下語音識別的幾個問題(一)[A];第三屆全國人機語音通訊學(xué)術(shù)會議論文集[C];1994年

9 朱奇峰;俞鐵城;;聽覺中的協(xié)同現(xiàn)象和其對語音識別影響的探討[A];第四屆全國人機語音通訊學(xué)術(shù)會議論文集[C];1996年

10 姚磊;黃泰翼;陳景東;;一種高魯棒性語音識別的通用自適應(yīng)方法研究[A];第四屆全國人機語音通訊學(xué)術(shù)會議論文集[C];1996年

相關(guān)重要報紙文章 前10條

1 閆婷;語音識別 理想與現(xiàn)實的距離[N];計算機世界;2007年

2 樂天;語音識別:讓你的手機更聰明[N];計算機世界;2011年

3 雨夏;語音識別重在應(yīng)用[N];計算機世界;2001年

4 王向東 欒煥博 林守勛 錢躍良;語音識別:抗噪音能力有待加強[N];計算機世界;2006年

5 本報記者 操秀英;顏永紅:“搜索”語音識別的未來[N];科技日報;2010年

6 本報記者 李映;語音識別飛入尋常百姓家?[N];中國電子報;2012年

7 清華大學(xué) 劉加;語音識別應(yīng)用促進技術(shù)發(fā)展[N];計算機世界;2006年

8 劉權(quán);OSR提升語音識別率[N];中國計算機報;2004年

9 ;Intel涉足語音識別[N];計算機世界;2003年

10 本報記者 馬文方;用互聯(lián)網(wǎng)思維做語音識別[N];中國計算機報;2013年

相關(guān)博士學(xué)位論文 前10條

1 許金普;農(nóng)產(chǎn)品市場信息采集的語音識別魯棒性方法研究[D];中國農(nóng)業(yè)科學(xué)院;2015年

2 包希日莫;面向蒙古語的語音識別聲學(xué)建模研究[D];內(nèi)蒙古大學(xué);2016年

3 吳斌;語音識別中的后處理技術(shù)研究[D];北京郵電大學(xué);2008年

4 奉小慧;音頻噪聲環(huán)境下唇動信息在語音識別中的應(yīng)用技術(shù)研究[D];華南理工大學(xué);2010年

5 孫f,

本文編號:1616618


資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/xinxigongchenglunwen/1616618.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶a115f***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com