基于DTW的俄語短指令語音識別
本文關(guān)鍵詞:基于DTW的俄語短指令語音識別 出處:《山東大學(xué)學(xué)報(bào)(理學(xué)版)》2017年11期 論文類型:期刊論文
更多相關(guān)文章: 俄語語音識別 端點(diǎn)檢測 DTW算法 跨語言語音識別
【摘要】:面向訓(xùn)練語料有限的語音識別任務(wù),基于動態(tài)時(shí)間規(guī)整(dynamic time warping,DTW)算法對俄語語音進(jìn)行識別。首先,以跨語言標(biāo)注的語音語料為資源基礎(chǔ),研究融合音字轉(zhuǎn)換和機(jī)器翻譯的語音識別方法。其次,結(jié)合俄語語音特點(diǎn),以元音為中心設(shè)置動態(tài)門限閾值,實(shí)現(xiàn)精確至音節(jié)的端點(diǎn)檢測,識別速度提高了34.4%,準(zhǔn)確率提高了14%。然后,綜合時(shí)域、頻域分析,提取反映語音靜態(tài)特征和動態(tài)變化的參數(shù)模板。另外,引入全局限制和早棄策略改進(jìn)DTW算法,避免病態(tài)匹配,縮小計(jì)算規(guī)模,使速度提高了19.7%,準(zhǔn)確率提高了4.8%。在俄語短指令語音集上做五折交叉驗(yàn)證,識別準(zhǔn)確率達(dá)到74.9%。
[Abstract]:For the task of speech recognition with limited training data, Russian speech recognition is carried out based on dynamic time warping (DTW) algorithm. Based on the cross-language tagged speech corpus, this paper studies the speech recognition method combining phonetic word conversion and machine translation. Secondly, combining the Russian speech characteristics, the vowel-centered dynamic threshold is set up. To achieve accurate to syllable endpoint detection, recognition speed increased 34. 4, accuracy improved 14. Then, integrated time domain, frequency domain analysis. In addition, the global restriction and early abandonment strategies are introduced to improve the DTW algorithm to avoid ill-posed matching, reduce the scale of calculation, and improve the speed by 19.7%. The accuracy is improved by 4.8. the recognition accuracy is 74.9% by 50% cross-verification on the Russian short instruction speech set.
【作者單位】: 中國人民解放軍外國語學(xué)院語言工程系;
【基金】:國家自然科學(xué)基金重大項(xiàng)目(11590771)
【分類號】:TN912.34
【正文快照】: 0引言 語音識別(automatic speech recognition,ASR)是指機(jī)器通過識別和理解過程將語音信號轉(zhuǎn)換為相應(yīng)的文本或命令[1],然后根據(jù)信息內(nèi)容,執(zhí)行人的某種意圖[2]。面向漢語和英語的大詞匯連續(xù)語音識別在統(tǒng)計(jì)建模、神經(jīng)網(wǎng)絡(luò)等機(jī)器學(xué)習(xí)方法的推動日趨實(shí)用化。但針對小語種、少數(shù)
【相似文獻(xiàn)】
相關(guān)期刊論文 前10條
1 申建國,王暖臣;語音識別程序的開發(fā)與應(yīng)用[J];計(jì)算機(jī)應(yīng)用研究;2000年12期
2 郭遠(yuǎn)瓊;提高語音識別率點(diǎn)滴[J];電腦技術(shù);2000年03期
3 邢文;語音識別[J];個人電腦;2000年02期
4 ;語音識別的真相[J];個人電腦;2001年12期
5 ;語音識別漸入佳境[J];個人電腦;2002年03期
6 ;微軟語音識別軟件可與人直接對話[J];自動化博覽;2003年04期
7 ;語音識別[J];印刷世界;2004年01期
8 韓紀(jì)慶,王歡良,李海峰,鄭鐵然;基于語音識別的發(fā)音學(xué)習(xí)技術(shù)[J];電聲技術(shù);2004年09期
9 陳孝強(qiáng);語音識別擬起新潮[J];微電腦世界;2005年07期
10 韓紀(jì)慶;張磊;鄭鐵然;;網(wǎng)絡(luò)環(huán)境下的語音識別方法[J];計(jì)算機(jī)科學(xué);2005年01期
相關(guān)會議論文 前10條
1 張歆奕;吳今培;張其善;;語音的共性特征及其在語音識別中的應(yīng)用[A];第十屆全國信號處理學(xué)術(shù)年會(CCSP-2001)論文集[C];2001年
2 杜樹木;何良華;;一種新的基于段長分布的語音識別模型[A];2009年通信理論與信號處理學(xué)術(shù)年會論文集[C];2009年
3 李楨;高萬林;歐文浩;徐山川;;基于關(guān)鍵詞語音識別的農(nóng)業(yè)信息語音服務(wù)系統(tǒng)的研究與實(shí)現(xiàn)[A];中國農(nóng)業(yè)工程學(xué)會電氣信息與自動化專業(yè)委員會、中國電機(jī)工程學(xué)會農(nóng)村電氣化分會科技與教育專委會2010年學(xué)術(shù)年會論文摘要[C];2010年
4 張冰;龍長才;羅海風(fēng);;熟悉掩蔽音背景下的目標(biāo)語音識別[A];泛在信息社會中的聲學(xué)——中國聲學(xué)學(xué)會2010年全國會員代表大會暨學(xué)術(shù)會議論文集[C];2010年
5 王承發(fā);趙德彬;金山;苗百利;朱志瑩;;語音識別應(yīng)用中抗噪聲干擾方法的初步探討[A];第二屆全國人機(jī)語音通訊學(xué)術(shù)會議論文集[C];1992年
6 杜笑平;楊啟綱;楊家沅;;過零周期轉(zhuǎn)移概率矩陣語音識別部件的研制[A];第二屆全國人機(jī)語音通訊學(xué)術(shù)會議論文集[C];1992年
7 季宏;劉志文;杜燕玲;黃曾陽;;語音識別中的音字轉(zhuǎn)換[A];第三屆全國人機(jī)語音通訊學(xué)術(shù)會議論文集[C];1994年
8 葛余博;楊大利;曾德超;;噪聲環(huán)境下語音識別的幾個問題(一)[A];第三屆全國人機(jī)語音通訊學(xué)術(shù)會議論文集[C];1994年
9 朱奇峰;俞鐵城;;聽覺中的協(xié)同現(xiàn)象和其對語音識別影響的探討[A];第四屆全國人機(jī)語音通訊學(xué)術(shù)會議論文集[C];1996年
10 姚磊;黃泰翼;陳景東;;一種高魯棒性語音識別的通用自適應(yīng)方法研究[A];第四屆全國人機(jī)語音通訊學(xué)術(shù)會議論文集[C];1996年
相關(guān)重要報(bào)紙文章 前10條
1 閆婷;語音識別 理想與現(xiàn)實(shí)的距離[N];計(jì)算機(jī)世界;2007年
2 樂天;語音識別:讓你的手機(jī)更聰明[N];計(jì)算機(jī)世界;2011年
3 雨夏;語音識別重在應(yīng)用[N];計(jì)算機(jī)世界;2001年
4 王向東 欒煥博 林守勛 錢躍良;語音識別:抗噪音能力有待加強(qiáng)[N];計(jì)算機(jī)世界;2006年
5 本報(bào)記者 操秀英;顏永紅:“搜索”語音識別的未來[N];科技日報(bào);2010年
6 本報(bào)記者 李映;語音識別飛入尋常百姓家?[N];中國電子報(bào);2012年
7 清華大學(xué) 劉加;語音識別應(yīng)用促進(jìn)技術(shù)發(fā)展[N];計(jì)算機(jī)世界;2006年
8 劉權(quán);OSR提升語音識別率[N];中國計(jì)算機(jī)報(bào);2004年
9 ;Intel涉足語音識別[N];計(jì)算機(jī)世界;2003年
10 本報(bào)記者 馬文方;用互聯(lián)網(wǎng)思維做語音識別[N];中國計(jì)算機(jī)報(bào);2013年
相關(guān)博士學(xué)位論文 前10條
1 許金普;農(nóng)產(chǎn)品市場信息采集的語音識別魯棒性方法研究[D];中國農(nóng)業(yè)科學(xué)院;2015年
2 包希日莫;面向蒙古語的語音識別聲學(xué)建模研究[D];內(nèi)蒙古大學(xué);2016年
3 吳斌;語音識別中的后處理技術(shù)研究[D];北京郵電大學(xué);2008年
4 奉小慧;音頻噪聲環(huán)境下唇動信息在語音識別中的應(yīng)用技術(shù)研究[D];華南理工大學(xué);2010年
5 孫f,
本文編號:1404284
本文鏈接:http://sikaile.net/kejilunwen/xinxigongchenglunwen/1404284.html