低資源語音識別若干關鍵技術研究進展
本文關鍵詞:低資源語音識別若干關鍵技術研究進展 出處:《數(shù)據(jù)采集與處理》2017年02期 論文類型:期刊論文
【摘要】:低資源語音識別是當今語音界研究的熱點問題之一,也是多語言小語種語音識別技術在實際應用中所面臨的重要挑戰(zhàn)之一。本文回顧并總結了低資源語音識別的發(fā)展歷史和研究現(xiàn)狀,重點介紹了低資源語音識別在聲學特征、聲學模型和語言模型方面的若干關鍵技術研究進展。具體內容包括發(fā)音特征、多語言瓶頸特征、子空間高斯混合模型、卷積神經(jīng)網(wǎng)絡聲學模型和遞歸神經(jīng)網(wǎng)絡語言模型,然后介紹了針對低資源語音識別的公開關鍵詞搜索(Open keyword search,OpenKWS)評測,最后對低資源語音識別進行了總結和展望。
[Abstract]:Low resource speech recognition is one of the hot issues in the field of speech. It is also one of the important challenges in the practical application of multilingual minority speech recognition technology. This paper reviews and summarizes the development history and research status of low resource speech recognition. This paper mainly introduces some key technologies of low resource speech recognition in acoustic features, acoustic models and language models, including pronunciation features, multilingual bottleneck features, subspace Gao Si mixed model. The acoustic model of convolutional neural network and the language model of recurrent neural network are introduced. Then the open keyword search for low resource speech recognition is introduced. OpenKWS. finally, the low-resource speech recognition is summarized and prospected.
【作者單位】: 清華大學電子工程系;
【基金】:國家自然科學基金(61370034,61403224)資助項目
【分類號】:TN912.34
【正文快照】: 引言語音是人類最主要通信手段之一,語音信號一直以來是信息獲取的主要來源之一[1,2]。無論是民用還是軍事,一直以來都受到世界各國的高度重視。近年來,隨著互聯(lián)網(wǎng)技術迅猛發(fā)展,各種音頻信息量爆炸性地迅速增長,基于網(wǎng)絡的多語言語音識別技術應用需求越來越迫切。近幾年來主要
【相似文獻】
相關期刊論文 前10條
1 郭遠瓊;提高語音識別率點滴[J];電腦技術;2000年03期
2 邢文;語音識別[J];個人電腦;2000年02期
3 ;語音識別的真相[J];個人電腦;2001年12期
4 ;語音識別漸入佳境[J];個人電腦;2002年03期
5 ;微軟語音識別軟件可與人直接對話[J];自動化博覽;2003年04期
6 ;語音識別[J];印刷世界;2004年01期
7 韓紀慶,王歡良,李海峰,鄭鐵然;基于語音識別的發(fā)音學習技術[J];電聲技術;2004年09期
8 陳孝強;語音識別擬起新潮[J];微電腦世界;2005年07期
9 韓紀慶;張磊;鄭鐵然;;網(wǎng)絡環(huán)境下的語音識別方法[J];計算機科學;2005年01期
10 唐瀟霖;;你好!新語音識別時代[J];互聯(lián)網(wǎng)周刊;2006年16期
相關會議論文 前10條
1 張歆奕;吳今培;張其善;;語音的共性特征及其在語音識別中的應用[A];第十屆全國信號處理學術年會(CCSP-2001)論文集[C];2001年
2 杜樹木;何良華;;一種新的基于段長分布的語音識別模型[A];2009年通信理論與信號處理學術年會論文集[C];2009年
3 李楨;高萬林;歐文浩;徐山川;;基于關鍵詞語音識別的農(nóng)業(yè)信息語音服務系統(tǒng)的研究與實現(xiàn)[A];中國農(nóng)業(yè)工程學會電氣信息與自動化專業(yè)委員會、中國電機工程學會農(nóng)村電氣化分會科技與教育專委會2010年學術年會論文摘要[C];2010年
4 張冰;龍長才;羅海風;;熟悉掩蔽音背景下的目標語音識別[A];泛在信息社會中的聲學——中國聲學學會2010年全國會員代表大會暨學術會議論文集[C];2010年
5 王承發(fā);趙德彬;金山;苗百利;朱志瑩;;語音識別應用中抗噪聲干擾方法的初步探討[A];第二屆全國人機語音通訊學術會議論文集[C];1992年
6 杜笑平;楊啟綱;楊家沅;;過零周期轉移概率矩陣語音識別部件的研制[A];第二屆全國人機語音通訊學術會議論文集[C];1992年
7 季宏;劉志文;杜燕玲;黃曾陽;;語音識別中的音字轉換[A];第三屆全國人機語音通訊學術會議論文集[C];1994年
8 葛余博;楊大利;曾德超;;噪聲環(huán)境下語音識別的幾個問題(一)[A];第三屆全國人機語音通訊學術會議論文集[C];1994年
9 朱奇峰;俞鐵城;;聽覺中的協(xié)同現(xiàn)象和其對語音識別影響的探討[A];第四屆全國人機語音通訊學術會議論文集[C];1996年
10 姚磊;黃泰翼;陳景東;;一種高魯棒性語音識別的通用自適應方法研究[A];第四屆全國人機語音通訊學術會議論文集[C];1996年
相關重要報紙文章 前10條
1 閆婷;語音識別 理想與現(xiàn)實的距離[N];計算機世界;2007年
2 樂天;語音識別:讓你的手機更聰明[N];計算機世界;2011年
3 雨夏;語音識別重在應用[N];計算機世界;2001年
4 王向東 欒煥博 林守勛 錢躍良;語音識別:抗噪音能力有待加強[N];計算機世界;2006年
5 本報記者 操秀英;顏永紅:“搜索”語音識別的未來[N];科技日報;2010年
6 本報記者 李映;語音識別飛入尋常百姓家?[N];中國電子報;2012年
7 清華大學 劉加;語音識別應用促進技術發(fā)展[N];計算機世界;2006年
8 劉權;OSR提升語音識別率[N];中國計算機報;2004年
9 ;Intel涉足語音識別[N];計算機世界;2003年
10 本報記者 馬文方;用互聯(lián)網(wǎng)思維做語音識別[N];中國計算機報;2013年
相關博士學位論文 前10條
1 許金普;農(nóng)產(chǎn)品市場信息采集的語音識別魯棒性方法研究[D];中國農(nóng)業(yè)科學院;2015年
2 包希日莫;面向蒙古語的語音識別聲學建模研究[D];內蒙古大學;2016年
3 吳斌;語音識別中的后處理技術研究[D];北京郵電大學;2008年
4 奉小慧;音頻噪聲環(huán)境下唇動信息在語音識別中的應用技術研究[D];華南理工大學;2010年
5 孫f,
本文編號:1433356
本文鏈接:http://sikaile.net/kejilunwen/xinxigongchenglunwen/1433356.html