資源稀缺蒙語語音識別研究
本文選題:資源稀缺 切入點:多語言深度神經(jīng)網(wǎng)絡 出處:《計算機科學》2017年10期
【摘要】:隨著語音識別技術(shù)的發(fā)展,資源稀缺語言的語音識別系統(tǒng)的研究吸引了更廣泛的關注。以蒙語為目標識別語言,研究了在資源稀缺的情況下(如僅有10小時的帶標注的語音)如何利用其他多語言信息提高識別系統(tǒng)的性能。借助基于多語言深度神經(jīng)網(wǎng)絡的跨語言遷移學習和基于多語言深度Bottleneck神經(jīng)網(wǎng)絡的抽取特征可以獲得更具有區(qū)分度的聲學模型。通過搜索引擎以及網(wǎng)絡爬蟲的定向抓取獲得大量的網(wǎng)頁數(shù)據(jù),有助于獲得文本數(shù)據(jù),以增強語言模型的性能。融合多個不同識別結(jié)果以進一步提高識別精度。與基線系統(tǒng)相比,多種系統(tǒng)融合的識別絕對錯誤率減少12%。
[Abstract]:With the development of speech recognition technology, the research of speech recognition system with scarce resources has attracted more and more attention. This paper studies how to use other multilingual information to improve the performance of recognition system under the condition of scarcity of resources (such as only 10 hours of tagged speech). Extracting features based on multilingual depth Bottleneck neural network can obtain a more discriminative acoustic model, and a large amount of web data can be obtained by searching engine and web crawler's directional crawling. It is helpful to obtain text data to enhance the performance of the language model, and to fuse multiple different recognition results to further improve the recognition accuracy. Compared with the baseline system, the recognition absolute error rate of multi-system fusion is reduced by 12 steps.
【作者單位】: 山東財經(jīng)大學系統(tǒng)科學與信息處理研究所;
【基金】:國家自然科學基金(61305027) 山東省自然科學基金(ZR2011FQ024) 山東省高等學?萍加媱(J17KB160)資助
【分類號】:TN912.34
【相似文獻】
相關期刊論文 前10條
1 吳軍,,王作英;漢語信息熵和語言模型的復雜度[J];電子學報;1996年10期
2 金凌,吳文虎,鄭方,吳根清;距離加權(quán)統(tǒng)計語言模型及其應用[J];中文信息學報;2001年06期
3 陳浪舟,黃泰翼,nlpr.ia.ac.cn;基于模糊訓練集的領域相關統(tǒng)計語言模型[J];軟件學報;2000年07期
4 劉長娥;王世鎮(zhèn);劉加;夏善紅;;語種確認中基于段長的語言模型修正方法[J];計算機應用研究;2006年07期
5 張瑞強,王作英,陸大 ;關于漢語音字轉(zhuǎn)換中語言模型零概率的問題[J];電子學報;1998年08期
6 沈兆勇;顧明亮;;基于符號化和語言模型方法的漢語方言自動辨識[J];徐州師范大學學報(自然科學版);2006年02期
7 楊春風;王歡良;;觸發(fā)式語言模型下的混淆網(wǎng)絡解碼方法[J];計算機工程與應用;2011年10期
8 田斌;田紅心;易克初;;一種結(jié)合聲學匹配信息的漢語統(tǒng)計語言模型新方法[J];模式識別與人工智能;1999年04期
9 單煜翔;陳諧;史永哲;劉加;;基于擴展N元文法模型的快速語言模型預測算法[J];自動化學報;2012年10期
10 黎亞雄;張堅強;潘登;胡憚;;基于RNN-RBM語言模型的語音識別研究[J];計算機研究與發(fā)展;2014年09期
相關會議論文 前6條
1 陳振標;徐波;;限定領域的語言模型[A];第七屆全國人機語音通訊學術(shù)會議(NCMMSC7)論文集[C];2003年
2 田斌;易克初;;一種擴展的漢語統(tǒng)計二元文法語言模型[A];第九屆全國信號處理學術(shù)年會(CCSP-99)論文集[C];1999年
3 蘇韜;汪俊杰;孫甲松;王作英;;基于最大似然估計的語言模型自適應[A];第六屆全國人機語音通訊學術(shù)會議論文集[C];2001年
4 宋彥;徐兵;付強;戴禮榮;;一種基于GMM模型的自動語種識別方法[A];第九屆全國人機語音通訊學術(shù)會議論文集[C];2007年
5 吳宗憲;王駿發(fā);;語音辨認中階層式以文法為主之馬可夫語言模型[A];第三屆全國人機語音通訊學術(shù)會議論文集[C];1994年
6 黃順珍;方棣棠;;基于拼音模型的聲學層的實驗研究[A];第六屆全國人機語音通訊學術(shù)會議論文集[C];2001年
相關重要報紙文章 前1條
1 清華大學 劉加;識別語音的幾種依據(jù)[N];計算機世界;2006年
相關碩士學位論文 前5條
1 張劍;連續(xù)語音識別中的循環(huán)神經(jīng)網(wǎng)絡語言模型技術(shù)研究[D];解放軍信息工程大學;2014年
2 王賀福;統(tǒng)計語言模型應用與研究[D];復旦大學;2012年
3 秦敏;基于詞激活力的長距離語言模型研究[D];北京郵電大學;2014年
4 李照耀;藏語連續(xù)語音識別的語言模型研究[D];西北民族大學;2014年
5 劉章;面向服務機器人的口語對話系統(tǒng)和語言模型技術(shù)研究[D];中國科學技術(shù)大學;2014年
本文編號:1680743
本文鏈接:http://sikaile.net/kejilunwen/sousuoyinqinglunwen/1680743.html