資源稀缺蒙語(yǔ)語(yǔ)音識(shí)別研究
本文選題:資源稀缺 切入點(diǎn):多語(yǔ)言深度神經(jīng)網(wǎng)絡(luò) 出處:《計(jì)算機(jī)科學(xué)》2017年10期
【摘要】:隨著語(yǔ)音識(shí)別技術(shù)的發(fā)展,資源稀缺語(yǔ)言的語(yǔ)音識(shí)別系統(tǒng)的研究吸引了更廣泛的關(guān)注。以蒙語(yǔ)為目標(biāo)識(shí)別語(yǔ)言,研究了在資源稀缺的情況下(如僅有10小時(shí)的帶標(biāo)注的語(yǔ)音)如何利用其他多語(yǔ)言信息提高識(shí)別系統(tǒng)的性能。借助基于多語(yǔ)言深度神經(jīng)網(wǎng)絡(luò)的跨語(yǔ)言遷移學(xué)習(xí)和基于多語(yǔ)言深度Bottleneck神經(jīng)網(wǎng)絡(luò)的抽取特征可以獲得更具有區(qū)分度的聲學(xué)模型。通過搜索引擎以及網(wǎng)絡(luò)爬蟲的定向抓取獲得大量的網(wǎng)頁(yè)數(shù)據(jù),有助于獲得文本數(shù)據(jù),以增強(qiáng)語(yǔ)言模型的性能。融合多個(gè)不同識(shí)別結(jié)果以進(jìn)一步提高識(shí)別精度。與基線系統(tǒng)相比,多種系統(tǒng)融合的識(shí)別絕對(duì)錯(cuò)誤率減少12%。
[Abstract]:With the development of speech recognition technology, the research of speech recognition system with scarce resources has attracted more and more attention. This paper studies how to use other multilingual information to improve the performance of recognition system under the condition of scarcity of resources (such as only 10 hours of tagged speech). Extracting features based on multilingual depth Bottleneck neural network can obtain a more discriminative acoustic model, and a large amount of web data can be obtained by searching engine and web crawler's directional crawling. It is helpful to obtain text data to enhance the performance of the language model, and to fuse multiple different recognition results to further improve the recognition accuracy. Compared with the baseline system, the recognition absolute error rate of multi-system fusion is reduced by 12 steps.
【作者單位】: 山東財(cái)經(jīng)大學(xué)系統(tǒng)科學(xué)與信息處理研究所;
【基金】:國(guó)家自然科學(xué)基金(61305027) 山東省自然科學(xué)基金(ZR2011FQ024) 山東省高等學(xué)校科技計(jì)劃(J17KB160)資助
【分類號(hào)】:TN912.34
【相似文獻(xiàn)】
相關(guān)期刊論文 前10條
1 吳軍,,王作英;漢語(yǔ)信息熵和語(yǔ)言模型的復(fù)雜度[J];電子學(xué)報(bào);1996年10期
2 金凌,吳文虎,鄭方,吳根清;距離加權(quán)統(tǒng)計(jì)語(yǔ)言模型及其應(yīng)用[J];中文信息學(xué)報(bào);2001年06期
3 陳浪舟,黃泰翼,nlpr.ia.ac.cn;基于模糊訓(xùn)練集的領(lǐng)域相關(guān)統(tǒng)計(jì)語(yǔ)言模型[J];軟件學(xué)報(bào);2000年07期
4 劉長(zhǎng)娥;王世鎮(zhèn);劉加;夏善紅;;語(yǔ)種確認(rèn)中基于段長(zhǎng)的語(yǔ)言模型修正方法[J];計(jì)算機(jī)應(yīng)用研究;2006年07期
5 張瑞強(qiáng),王作英,陸大 ;關(guān)于漢語(yǔ)音字轉(zhuǎn)換中語(yǔ)言模型零概率的問題[J];電子學(xué)報(bào);1998年08期
6 沈兆勇;顧明亮;;基于符號(hào)化和語(yǔ)言模型方法的漢語(yǔ)方言自動(dòng)辨識(shí)[J];徐州師范大學(xué)學(xué)報(bào)(自然科學(xué)版);2006年02期
7 楊春風(fēng);王歡良;;觸發(fā)式語(yǔ)言模型下的混淆網(wǎng)絡(luò)解碼方法[J];計(jì)算機(jī)工程與應(yīng)用;2011年10期
8 田斌;田紅心;易克初;;一種結(jié)合聲學(xué)匹配信息的漢語(yǔ)統(tǒng)計(jì)語(yǔ)言模型新方法[J];模式識(shí)別與人工智能;1999年04期
9 單煜翔;陳諧;史永哲;劉加;;基于擴(kuò)展N元文法模型的快速語(yǔ)言模型預(yù)測(cè)算法[J];自動(dòng)化學(xué)報(bào);2012年10期
10 黎亞雄;張堅(jiān)強(qiáng);潘登;胡憚;;基于RNN-RBM語(yǔ)言模型的語(yǔ)音識(shí)別研究[J];計(jì)算機(jī)研究與發(fā)展;2014年09期
相關(guān)會(huì)議論文 前6條
1 陳振標(biāo);徐波;;限定領(lǐng)域的語(yǔ)言模型[A];第七屆全國(guó)人機(jī)語(yǔ)音通訊學(xué)術(shù)會(huì)議(NCMMSC7)論文集[C];2003年
2 田斌;易克初;;一種擴(kuò)展的漢語(yǔ)統(tǒng)計(jì)二元文法語(yǔ)言模型[A];第九屆全國(guó)信號(hào)處理學(xué)術(shù)年會(huì)(CCSP-99)論文集[C];1999年
3 蘇韜;汪俊杰;孫甲松;王作英;;基于最大似然估計(jì)的語(yǔ)言模型自適應(yīng)[A];第六屆全國(guó)人機(jī)語(yǔ)音通訊學(xué)術(shù)會(huì)議論文集[C];2001年
4 宋彥;徐兵;付強(qiáng);戴禮榮;;一種基于GMM模型的自動(dòng)語(yǔ)種識(shí)別方法[A];第九屆全國(guó)人機(jī)語(yǔ)音通訊學(xué)術(shù)會(huì)議論文集[C];2007年
5 吳宗憲;王駿發(fā);;語(yǔ)音辨認(rèn)中階層式以文法為主之馬可夫語(yǔ)言模型[A];第三屆全國(guó)人機(jī)語(yǔ)音通訊學(xué)術(shù)會(huì)議論文集[C];1994年
6 黃順珍;方棣棠;;基于拼音模型的聲學(xué)層的實(shí)驗(yàn)研究[A];第六屆全國(guó)人機(jī)語(yǔ)音通訊學(xué)術(shù)會(huì)議論文集[C];2001年
相關(guān)重要報(bào)紙文章 前1條
1 清華大學(xué) 劉加;識(shí)別語(yǔ)音的幾種依據(jù)[N];計(jì)算機(jī)世界;2006年
相關(guān)碩士學(xué)位論文 前5條
1 張劍;連續(xù)語(yǔ)音識(shí)別中的循環(huán)神經(jīng)網(wǎng)絡(luò)語(yǔ)言模型技術(shù)研究[D];解放軍信息工程大學(xué);2014年
2 王賀福;統(tǒng)計(jì)語(yǔ)言模型應(yīng)用與研究[D];復(fù)旦大學(xué);2012年
3 秦敏;基于詞激活力的長(zhǎng)距離語(yǔ)言模型研究[D];北京郵電大學(xué);2014年
4 李照耀;藏語(yǔ)連續(xù)語(yǔ)音識(shí)別的語(yǔ)言模型研究[D];西北民族大學(xué);2014年
5 劉章;面向服務(wù)機(jī)器人的口語(yǔ)對(duì)話系統(tǒng)和語(yǔ)言模型技術(shù)研究[D];中國(guó)科學(xué)技術(shù)大學(xué);2014年
本文編號(hào):1680743
本文鏈接:http://sikaile.net/kejilunwen/sousuoyinqinglunwen/1680743.html