天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

基于隱藏單元條件隨機(jī)場的多知識(shí)源融合改進(jìn)自動(dòng)語音識(shí)別置信度

發(fā)布時(shí)間:2018-05-27 11:27

  本文選題:語音識(shí)別 + 置信度估計(jì); 參考:《電子與信息學(xué)報(bào)》2014年08期


【摘要】:鑒于自動(dòng)語音識(shí)別(ASR)中置信度估計(jì)困難的問題,該文提出一種基于多知識(shí)源融合的策略來提高置信度的鑒別能力。具體做法是,首先選擇關(guān)于識(shí)別結(jié)果的聲學(xué)層、語言層和語義層等不同層次的信息,然后通過實(shí)驗(yàn)確定這些信息不同的組合方式,并以此為特征在隱藏單元條件隨機(jī)場(Hidden-units Conditional Random Fields,HuCRFs)框架下計(jì)算識(shí)別結(jié)果的條件概率。最后將HuCRFs條件概率作為語音識(shí)別結(jié)果置信度的新的估計(jì)。實(shí)驗(yàn)首先證明了HuCRFs條件概率是比歸一化的網(wǎng)格后驗(yàn)概率鑒別能力更強(qiáng)的一種置信度估計(jì)方法。同時(shí)基于HuCRFs條件概率置信度,對(duì)解碼器一遍識(shí)別得到的網(wǎng)格重新搜索最佳候選序列,取得了相對(duì)一遍識(shí)別最佳候選序列絕對(duì)近2%的字錯(cuò)誤率(CER)下降。同時(shí),該文也對(duì)比了基于HuCRFs條件概率搜索的最佳候選序列和基于長語言模型網(wǎng)格重估的最佳候選序列的性能,進(jìn)一步證明了使用HuCRFs條件概率作為置信度估計(jì)是一種更好的選擇。
[Abstract]:In view of the difficulty of confidence estimation in automatic speech recognition (ASR), this paper proposes a multi-source fusion strategy to improve the confidence identification ability. The specific approach is to first select different levels of information about the results of the recognition, such as the acoustic layer, the language layer and the semantic layer, and then, through experiments, determine the different combinations of these information. The conditional probability of recognition results is calculated under the framework of Hidden-units Conditional Random FieldsHuCRFs (Hidden-units Conditional Random FieldsHuCRFs). Finally, the HuCRFs conditional probability is used as a new estimation of the confidence of speech recognition results. Firstly, it is proved that the HuCRFs conditional probability is a confidence estimation method which is more powerful than the normalized grid posteriori probability discriminant. At the same time, based on the confidence degree of HuCRFs conditional probability, the best candidate sequence is re-searched for the mesh recognized by the decoder in one pass, and the absolute error rate of nearly 2% is reduced relative to the best candidate sequence in one pass recognition. At the same time, the performance of the best candidate sequence based on HuCRFs conditional probability search and the best candidate sequence based on long language model mesh reestimation is compared. It is further proved that using HuCRFs conditional probability as confidence estimation is a better choice.
【作者單位】: 中國科學(xué)院聲學(xué)研究所;
【基金】:國家自然科學(xué)基金(10925419,90920302,61072124,11074275,11161140319,91120001,61271426) 中國科學(xué)院戰(zhàn)略性先導(dǎo)科技專項(xiàng)(XDA06030100,XDA06030500) 國家863計(jì)劃項(xiàng)目(2012AA012503) 中科院重點(diǎn)部署項(xiàng)目(KGZD-EW-103-2)資助課題
【分類號(hào)】:TN912.34

【共引文獻(xiàn)】

相關(guān)期刊論文 前1條

1 李海洋;韓紀(jì)慶;鄭貴濱;鄭鐵然;;語音關(guān)鍵詞檢測中置信測度方法研究綜述[J];智能計(jì)算機(jī)與應(yīng)用;2014年02期

相關(guān)博士學(xué)位論文 前1條

1 李寶祥;語音關(guān)鍵詞檢索若干問題的研究[D];北京郵電大學(xué);2013年

相關(guān)碩士學(xué)位論文 前1條

1 王勇;基于點(diǎn)過程模型的連續(xù)語音關(guān)鍵詞檢測技術(shù)研究[D];解放軍信息工程大學(xué);2013年

【相似文獻(xiàn)】

相關(guān)博士學(xué)位論文 前1條

1 熊英;中文自然語言理解中基于條件隨機(jī)場理論的詞法分析研究[D];上海交通大學(xué);2009年

相關(guān)碩士學(xué)位論文 前4條

1 包森成;基于統(tǒng)計(jì)模型的韻律結(jié)構(gòu)預(yù)測研究[D];北京郵電大學(xué);2009年

2 鄭明東;語音關(guān)鍵詞識(shí)別技術(shù)研究[D];廣西師范大學(xué);2012年

3 張曉斐;分布式視頻編碼的邊信息融合與重構(gòu)[D];上海交通大學(xué);2010年

4 吳楠;基于主動(dòng)學(xué)習(xí)的語音情感識(shí)別研究[D];天津師范大學(xué);2012年



本文編號(hào):1941866

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/wltx/1941866.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶c58b4***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com