低數(shù)據(jù)資源條件下基于Bottleneck特征與SGMM模型的語音識別系統(tǒng)
發(fā)布時間:2017-07-03 23:15
本文關(guān)鍵詞:低數(shù)據(jù)資源條件下基于Bottleneck特征與SGMM模型的語音識別系統(tǒng)
更多相關(guān)文章: 語音識別 低資源 聲學(xué)模型 聲學(xué)特征
【摘要】:語音識別系統(tǒng)需要大量有標注訓(xùn)練數(shù)據(jù),在低數(shù)據(jù)資源條件下的識別性能往往不理想.針對數(shù)據(jù)匱乏問題,本文先研究子空間高斯混合聲學(xué)模型通過參數(shù)共享減少待估計的參數(shù)規(guī)模,并使用基于最大互信息準則的區(qū)分型訓(xùn)練技術(shù)提高識別精度;而后在特征層面應(yīng)用基于深度神經(jīng)網(wǎng)絡(luò)的Bottleneck特征來達到特征提取和降維的目的;最后將上述研究成果結(jié)合并構(gòu)建了低資源條件下的語音識別系統(tǒng).在國際標準的Open KWS 2013數(shù)據(jù)庫上的實驗結(jié)果表明,本文的技術(shù)能夠有效改善低資源條件下的系統(tǒng)識別性能,相比基線系統(tǒng)有12%左右的詞錯誤率降低.
【作者單位】: 中國科學(xué)院大學(xué);中國科學(xué)院電子學(xué)研究所傳感技術(shù)國家重點實驗室;清華大學(xué)電子工程系清華信息科學(xué)與技術(shù)國家實驗室;
【關(guān)鍵詞】: 語音識別 低資源 聲學(xué)模型 聲學(xué)特征
【基金】:國家自然科學(xué)基金(61005019,61273268,61370034,90920302) 北京市自然科學(xué)基金(KZ201110005005)資助
【分類號】:TN912.34
【正文快照】: Wu W L,Cai M,Tian Y,et al.Bottleneck features and subspace Gaussian mixture models for low-resource speechrecognition[J].Journal of University of Chinese Academy of Sciences,2015,32(1):97-102.standard Open KWS 2013 evaluation corpus,experimental results ,
本文編號:515553
本文鏈接:http://sikaile.net/kejilunwen/wltx/515553.html
最近更新
教材專著