低數(shù)據(jù)資源條件下基于Bottleneck特征與SGMM模型的語音識別系統(tǒng)

發(fā)布時間：2017-07-03 23:15

本文關(guān)鍵詞：低數(shù)據(jù)資源條件下基于Bottleneck特征與SGMM模型的語音識別系統(tǒng)

更多相關(guān)文章： 語音識別 低資源 聲學(xué)模型 聲學(xué)特征

【摘要】：語音識別系統(tǒng)需要大量有標注訓(xùn)練數(shù)據(jù),在低數(shù)據(jù)資源條件下的識別性能往往不理想.針對數(shù)據(jù)匱乏問題,本文先研究子空間高斯混合聲學(xué)模型通過參數(shù)共享減少待估計的參數(shù)規(guī)模,并使用基于最大互信息準則的區(qū)分型訓(xùn)練技術(shù)提高識別精度;而后在特征層面應(yīng)用基于深度神經(jīng)網(wǎng)絡(luò)的Bottleneck特征來達到特征提取和降維的目的;最后將上述研究成果結(jié)合并構(gòu)建了低資源條件下的語音識別系統(tǒng).在國際標準的Open KWS 2013數(shù)據(jù)庫上的實驗結(jié)果表明,本文的技術(shù)能夠有效改善低資源條件下的系統(tǒng)識別性能,相比基線系統(tǒng)有12%左右的詞錯誤率降低.
【作者單位】：中國科學(xué)院大學(xué);中國科學(xué)院電子學(xué)研究所傳感技術(shù)國家重點實驗室;清華大學(xué)電子工程系清華信息科學(xué)與技術(shù)國家實驗室;
【關(guān)鍵詞】： 語音識別 低資源 聲學(xué)模型 聲學(xué)特征
【基金】：國家自然科學(xué)基金(61005019,61273268,61370034,90920302) 北京市自然科學(xué)基金(KZ201110005005)資助
【分類號】：TN912.34
【正文快照】： Wu W L,Cai M,Tian Y,et al.Bottleneck features and subspace Gaussian mixture models for low-resource speechrecognition[J].Journal of University of Chinese Academy of Sciences,2015,32(1):97-102.standard Open KWS 2013 evaluation corpus,experimental results ，

本文編號：515553

資料下載

論文發(fā)表

支付寶下載

Download by Alipay
微信下載

Download by Wechat
會員下載

Download by Member

本文鏈接：http://sikaile.net/kejilunwen/wltx/515553.html

上一篇：IEEE802.11p協(xié)議數(shù)據(jù)收發(fā)控制器的狀態(tài)仿真
下一篇：基于調(diào)度的P2P流媒體點播系統(tǒng)模型

論文發(fā)表

·知網(wǎng)|萬方|維普|龍源|省級|國家級|科技核心|北大核心|南大核心CSSCI|EI|SCI|SSCI|

天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

低數(shù)據(jù)資源條件下基于Bottleneck特征與SGMM模型的語音識別系統(tǒng)