低數(shù)據(jù)資源條件下基于Bottleneck特征與SGMM模型的語(yǔ)音識(shí)別系統(tǒng)
發(fā)布時(shí)間:2017-07-03 23:15
本文關(guān)鍵詞:低數(shù)據(jù)資源條件下基于Bottleneck特征與SGMM模型的語(yǔ)音識(shí)別系統(tǒng)
更多相關(guān)文章: 語(yǔ)音識(shí)別 低資源 聲學(xué)模型 聲學(xué)特征
【摘要】:語(yǔ)音識(shí)別系統(tǒng)需要大量有標(biāo)注訓(xùn)練數(shù)據(jù),在低數(shù)據(jù)資源條件下的識(shí)別性能往往不理想.針對(duì)數(shù)據(jù)匱乏問(wèn)題,本文先研究子空間高斯混合聲學(xué)模型通過(guò)參數(shù)共享減少待估計(jì)的參數(shù)規(guī)模,并使用基于最大互信息準(zhǔn)則的區(qū)分型訓(xùn)練技術(shù)提高識(shí)別精度;而后在特征層面應(yīng)用基于深度神經(jīng)網(wǎng)絡(luò)的Bottleneck特征來(lái)達(dá)到特征提取和降維的目的;最后將上述研究成果結(jié)合并構(gòu)建了低資源條件下的語(yǔ)音識(shí)別系統(tǒng).在國(guó)際標(biāo)準(zhǔn)的Open KWS 2013數(shù)據(jù)庫(kù)上的實(shí)驗(yàn)結(jié)果表明,本文的技術(shù)能夠有效改善低資源條件下的系統(tǒng)識(shí)別性能,相比基線(xiàn)系統(tǒng)有12%左右的詞錯(cuò)誤率降低.
【作者單位】: 中國(guó)科學(xué)院大學(xué);中國(guó)科學(xué)院電子學(xué)研究所傳感技術(shù)國(guó)家重點(diǎn)實(shí)驗(yàn)室;清華大學(xué)電子工程系清華信息科學(xué)與技術(shù)國(guó)家實(shí)驗(yàn)室;
【關(guān)鍵詞】: 語(yǔ)音識(shí)別 低資源 聲學(xué)模型 聲學(xué)特征
【基金】:國(guó)家自然科學(xué)基金(61005019,61273268,61370034,90920302) 北京市自然科學(xué)基金(KZ201110005005)資助
【分類(lèi)號(hào)】:TN912.34
【正文快照】: Wu W L,Cai M,Tian Y,et al.Bottleneck features and subspace Gaussian mixture models for low-resource speechrecognition[J].Journal of University of Chinese Academy of Sciences,2015,32(1):97-102.standard Open KWS 2013 evaluation corpus,experimental results ,
本文編號(hào):515553
本文鏈接:http://sikaile.net/kejilunwen/wltx/515553.html
最近更新
教材專(zhuān)著