子空間域相關(guān)特征變換與融合的語(yǔ)音識(shí)別方法
發(fā)布時(shí)間:2017-08-14 04:27
本文關(guān)鍵詞:子空間域相關(guān)特征變換與融合的語(yǔ)音識(shí)別方法
更多相關(guān)文章: 語(yǔ)音識(shí)別 區(qū)分性訓(xùn)練 深度神經(jīng)網(wǎng)絡(luò) 子空間域相關(guān)特征變換
【摘要】:為了提高語(yǔ)音識(shí)別準(zhǔn)確率,提出了一種子空間域相關(guān)特征變換與融合的語(yǔ)音識(shí)別方法(MFCC-BN-TC方法)。該方法提取語(yǔ)音短時(shí)譜結(jié)構(gòu)特征(BN)和包絡(luò)特征(MFCC)分別描述語(yǔ)音短時(shí)譜結(jié)構(gòu)和包絡(luò)信息,并采用域相關(guān)特征變換的形式分別對(duì)BN和MFCC特征進(jìn)行特征變換;然后對(duì)這種變換進(jìn)行泛化擴(kuò)展提出子空間域相關(guān)特征變換,以采用不同的時(shí)間顆粒度(幀和語(yǔ)音分段)進(jìn)行多層次區(qū)分性特征表達(dá);最后,對(duì)多種區(qū)分性特征變換后的特征進(jìn)行聯(lián)合表征訓(xùn)練聲學(xué)模型,并給出了區(qū)分性特征變換與融合的一般框架。實(shí)驗(yàn)結(jié)果表明:MFCC-BN-TC方法比采用原始BN特征方法和采用MFCC特征基線(xiàn)系統(tǒng)方法,識(shí)別性能各自提高了0.98%和1.62%;融合MFCCBN-TC方法變換以后的語(yǔ)音信號(hào)特征,相比于融合原始特征,識(shí)別率提升了1.5%。
【作者單位】: 解放軍信息工程大學(xué)信息系統(tǒng)工程學(xué)院;山東大學(xué)信息科學(xué)與工程學(xué)院;
【關(guān)鍵詞】: 語(yǔ)音識(shí)別 區(qū)分性訓(xùn)練 深度神經(jīng)網(wǎng)絡(luò) 子空間域相關(guān)特征變換
【基金】:國(guó)家自然科學(xué)基金資助項(xiàng)目(61175017;61403415)
【分類(lèi)號(hào)】:TN912.34
【正文快照】: 自動(dòng)語(yǔ)音識(shí)別是將人類(lèi)自然語(yǔ)音轉(zhuǎn)化為文本或命令的技術(shù),是實(shí)現(xiàn)與機(jī)器“友好式”交流的重要技術(shù)之一。為提高語(yǔ)音識(shí)別率,常對(duì)特征參數(shù)進(jìn)行某種變換[1-2],以得到具有魯棒性和區(qū)分性的特征。其中以采用高斯混合模型進(jìn)行聲學(xué)空間劃分的最小音素錯(cuò)誤率(feature minimum phone error
【相似文獻(xiàn)】
中國(guó)碩士學(xué)位論文全文數(shù)據(jù)庫(kù) 前1條
1 王斐;特征變換方法及其在SAR目標(biāo)鑒別上的應(yīng)用[D];西安電子科技大學(xué);2014年
,本文編號(hào):670775
本文鏈接:http://sikaile.net/kejilunwen/xinxigongchenglunwen/670775.html
最近更新
教材專(zhuān)著