基于卷積神經(jīng)網(wǎng)絡(luò)的魯棒性說(shuō)話人識(shí)別方法
發(fā)布時(shí)間:2024-01-21 19:03
為了提升說(shuō)話人識(shí)別技術(shù)在復(fù)雜噪聲環(huán)境下的識(shí)別性能,提出了一種基于高斯均值矩陣和卷積神經(jīng)網(wǎng)絡(luò)的魯棒性說(shuō)話人識(shí)別方法,應(yīng)用于純凈語(yǔ)音訓(xùn)練出的模型上測(cè)試含噪語(yǔ)音的場(chǎng)景.其中高斯均值矩陣是采用最大后驗(yàn)概率(MAP)對(duì)傳統(tǒng)的梅爾頻率倒譜系數(shù)(MFCC)特征進(jìn)行自適應(yīng)操作得到的,這一操作增加了幀與幀之間的關(guān)聯(lián)性,使特征攜帶更豐富的說(shuō)話人身份信息.同時(shí)采用卷積神經(jīng)網(wǎng)絡(luò)進(jìn)一步對(duì)幀層面的信息進(jìn)行對(duì)準(zhǔn),并從數(shù)據(jù)中學(xué)習(xí)到更有利于說(shuō)話人識(shí)別的特征表示,從而提升說(shuō)話人識(shí)別的魯棒性.實(shí)驗(yàn)結(jié)果表明在Libri語(yǔ)音數(shù)據(jù)集上,所提出方法的魯棒性優(yōu)于GMM-UBM和GSV-SVM算法.
【文章頁(yè)數(shù)】:6 頁(yè)
本文編號(hào):3882350
【文章頁(yè)數(shù)】:6 頁(yè)
本文編號(hào):3882350
本文鏈接:http://sikaile.net/kejilunwen/xinxigongchenglunwen/3882350.html
最近更新
教材專(zhuān)著