高斯PLDA在說話人確認(rèn)中的應(yīng)用及其聯(lián)合估計(jì)
本文選題:因子分析 + 總變化因子。 參考:《自動(dòng)化學(xué)報(bào)》2014年06期
【摘要】:近年來,基于總變化因子的說話人識(shí)別方法成為說話人識(shí)別領(lǐng)域的主流方法.其中,概率線性鑒別分析(Probabilistic linear discriminant analysis,PLDA)因其優(yōu)異的性能而得到學(xué)者們的廣泛關(guān)注.然而,在估計(jì)PLDA模型時(shí),傳統(tǒng)的因子分析方法只更新模型空間,因此,模型均值不能很好地與更新后的模型空間耦合.提出聯(lián)合估計(jì)法對(duì)模型均值和模型空間同時(shí)估計(jì),得到更為嚴(yán)格的期望最大化更新公式,在美國(guó)國(guó)家標(biāo)準(zhǔn)與技術(shù)局說話人識(shí)別評(píng)測(cè)2010擴(kuò)展測(cè)試數(shù)據(jù)庫以及2012核心測(cè)試數(shù)據(jù)庫上,等錯(cuò)率得到一定提升.
[Abstract]:In recent years, speaker recognition based on total change factor has become the mainstream method in the field of speaker recognition. Among them, probabilistic linear discriminant analysis (PLDA) has attracted wide attention due to its excellent performance. However, in estimating the PLDA model, the traditional factor analysis method only updates the model space, so the model mean is not well coupled with the updated model space. The joint estimation method is proposed to estimate the model mean and model space simultaneously, and a more strict expectation maximization updating formula is obtained, which is based on the extended test database of speaker identification evaluation 2010 and the core test database 2012 of the National Bureau of Standards and Technology. The equal error rate is improved to a certain extent.
【作者單位】: 中國(guó)科學(xué)院語言聲學(xué)與內(nèi)容理解重點(diǎn)實(shí)驗(yàn)室;
【基金】:國(guó)家高技術(shù)研究發(fā)展計(jì)劃(863計(jì)劃)(2012AA012503) 國(guó)家自然科學(xué)基金(10925419,90920302,61072124,11074275,11161140319,91120001,61271426) 中國(guó)科學(xué)院戰(zhàn)略性先導(dǎo)科技專項(xiàng)(XDA06030100,XDA06030500) 中科院重點(diǎn)部署項(xiàng)目(KGZDEW-103-2)資助~~
【分類號(hào)】:TN912.34
【參考文獻(xiàn)】
相關(guān)期刊論文 前2條
1 郭武;李軼杰;戴禮榮;王仁華;;說話人識(shí)別中的因子分析以及空間拼接[J];自動(dòng)化學(xué)報(bào);2009年09期
2 何亮;史永哲;劉加;;聯(lián)合因子分析中的本征信道空間拼接方法[J];自動(dòng)化學(xué)報(bào);2011年07期
【共引文獻(xiàn)】
相關(guān)期刊論文 前10條
1 賀前華;王志鋒;Alexander I Rudnicky;朱錚宇;李新超;;基于改進(jìn)PNCC特征和兩步區(qū)分性訓(xùn)練的錄音設(shè)備識(shí)別方法[J];電子學(xué)報(bào);2014年01期
2 李亮;王良;Jin xingYu;馮朝燕;鄧明;馮定義;彭莉;劉繼紅;胡道予;;發(fā)表影像學(xué)SCI論文常用的統(tǒng)計(jì)學(xué)方法[J];放射學(xué)實(shí)踐;2014年06期
3 何亮;史永哲;劉加;;聯(lián)合因子分析中的本征信道空間拼接方法[J];自動(dòng)化學(xué)報(bào);2011年07期
4 李晉;郭武;戴禮榮;;聯(lián)合因子分析算法中基于信號(hào)子空間的空間變換方法[J];模式識(shí)別與人工智能;2013年08期
5 楊棟;周秀玲;郭平;;基于貝葉斯通用背景模型的圖像標(biāo)注[J];自動(dòng)化學(xué)報(bào);2013年10期
6 祝太鋒;;基于動(dòng)態(tài)反饋負(fù)載均衡算法的改進(jìn)[J];湖南農(nóng)機(jī);2013年11期
7 駱啟帆;章堅(jiān)武;吳震東;;一種基于MFCC與韻律特征的說話人確認(rèn)方法[J];杭州電子科技大學(xué)學(xué)報(bào);2013年05期
8 陳麗萍;王爾玉;戴禮榮;宋彥;;基于深層置信網(wǎng)絡(luò)的說話人信息提取方法[J];模式識(shí)別與人工智能;2013年12期
9 廖曉鋒;范修斌;姜青山;;基于協(xié)方差的高斯混合模型參數(shù)學(xué)習(xí)算法[J];計(jì)算機(jī)科學(xué);2013年S2期
10 郭心語;何曉豐;宮學(xué)慶;張蓉;周傲英;;一種基于曝光量和點(diǎn)擊率的用戶組優(yōu)化策略[J];計(jì)算機(jī)研究與發(fā)展;2013年S1期
相關(guān)會(huì)議論文 前6條
1 駱啟帆;章堅(jiān)武;吳震東;;一種基于MFCC與韻律特征的說話人確認(rèn)方法[A];浙江省電子學(xué)會(huì)2013學(xué)術(shù)年會(huì)論文集[C];2013年
2 尹聰;白靜;龔[,
本文編號(hào):2086675
本文鏈接:http://sikaile.net/kejilunwen/wltx/2086675.html