采用M-矢量和支持向量機(jī)的說話人確認(rèn)系統(tǒng)
【圖文】:
后通過MLLR超矢量形成方法從UBM模型自適應(yīng)得到該說話人的變換矩陣W,把W的所有行按順序排列起來得到MLLR超矢量.對超矢量進(jìn)行重疊加窗分割(含重疊元素的均勻分割)就得到一系列的新矢量Mi,這些新矢量就稱為M-矢量[3],該過程如圖1所示,圖中黑色方塊表示MLLR超矢量的每一維.其中重疊分割的目的是為了能充分挖掘不同特征維度空間中潛在的能反映說話人身份特性的信息,可類比特征提取過程中對原始語音信號進(jìn)行重疊加窗分幀的做法.圖1M-矢量的結(jié)構(gòu)2.2多類MLLRM-矢量估計與M-矢量的產(chǎn)生不同,本文中多類MLLRM-矢量是在UBM子空間基礎(chǔ)上進(jìn)行MLLR自適應(yīng)而獲得.在此借鑒了傳統(tǒng)音素類MLLR自適應(yīng)技術(shù)的優(yōu)點,采用多個子空間來描述語音信號中含有的豐富細(xì)節(jié)信息.如從不同的UBM子空間中估計出的M-矢量可從不同語義層面、信道類型、說話人習(xí)慣用語等方面對說話人的原始語音進(jìn)行細(xì)節(jié)描述.其估計流程如下.·64·華中科技大學(xué)學(xué)報(自然科學(xué)版)第42卷
象減輕,無須估計大量的HMM參數(shù).2.3說話人確認(rèn)系統(tǒng)構(gòu)建SVM作為一種直接以最小化分類錯誤為目標(biāo)函數(shù)的分類器,在說話人確認(rèn)這種兩類分類問題中優(yōu)勢明顯,但因說話人識別中目標(biāo)說話人的訓(xùn)練語料非常少的特殊性而使得SVM的潛能尚未充分得到發(fā)揮,如在文獻(xiàn)[9]中,每位目標(biāo)說話人的正例樣本點就只有一個GMM均值超向量.本研究提出一種全新的基于支持向量機(jī)的說話人確認(rèn)系統(tǒng),它將多類MLLRM-矢量作為SVM的輸入特征進(jìn)行模型的訓(xùn)練和測試,其模型訓(xùn)練流程如圖2所示,具體步驟如下:步驟1將UBM通過EM算法聚類成S個子空間;步驟2冒認(rèn)者和目標(biāo)說話人的每一句原始語音分別通過MLLR算法在各子空間中進(jìn)行自適應(yīng),構(gòu)建每句話在每個子空間中對應(yīng)的M-矢量,得到對應(yīng)于各子空間的M-矢量集合;圖2基于多類MLLRM-矢量的支持向量機(jī)說話人確認(rèn)系統(tǒng)訓(xùn)練流程步驟3將M-矢量作為SVM的輸入特征并在其核空間中進(jìn)行信道補(bǔ)償及相應(yīng)的說話人模型訓(xùn)練,用以消除跨信道的問題,從而得到最終每位目標(biāo)說話人的SVM模型.在測試階段,對于每一段原始語音,同樣經(jīng)過上述三個步驟在SVM核空間中進(jìn)行信道補(bǔ)償與測試,得到用于最終判決的SVM得分.這里提出的說話人確認(rèn)系統(tǒng)由于采用了基于UBM子空間的多類M-矢量,即每位目標(biāo)說話人的訓(xùn)練正例樣本數(shù)為子空間數(shù)S乘以每個子空間對應(yīng)的M-矢量數(shù)目N,從而使得目標(biāo)說話人的正例樣本數(shù)大大增加,能很好地解決訓(xùn)練數(shù)據(jù)的稀疏問題,在更大程度上挖掘出SVM強(qiáng)大的分類能力.須要提出的是:SVM
【相似文獻(xiàn)】
相關(guān)期刊論文 前10條
1 何昕,劉重慶,李介谷;基于支撐向量機(jī)的說話人確認(rèn)系統(tǒng)[J];計算機(jī)工程與應(yīng)用;2000年12期
2 鄧浩江,王守覺,杜利民;優(yōu)先度排序RBF神經(jīng)網(wǎng)絡(luò)在與文本無關(guān)說話人確認(rèn)中的應(yīng)用[J];電子與信息學(xué)報;2003年09期
3 忻棟,楊瑩春,吳朝暉;基于SVM-HMM混合模型的說話人確認(rèn)[J];計算機(jī)輔助設(shè)計與圖形學(xué)學(xué)報;2002年11期
4 殷啟新,楊鑒;基于高斯混合模型和假設(shè)檢驗方法的說話人確認(rèn)[J];計算機(jī)應(yīng)用;2004年S1期
5 李軼,范影樂;基于倒譜與復(fù)雜性的說話人確認(rèn)系統(tǒng)[J];杭州電子工業(yè)學(xué)院學(xué)報;2004年06期
6 郭武;戴禮榮;王仁華;;基于均值超矢量聚類和特征映射的說話人確認(rèn)[J];數(shù)據(jù)采集與處理;2009年01期
7 張怡穎,朱小燕,張鈸;一種新的說話人確認(rèn)方法[J];軟件學(xué)報;1999年04期
8 馬靜;侯麗敏;王朔中;;基于全局背景模型和競爭者模型的說話人確認(rèn)系統(tǒng)[J];聲學(xué)技術(shù);2007年01期
9 陳皓,付中華,趙榮椿;說話人確認(rèn)中針對語音編碼差異的似然比得分補(bǔ)償方法[J];西北工業(yè)大學(xué)學(xué)報;2005年04期
10 石如亮;王波;李弼程;高新建;;低速率信道環(huán)境下魯棒的說話人確認(rèn)[J];計算機(jī)應(yīng)用;2007年04期
相關(guān)會議論文 前10條
1 張濤;王嵐;遲惠生;;基于VQ的說話人確認(rèn)系統(tǒng)的硬件實現(xiàn)[A];第六屆全國人機(jī)語音通訊學(xué)術(shù)會議論文集[C];2001年
2 趙亞麗;付中華;謝磊;張健;張艷寧;;雙麥克風(fēng)語音增強(qiáng)和雜混模型訓(xùn)練相結(jié)合的頑健說話人確認(rèn)[A];第十一屆全國人機(jī)語音通訊學(xué)術(shù)會議論文集(一)[C];2011年
3 陳勝;徐明星;;基于Feature Warping和ICA的發(fā)音方式魯棒的說話人確認(rèn)[A];第十一屆全國人機(jī)語音通訊學(xué)術(shù)會議論文集(一)[C];2011年
4 楊藝敏;景新幸;楊海燕;;PSO-SVM在說話人確認(rèn)系統(tǒng)中的研究[A];泛在信息社會中的聲學(xué)——中國聲學(xué)學(xué)會2010年全國會員代表大會暨學(xué)術(shù)會議論文集[C];2010年
5 展領(lǐng);景新幸;;矢量量化和VQ-UBM在說話人確認(rèn)中的應(yīng)用[A];中國聲學(xué)學(xué)會2009年青年學(xué)術(shù)會議[CYCA’09]論文集[C];2009年
6 陳龍;吳志勇;袁春;蒙美玲;蔡蓮紅;;面向數(shù)字版權(quán)管理的聲紋輔助認(rèn)證系統(tǒng)[A];第十一屆全國人機(jī)語音通訊學(xué)術(shù)會議論文集(一)[C];2011年
7 吳璽宏;遲惠生;;一種高性能的限定文本說話人確認(rèn)系統(tǒng)[A];第三屆全國人機(jī)語音通訊學(xué)術(shù)會議論文集[C];1994年
8 鮑福良;方志剛;徐潔;;基于MFCC和GMM的說話人確認(rèn)研究[A];第六屆全國信息獲取與處理學(xué)術(shù)會議論文集(2)[C];2008年
9 彭詩雅;;聲紋識別技術(shù)研究[A];第十六屆全國青年通信學(xué)術(shù)會議論文集(上)[C];2011年
10 洪青陽;陳毅東;;一種用于說話人確認(rèn)的區(qū)別性訓(xùn)練方法[A];第八屆全國人機(jī)語音通訊學(xué)術(shù)會議論文集[C];2005年
相關(guān)重要報紙文章 前4條
1 北京大學(xué)信息科學(xué)中心視覺與聽覺信息處理國家重點實驗室 吳璽宏;聲紋識別聽聲辨人[N];計算機(jī)世界;2001年
2 實習(xí)生 沈春梅;鑒定薩達(dá)姆錄音真假[N];科技日報;2003年
3 吳璽宏;聲紋識別應(yīng)用前景[N];計算機(jī)世界;2001年
4 ;解密聲紋鎖 一聲令下,“芝麻開門”[N];廣東科技報;2011年
相關(guān)博士學(xué)位論文 前10條
1 劉明輝;基于GMM和SVM的文本無關(guān)的說話人確認(rèn)方法研究[D];中國科學(xué)技術(shù)大學(xué);2007年
2 陸偉;基于缺失特征的文本無關(guān)說話人識別魯棒性研究[D];中國科學(xué)技術(shù)大學(xué);2008年
3 許東星;基于GMM和高層信息特征的文本無關(guān)說話人識別研究[D];中國科學(xué)技術(shù)大學(xué);2009年
4 解焱陸;基于特征變換和分類的文本無關(guān)電話語音說話人識別研究[D];中國科學(xué)技術(shù)大學(xué);2007年
5 姚志強(qiáng);說話人識別中提高GMM性能方法的研究[D];中國科學(xué)技術(shù)大學(xué);2006年
6 李冬冬;基于拓展和聚類的情感魯棒說話人識別研究[D];浙江大學(xué);2008年
7 龍艷花;基于SVM的話者確認(rèn)關(guān)鍵技術(shù)研究[D];中國科學(xué)技術(shù)大學(xué);2011年
8 蔣曄;基于短語音和信道變化的說話人識別研究[D];南京理工大學(xué);2013年
9 郭武;復(fù)雜信道下的說話人識別[D];中國科學(xué)技術(shù)大學(xué);2007年
10 高二中;對話電話語音的話者確認(rèn)研究[D];中國科學(xué)技術(shù)大學(xué);2011年
相關(guān)碩士學(xué)位論文 前10條
1 花城;說話人確認(rèn)的特征域補(bǔ)償方法研究[D];中國科學(xué)技術(shù)大學(xué);2014年
2 尹聰;基于感知對數(shù)面積比系數(shù)的說話人確認(rèn)系統(tǒng)的研究[D];太原理工大學(xué);2013年
3 周毓;基于因子分析的說話人確認(rèn)[D];中國科學(xué)技術(shù)大學(xué);2010年
4 駱啟帆;基于聲門信息的說話人確認(rèn)方法研究[D];杭州電子科技大學(xué);2014年
5 李成;基于SoPC技術(shù)的便攜式說話人確認(rèn)系統(tǒng)研究與實現(xiàn)[D];北京交通大學(xué);2010年
6 余巍;基于排序GMM的說話人確認(rèn)的研究[D];中國科學(xué)技術(shù)大學(xué);2011年
7 李軼;說話人識別系統(tǒng)研究[D];浙江大學(xué);2003年
8 哈斯塔木嘎;嵌入式Linux環(huán)境下與文本有關(guān)的說話人確認(rèn)系統(tǒng)實現(xiàn)[D];內(nèi)蒙古大學(xué);2009年
9 周昆湘;基于矢量量化的與文本無關(guān)的說話人確認(rèn)系統(tǒng)的研究[D];中南大學(xué);2007年
10 趙靖;基于高斯混合模型的說話人確認(rèn)魯棒性研究和系統(tǒng)實現(xiàn)[D];重慶大學(xué);2008年
,本文編號:2570105
本文鏈接:http://sikaile.net/kejilunwen/wltx/2570105.html