當(dāng)前位置：主頁 > 科技論文 > 網(wǎng)絡(luò)通信論文 >

采用M-矢量和支持向量機(jī)的說話人確認(rèn)系統(tǒng)

發(fā)布時間：2019-12-05 19:08

【摘要】：將UBM子空間中的說話人MLLR自適應(yīng)得到的M-矢量應(yīng)用于SVM中,提出了一種新的說話人確認(rèn)系統(tǒng).該系統(tǒng)有效地將擾動屬性映射算法整合到SVM核函數(shù)中,實現(xiàn)在核空間中直接對M-矢量進(jìn)行信道補(bǔ)償,從而提高系統(tǒng)對信道干擾的魯棒性能.實驗結(jié)果表明:相比傳統(tǒng)基于音素類的MLLR-SVM和基于I-矢量的I-vector-SVM基線系統(tǒng),在不需要大量有文本內(nèi)容標(biāo)注的語音數(shù)據(jù)、復(fù)雜度和運(yùn)算量都很高的自動語音識別系統(tǒng)、因子空間統(tǒng)計量的估計的情況下,本系統(tǒng)可獲得與最好的基線系統(tǒng)幾乎相當(dāng)?shù)男阅?同時還表現(xiàn)出很強(qiáng)的互補(bǔ)特性.在NIST SRE2008說話人評測數(shù)據(jù)庫上測試結(jié)果表明:提出系統(tǒng)的性能與基于I-矢量的說話人確認(rèn)系統(tǒng)的性能接近,并表現(xiàn)出很強(qiáng)的互補(bǔ)性,融合后的等錯誤率相對下降了13.3%.
【圖文】：

矢量圖,矢量,說話人,子空間

后通過ＭＬＬＲ超矢量形成方法從ＵＢＭ模型自適應(yīng)得到該說話人的變換矩陣Ｗ，把Ｗ的所有行按順序排列起來得到ＭＬＬＲ超矢量．對超矢量進(jìn)行重疊加窗分割（含重疊元素的均勻分割）就得到一系列的新矢量Ｍｉ，這些新矢量就稱為Ｍ－矢量［３］，該過程如圖１所示，圖中黑色方塊表示ＭＬＬＲ超矢量的每一維．其中重疊分割的目的是為了能充分挖掘不同特征維度空間中潛在的能反映說話人身份特性的信息，可類比特征提取過程中對原始語音信號進(jìn)行重疊加窗分幀的做法．圖１Ｍ－矢量的結(jié)構(gòu)２．２多類ＭＬＬＲＭ－矢量估計與Ｍ－矢量的產(chǎn)生不同，本文中多類ＭＬＬＲＭ－矢量是在ＵＢＭ子空間基礎(chǔ)上進(jìn)行ＭＬＬＲ自適應(yīng)而獲得．在此借鑒了傳統(tǒng)音素類ＭＬＬＲ自適應(yīng)技術(shù)的優(yōu)點，采用多個子空間來描述語音信號中含有的豐富細(xì)節(jié)信息．如從不同的ＵＢＭ子空間中估計出的Ｍ－矢量可從不同語義層面、信道類型、說話人習(xí)慣用語等方面對說話人的原始語音進(jìn)行細(xì)節(jié)描述．其估計流程如下．·６４·華中科技大學(xué)學(xué)報（自然科學(xué)版）第４２卷

說話人確認(rèn),系統(tǒng)訓(xùn)練,支持向量機(jī),矢量

象減輕，無須估計大量的ＨＭＭ參數(shù)．２．３說話人確認(rèn)系統(tǒng)構(gòu)建ＳＶＭ作為一種直接以最小化分類錯誤為目標(biāo)函數(shù)的分類器，在說話人確認(rèn)這種兩類分類問題中優(yōu)勢明顯，但因說話人識別中目標(biāo)說話人的訓(xùn)練語料非常少的特殊性而使得ＳＶＭ的潛能尚未充分得到發(fā)揮，如在文獻(xiàn)［９］中，每位目標(biāo)說話人的正例樣本點就只有一個ＧＭＭ均值超向量．本研究提出一種全新的基于支持向量機(jī)的說話人確認(rèn)系統(tǒng)，它將多類ＭＬＬＲＭ－矢量作為ＳＶＭ的輸入特征進(jìn)行模型的訓(xùn)練和測試，其模型訓(xùn)練流程如圖２所示，具體步驟如下：步驟１將ＵＢＭ通過ＥＭ算法聚類成Ｓ個子空間；步驟２冒認(rèn)者和目標(biāo)說話人的每一句原始語音分別通過ＭＬＬＲ算法在各子空間中進(jìn)行自適應(yīng)，構(gòu)建每句話在每個子空間中對應(yīng)的Ｍ－矢量，得到對應(yīng)于各子空間的Ｍ－矢量集合；圖２基于多類ＭＬＬＲＭ－矢量的支持向量機(jī)說話人確認(rèn)系統(tǒng)訓(xùn)練流程步驟３將Ｍ－矢量作為ＳＶＭ的輸入特征并在其核空間中進(jìn)行信道補(bǔ)償及相應(yīng)的說話人模型訓(xùn)練，用以消除跨信道的問題，從而得到最終每位目標(biāo)說話人的ＳＶＭ模型．在測試階段，對于每一段原始語音，同樣經(jīng)過上述三個步驟在ＳＶＭ核空間中進(jìn)行信道補(bǔ)償與測試，得到用于最終判決的ＳＶＭ得分．這里提出的說話人確認(rèn)系統(tǒng)由于采用了基于ＵＢＭ子空間的多類Ｍ－矢量，即每位目標(biāo)說話人的訓(xùn)練正例樣本數(shù)為子空間數(shù)Ｓ乘以每個子空間對應(yīng)的Ｍ－矢量數(shù)目Ｎ，從而使得目標(biāo)說話人的正例樣本數(shù)大大增加，能很好地解決訓(xùn)練數(shù)據(jù)的稀疏問題，在更大程度上挖掘出ＳＶＭ強(qiáng)大的分類能力．須要提出的是：ＳＶＭ

【相似文獻(xiàn)】

相關(guān)期刊論文前10條

1 何昕,劉重慶,李介谷;基于支撐向量機(jī)的說話人確認(rèn)系統(tǒng)[J];計算機(jī)工程與應(yīng)用;2000年12期

2 鄧浩江,王守覺,杜利民;優(yōu)先度排序RBF神經(jīng)網(wǎng)絡(luò)在與文本無關(guān)說話人確認(rèn)中的應(yīng)用[J];電子與信息學(xué)報;2003年09期

3 忻棟,楊瑩春,吳朝暉;基于SVM-HMM混合模型的說話人確認(rèn)[J];計算機(jī)輔助設(shè)計與圖形學(xué)學(xué)報;2002年11期

4 殷啟新,楊鑒;基于高斯混合模型和假設(shè)檢驗方法的說話人確認(rèn)[J];計算機(jī)應(yīng)用;2004年S1期

5 李軼,范影樂;基于倒譜與復(fù)雜性的說話人確認(rèn)系統(tǒng)[J];杭州電子工業(yè)學(xué)院學(xué)報;2004年06期

6 郭武;戴禮榮;王仁華;;基于均值超矢量聚類和特征映射的說話人確認(rèn)[J];數(shù)據(jù)采集與處理;2009年01期

7 張怡穎,朱小燕,張鈸;一種新的說話人確認(rèn)方法[J];軟件學(xué)報;1999年04期

8 馬靜;侯麗敏;王朔中;;基于全局背景模型和競爭者模型的說話人確認(rèn)系統(tǒng)[J];聲學(xué)技術(shù);2007年01期

9 陳皓,付中華,趙榮椿;說話人確認(rèn)中針對語音編碼差異的似然比得分補(bǔ)償方法[J];西北工業(yè)大學(xué)學(xué)報;2005年04期

10 石如亮;王波;李弼程;高新建;;低速率信道環(huán)境下魯棒的說話人確認(rèn)[J];計算機(jī)應(yīng)用;2007年04期

相關(guān)會議論文前10條

1 張濤;王嵐;遲惠生;;基于VQ的說話人確認(rèn)系統(tǒng)的硬件實現(xiàn)[A];第六屆全國人機(jī)語音通訊學(xué)術(shù)會議論文集[C];2001年

2 趙亞麗;付中華;謝磊;張健;張艷寧;;雙麥克風(fēng)語音增強(qiáng)和雜混模型訓(xùn)練相結(jié)合的頑健說話人確認(rèn)[A];第十一屆全國人機(jī)語音通訊學(xué)術(shù)會議論文集（一）[C];2011年

3 陳勝;徐明星;;基于Feature Warping和ICA的發(fā)音方式魯棒的說話人確認(rèn)[A];第十一屆全國人機(jī)語音通訊學(xué)術(shù)會議論文集（一）[C];2011年

4 楊藝敏;景新幸;楊海燕;;PSO-SVM在說話人確認(rèn)系統(tǒng)中的研究[A];泛在信息社會中的聲學(xué)——中國聲學(xué)學(xué)會2010年全國會員代表大會暨學(xué)術(shù)會議論文集[C];2010年

5 展領(lǐng);景新幸;;矢量量化和VQ-UBM在說話人確認(rèn)中的應(yīng)用[A];中國聲學(xué)學(xué)會2009年青年學(xué)術(shù)會議[CYCA’09]論文集[C];2009年

6 陳龍;吳志勇;袁春;蒙美玲;蔡蓮紅;;面向數(shù)字版權(quán)管理的聲紋輔助認(rèn)證系統(tǒng)[A];第十一屆全國人機(jī)語音通訊學(xué)術(shù)會議論文集（一）[C];2011年

7 吳璽宏;遲惠生;;一種高性能的限定文本說話人確認(rèn)系統(tǒng)[A];第三屆全國人機(jī)語音通訊學(xué)術(shù)會議論文集[C];1994年

8 鮑福良;方志剛;徐潔;;基于MFCC和GMM的說話人確認(rèn)研究[A];第六屆全國信息獲取與處理學(xué)術(shù)會議論文集（2）[C];2008年

9 彭詩雅;;聲紋識別技術(shù)研究[A];第十六屆全國青年通信學(xué)術(shù)會議論文集（上）[C];2011年

10 洪青陽;陳毅東;;一種用于說話人確認(rèn)的區(qū)別性訓(xùn)練方法[A];第八屆全國人機(jī)語音通訊學(xué)術(shù)會議論文集[C];2005年

相關(guān)重要報紙文章前4條

1 北京大學(xué)信息科學(xué)中心視覺與聽覺信息處理國家重點實驗室吳璽宏;聲紋識別聽聲辨人[N];計算機(jī)世界;2001年

2 實習(xí)生沈春梅;鑒定薩達(dá)姆錄音真假[N];科技日報;2003年

3 吳璽宏;聲紋識別應(yīng)用前景[N];計算機(jī)世界;2001年

4 ;解密聲紋鎖一聲令下，“芝麻開門”[N];廣東科技報;2011年

相關(guān)博士學(xué)位論文前10條

1 劉明輝;基于GMM和SVM的文本無關(guān)的說話人確認(rèn)方法研究[D];中國科學(xué)技術(shù)大學(xué);2007年

2 陸偉;基于缺失特征的文本無關(guān)說話人識別魯棒性研究[D];中國科學(xué)技術(shù)大學(xué);2008年

3 許東星;基于GMM和高層信息特征的文本無關(guān)說話人識別研究[D];中國科學(xué)技術(shù)大學(xué);2009年

4 解焱陸;基于特征變換和分類的文本無關(guān)電話語音說話人識別研究[D];中國科學(xué)技術(shù)大學(xué);2007年

5 姚志強(qiáng);說話人識別中提高GMM性能方法的研究[D];中國科學(xué)技術(shù)大學(xué);2006年

6 李冬冬;基于拓展和聚類的情感魯棒說話人識別研究[D];浙江大學(xué);2008年

7 龍艷花;基于SVM的話者確認(rèn)關(guān)鍵技術(shù)研究[D];中國科學(xué)技術(shù)大學(xué);2011年

8 蔣曄;基于短語音和信道變化的說話人識別研究[D];南京理工大學(xué);2013年

9 郭武;復(fù)雜信道下的說話人識別[D];中國科學(xué)技術(shù)大學(xué);2007年

10 高二中;對話電話語音的話者確認(rèn)研究[D];中國科學(xué)技術(shù)大學(xué);2011年

相關(guān)碩士學(xué)位論文前10條

1 花城;說話人確認(rèn)的特征域補(bǔ)償方法研究[D];中國科學(xué)技術(shù)大學(xué);2014年

2 尹聰;基于感知對數(shù)面積比系數(shù)的說話人確認(rèn)系統(tǒng)的研究[D];太原理工大學(xué);2013年

3 周毓;基于因子分析的說話人確認(rèn)[D];中國科學(xué)技術(shù)大學(xué);2010年

4 駱啟帆;基于聲門信息的說話人確認(rèn)方法研究[D];杭州電子科技大學(xué);2014年

5 李成;基于SoPC技術(shù)的便攜式說話人確認(rèn)系統(tǒng)研究與實現(xiàn)[D];北京交通大學(xué);2010年

6 余巍;基于排序GMM的說話人確認(rèn)的研究[D];中國科學(xué)技術(shù)大學(xué);2011年

7 李軼;說話人識別系統(tǒng)研究[D];浙江大學(xué);2003年

8 哈斯塔木嘎;嵌入式Linux環(huán)境下與文本有關(guān)的說話人確認(rèn)系統(tǒng)實現(xiàn)[D];內(nèi)蒙古大學(xué);2009年

9 周昆湘;基于矢量量化的與文本無關(guān)的說話人確認(rèn)系統(tǒng)的研究[D];中南大學(xué);2007年

10 趙靖;基于高斯混合模型的說話人確認(rèn)魯棒性研究和系統(tǒng)實現(xiàn)[D];重慶大學(xué);2008年

，

本文編號：2570105

資料下載

論文發(fā)表

支付寶下載

Download by Alipay
微信下載

Download by Wechat
會員下載

Download by Member

本文鏈接：http://sikaile.net/kejilunwen/wltx/2570105.html

上一篇：基于人體環(huán)境的無線體域網(wǎng)路由算法研究
下一篇：一種降低OFDM系統(tǒng)峰均比的循環(huán)反饋SLM方法

論文發(fā)表

·知網(wǎng)|萬方|維普|龍源|省級|國家級|科技核心|北大核心|南大核心CSSCI|EI|SCI|SSCI|

天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

采用M-矢量和支持向量機(jī)的說話人確認(rèn)系統(tǒng)