采用M-矢量和支持向量機的說話人確認系統(tǒng)
【圖文】:
后通過MLLR超矢量形成方法從UBM模型自適應得到該說話人的變換矩陣W,把W的所有行按順序排列起來得到MLLR超矢量.對超矢量進行重疊加窗分割(含重疊元素的均勻分割)就得到一系列的新矢量Mi,這些新矢量就稱為M-矢量[3],該過程如圖1所示,圖中黑色方塊表示MLLR超矢量的每一維.其中重疊分割的目的是為了能充分挖掘不同特征維度空間中潛在的能反映說話人身份特性的信息,可類比特征提取過程中對原始語音信號進行重疊加窗分幀的做法.圖1M-矢量的結構2.2多類MLLRM-矢量估計與M-矢量的產生不同,本文中多類MLLRM-矢量是在UBM子空間基礎上進行MLLR自適應而獲得.在此借鑒了傳統(tǒng)音素類MLLR自適應技術的優(yōu)點,采用多個子空間來描述語音信號中含有的豐富細節(jié)信息.如從不同的UBM子空間中估計出的M-矢量可從不同語義層面、信道類型、說話人習慣用語等方面對說話人的原始語音進行細節(jié)描述.其估計流程如下.·64·華中科技大學學報(自然科學版)第42卷
象減輕,無須估計大量的HMM參數.2.3說話人確認系統(tǒng)構建SVM作為一種直接以最小化分類錯誤為目標函數的分類器,在說話人確認這種兩類分類問題中優(yōu)勢明顯,但因說話人識別中目標說話人的訓練語料非常少的特殊性而使得SVM的潛能尚未充分得到發(fā)揮,如在文獻[9]中,每位目標說話人的正例樣本點就只有一個GMM均值超向量.本研究提出一種全新的基于支持向量機的說話人確認系統(tǒng),它將多類MLLRM-矢量作為SVM的輸入特征進行模型的訓練和測試,其模型訓練流程如圖2所示,具體步驟如下:步驟1將UBM通過EM算法聚類成S個子空間;步驟2冒認者和目標說話人的每一句原始語音分別通過MLLR算法在各子空間中進行自適應,構建每句話在每個子空間中對應的M-矢量,得到對應于各子空間的M-矢量集合;圖2基于多類MLLRM-矢量的支持向量機說話人確認系統(tǒng)訓練流程步驟3將M-矢量作為SVM的輸入特征并在其核空間中進行信道補償及相應的說話人模型訓練,用以消除跨信道的問題,從而得到最終每位目標說話人的SVM模型.在測試階段,對于每一段原始語音,同樣經過上述三個步驟在SVM核空間中進行信道補償與測試,得到用于最終判決的SVM得分.這里提出的說話人確認系統(tǒng)由于采用了基于UBM子空間的多類M-矢量,即每位目標說話人的訓練正例樣本數為子空間數S乘以每個子空間對應的M-矢量數目N,從而使得目標說話人的正例樣本數大大增加,能很好地解決訓練數據的稀疏問題,在更大程度上挖掘出SVM強大的分類能力.須要提出的是:SVM
【相似文獻】
相關期刊論文 前10條
1 何昕,劉重慶,李介谷;基于支撐向量機的說話人確認系統(tǒng)[J];計算機工程與應用;2000年12期
2 鄧浩江,王守覺,杜利民;優(yōu)先度排序RBF神經網絡在與文本無關說話人確認中的應用[J];電子與信息學報;2003年09期
3 忻棟,楊瑩春,吳朝暉;基于SVM-HMM混合模型的說話人確認[J];計算機輔助設計與圖形學學報;2002年11期
4 殷啟新,楊鑒;基于高斯混合模型和假設檢驗方法的說話人確認[J];計算機應用;2004年S1期
5 李軼,范影樂;基于倒譜與復雜性的說話人確認系統(tǒng)[J];杭州電子工業(yè)學院學報;2004年06期
6 郭武;戴禮榮;王仁華;;基于均值超矢量聚類和特征映射的說話人確認[J];數據采集與處理;2009年01期
7 張怡穎,朱小燕,張鈸;一種新的說話人確認方法[J];軟件學報;1999年04期
8 馬靜;侯麗敏;王朔中;;基于全局背景模型和競爭者模型的說話人確認系統(tǒng)[J];聲學技術;2007年01期
9 陳皓,付中華,趙榮椿;說話人確認中針對語音編碼差異的似然比得分補償方法[J];西北工業(yè)大學學報;2005年04期
10 石如亮;王波;李弼程;高新建;;低速率信道環(huán)境下魯棒的說話人確認[J];計算機應用;2007年04期
相關會議論文 前10條
1 張濤;王嵐;遲惠生;;基于VQ的說話人確認系統(tǒng)的硬件實現[A];第六屆全國人機語音通訊學術會議論文集[C];2001年
2 趙亞麗;付中華;謝磊;張健;張艷寧;;雙麥克風語音增強和雜混模型訓練相結合的頑健說話人確認[A];第十一屆全國人機語音通訊學術會議論文集(一)[C];2011年
3 陳勝;徐明星;;基于Feature Warping和ICA的發(fā)音方式魯棒的說話人確認[A];第十一屆全國人機語音通訊學術會議論文集(一)[C];2011年
4 楊藝敏;景新幸;楊海燕;;PSO-SVM在說話人確認系統(tǒng)中的研究[A];泛在信息社會中的聲學——中國聲學學會2010年全國會員代表大會暨學術會議論文集[C];2010年
5 展領;景新幸;;矢量量化和VQ-UBM在說話人確認中的應用[A];中國聲學學會2009年青年學術會議[CYCA’09]論文集[C];2009年
6 陳龍;吳志勇;袁春;蒙美玲;蔡蓮紅;;面向數字版權管理的聲紋輔助認證系統(tǒng)[A];第十一屆全國人機語音通訊學術會議論文集(一)[C];2011年
7 吳璽宏;遲惠生;;一種高性能的限定文本說話人確認系統(tǒng)[A];第三屆全國人機語音通訊學術會議論文集[C];1994年
8 鮑福良;方志剛;徐潔;;基于MFCC和GMM的說話人確認研究[A];第六屆全國信息獲取與處理學術會議論文集(2)[C];2008年
9 彭詩雅;;聲紋識別技術研究[A];第十六屆全國青年通信學術會議論文集(上)[C];2011年
10 洪青陽;陳毅東;;一種用于說話人確認的區(qū)別性訓練方法[A];第八屆全國人機語音通訊學術會議論文集[C];2005年
相關重要報紙文章 前4條
1 北京大學信息科學中心視覺與聽覺信息處理國家重點實驗室 吳璽宏;聲紋識別聽聲辨人[N];計算機世界;2001年
2 實習生 沈春梅;鑒定薩達姆錄音真假[N];科技日報;2003年
3 吳璽宏;聲紋識別應用前景[N];計算機世界;2001年
4 ;解密聲紋鎖 一聲令下,“芝麻開門”[N];廣東科技報;2011年
相關博士學位論文 前10條
1 劉明輝;基于GMM和SVM的文本無關的說話人確認方法研究[D];中國科學技術大學;2007年
2 陸偉;基于缺失特征的文本無關說話人識別魯棒性研究[D];中國科學技術大學;2008年
3 許東星;基于GMM和高層信息特征的文本無關說話人識別研究[D];中國科學技術大學;2009年
4 解焱陸;基于特征變換和分類的文本無關電話語音說話人識別研究[D];中國科學技術大學;2007年
5 姚志強;說話人識別中提高GMM性能方法的研究[D];中國科學技術大學;2006年
6 李冬冬;基于拓展和聚類的情感魯棒說話人識別研究[D];浙江大學;2008年
7 龍艷花;基于SVM的話者確認關鍵技術研究[D];中國科學技術大學;2011年
8 蔣曄;基于短語音和信道變化的說話人識別研究[D];南京理工大學;2013年
9 郭武;復雜信道下的說話人識別[D];中國科學技術大學;2007年
10 高二中;對話電話語音的話者確認研究[D];中國科學技術大學;2011年
相關碩士學位論文 前10條
1 花城;說話人確認的特征域補償方法研究[D];中國科學技術大學;2014年
2 尹聰;基于感知對數面積比系數的說話人確認系統(tǒng)的研究[D];太原理工大學;2013年
3 周毓;基于因子分析的說話人確認[D];中國科學技術大學;2010年
4 駱啟帆;基于聲門信息的說話人確認方法研究[D];杭州電子科技大學;2014年
5 李成;基于SoPC技術的便攜式說話人確認系統(tǒng)研究與實現[D];北京交通大學;2010年
6 余巍;基于排序GMM的說話人確認的研究[D];中國科學技術大學;2011年
7 李軼;說話人識別系統(tǒng)研究[D];浙江大學;2003年
8 哈斯塔木嘎;嵌入式Linux環(huán)境下與文本有關的說話人確認系統(tǒng)實現[D];內蒙古大學;2009年
9 周昆湘;基于矢量量化的與文本無關的說話人確認系統(tǒng)的研究[D];中南大學;2007年
10 趙靖;基于高斯混合模型的說話人確認魯棒性研究和系統(tǒng)實現[D];重慶大學;2008年
,本文編號:2570105
本文鏈接:http://sikaile.net/kejilunwen/wltx/2570105.html