語譜特征的身份認證向量識別方法

發(fā)布時間：2018-04-16 00:16

本文選題：語譜圖 + 身份認證向量��；參考：《重慶大學學報》2017年05期

【摘要】：針對采用梅爾頻率倒譜系數(shù)(mel-frequency cepstrum coefficient,MFCC)作為身份認證向量(identity vector,i-vector)進行說話人識別存在語音信息不全的問題,提出一種基于語譜特征的身份認證向量識別說話人的方法。語音信號經(jīng)過預加重、分幀加窗預處理之后,通過短時傅立葉變換轉(zhuǎn)換成語譜圖,語譜圖被提交到高斯通用背景模型,在高維均值超向量空間中選擇合適的低維線性子空間流型結(jié)構(gòu)以構(gòu)造符合正態(tài)分布的向量作為身份認證向量。這些獲取的身份認證向量經(jīng)過線性判別性分析實現(xiàn)降維并存儲。最后采用對數(shù)似然比(log-likelihood ratio,LLR)方法對訓練和測試階段的i-vector進行評分,完成說話人識別。以TIMIT數(shù)據(jù)庫為標準的數(shù)值實驗結(jié)果表明,相比采用MFCC作為特征的識別方法,研究的等錯誤率(equal error rate,EER)更低。
[Abstract]:In order to solve the problem of speaker recognition using Mel frequency cepstrum coefficients (Mel frequency cepstrum coefficients) as identity vector (identity vectori-vectorr), a speech recognition method based on spectral features is proposed.The speech signal was pre-accentuated, pre-processed by framing and windowed, and converted into a spectral map by short-time Fourier transform, which was submitted to Gao Si's general background model.The appropriate low-dimensional linear subspace flow pattern structure is selected in the high-dimensional mean hypervector space to construct the normal distribution vector as the identity authentication vector.The obtained authentication vectors are reduced and stored by linear discriminant analysis.Finally, the log-like likelihood ratio (LLR) method was used to score the i-vector in the training and testing stages, and the speaker recognition was completed.The numerical results based on TIMIT database show that the equal error rate is lower than that using MFCC as the feature recognition method.
【作者單位】：重慶郵電大學汽車電子實驗室;
【基金】：重慶市教育成果轉(zhuǎn)化基金資助項目(KJZH14207)~~
【分類號】：TN912.3

【相似文獻】

相關(guān)期刊論文前10條

1 石艷;王曉曄;;新穎檢測法在說話人識別技術(shù)中的應用[J];現(xiàn)代計算機(專業(yè)版);2008年07期

2 劉雪燕;張娜;袁寶玲;;說話人識別綜述[J];電腦知識與技術(shù);2009年01期

3 邱政權(quán);范小春;王俊年;;基于動態(tài)環(huán)境下的說話人識別[J];科學技術(shù)與工程;2010年02期

4 單進;;說話人識別技術(shù)研究[J];科技資訊;2010年21期

5 申志生;于明;;說話人識別算法的定點DSP實現(xiàn)[J];單片機與嵌入式系統(tǒng)應用;2011年03期

6 謝建勛;;淺談說話人識別技術(shù)[J];電腦知識與技術(shù);2011年11期

7 安茂波;劉建;;一個快速說話人識別系統(tǒng)的設(shè)計和實現(xiàn)[J];網(wǎng)絡新媒體技術(shù);2012年03期

8 楊迪;戚銀城;劉明軍;張華芳子;武軍娜;;說話人識別綜述[J];電子科技;2012年06期

9 武光利;;說話人識別方法概述[J];硅谷;2012年19期

10 曹業(yè)敏,侯風雷,王炳錫;說話人識別技術(shù)現(xiàn)狀與進展[J];河南科技;1998年09期

相關(guān)會議論文前10條

1 鮑福良;方志剛;徐潔;;說話人識別綜述[A];第六屆全國信息獲取與處理學術(shù)會議論文集（2）[C];2008年

2 孫帆;遲惠生;;循環(huán)網(wǎng)絡說話人識別[A];第二屆全國人機語音通訊學術(shù)會議論文集[C];1992年

3 肖劍;歐貴文;;多層前饋神經(jīng)網(wǎng)絡組的文本無關(guān)說話人識別[A];第七屆全國人機語音通訊學術(shù)會議（NCMMSC7）論文集[C];2003年

4 張玲華;鄭寶玉;楊震;;模糊超橢球聚類算法及其在說話人識別中的應用研究[A];第八屆全國人機語音通訊學術(shù)會議論文集[C];2005年

5 王宏;潘金貴;;基于矩陣正態(tài)分布的文本有關(guān)說話人識別[A];2007通信理論與技術(shù)新發(fā)展——第十二屆全國青年通信學術(shù)會議論文集（上冊）[C];2007年

6 戴紅霞;趙力;;文本無關(guān)說話人識別系統(tǒng)的研究[A];2007’促進西部發(fā)展聲學學術(shù)交流會論文集[C];2007年

7 陳聯(lián)武;郭武;戴禮榮;;說話人識別系統(tǒng)中多樣訓練的應用[A];第十一屆全國人機語音通訊學術(shù)會議論文集（一）[C];2011年

8 崔玉紅;胡光銳;;基于神經(jīng)網(wǎng)絡特征維數(shù)壓縮方法及其在說話人識別中的應用[A];第十屆全國信號處理學術(shù)年會（CCSP-2001）論文集[C];2001年

9 吳麗麗;;基于仿生模式識別的說話人識別學習模型研究[A];第二屆中國科學院博士后學術(shù)年會暨高新技術(shù)前沿與發(fā)展學術(shù)會議程序冊[C];2010年

10 張晶;董金明;馮文全;;說話人識別系統(tǒng)研究與實現(xiàn)[A];全國第二屆信號處理與應用學術(shù)會議專刊[C];2008年

相關(guān)博士學位論文前10條

1 單振宇;情感說話人識別及其解決方法的研究[D];浙江大學;2010年

2 別凡虎;說話人識別中區(qū)分性問題的研究[D];清華大學;2015年

3 謝怡寧;基于稀疏編碼的魯棒說話人識別方法研究[D];哈爾濱理工大學;2016年

4 安冬;噪聲背景下說話人識別的若干關(guān)鍵問題研究[D];東北大學;2013年

5 吳迪;低信噪比環(huán)境下說話人識別研究[D];蘇州大學;2016年

6 酆勇;基于深度學習的說話人識別建模研究[D];重慶大學;2016年

7 陳英;基于含噪短語音的魯棒說話人識別研究[D];南京理工大學;2015年

8 陸偉;基于缺失特征的文本無關(guān)說話人識別魯棒性研究[D];中國科學技術(shù)大學;2008年

9 劉鏑;說話人識別中信息融合算法的研究[D];北京交通大學;2011年

10 付中華;說話人識別系統(tǒng)魯棒性研究[D];西北工業(yè)大學;2004年

相關(guān)碩士學位論文前10條

1 叢菡菡;基于支持相量機的穩(wěn)鍵說話人識別[D];電子科技大學;2008年

2 任舒彬;面向手持應用的說話人識別算法研究[D];浙江大學;2006年

3 申志生;文本相關(guān)說話人識別嵌入式系統(tǒng)及其關(guān)鍵技術(shù)研究[D];河北工業(yè)大學;2011年

4 汪q，

本文編號：1756451

資料下載

論文發(fā)表

支付寶下載

Download by Alipay
微信下載

Download by Wechat
會員下載

Download by Member

本文鏈接：http://sikaile.net/kejilunwen/xinxigongchenglunwen/1756451.html

上一篇：基于雙面體全息光柵的高亮度全息波導顯示器
下一篇：衰減因子和橫向尺度對Airy光束三大特性的影響

論文發(fā)表

·知網(wǎng)|萬方|維普|龍源|省級|國家級|科技核心|北大核心|南大核心CSSCI|EI|SCI|SSCI|

天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

語譜特征的身份認證向量識別方法