天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁 > 科技論文 > 信息工程論文 >

語譜特征的身份認(rèn)證向量識別方法

發(fā)布時間:2018-04-16 00:16

  本文選題:語譜圖 + 身份認(rèn)證向量。 參考:《重慶大學(xué)學(xué)報》2017年05期


【摘要】:針對采用梅爾頻率倒譜系數(shù)(mel-frequency cepstrum coefficient,MFCC)作為身份認(rèn)證向量(identity vector,i-vector)進(jìn)行說話人識別存在語音信息不全的問題,提出一種基于語譜特征的身份認(rèn)證向量識別說話人的方法。語音信號經(jīng)過預(yù)加重、分幀加窗預(yù)處理之后,通過短時傅立葉變換轉(zhuǎn)換成語譜圖,語譜圖被提交到高斯通用背景模型,在高維均值超向量空間中選擇合適的低維線性子空間流型結(jié)構(gòu)以構(gòu)造符合正態(tài)分布的向量作為身份認(rèn)證向量。這些獲取的身份認(rèn)證向量經(jīng)過線性判別性分析實現(xiàn)降維并存儲。最后采用對數(shù)似然比(log-likelihood ratio,LLR)方法對訓(xùn)練和測試階段的i-vector進(jìn)行評分,完成說話人識別。以TIMIT數(shù)據(jù)庫為標(biāo)準(zhǔn)的數(shù)值實驗結(jié)果表明,相比采用MFCC作為特征的識別方法,研究的等錯誤率(equal error rate,EER)更低。
[Abstract]:In order to solve the problem of speaker recognition using Mel frequency cepstrum coefficients (Mel frequency cepstrum coefficients) as identity vector (identity vectori-vectorr), a speech recognition method based on spectral features is proposed.The speech signal was pre-accentuated, pre-processed by framing and windowed, and converted into a spectral map by short-time Fourier transform, which was submitted to Gao Si's general background model.The appropriate low-dimensional linear subspace flow pattern structure is selected in the high-dimensional mean hypervector space to construct the normal distribution vector as the identity authentication vector.The obtained authentication vectors are reduced and stored by linear discriminant analysis.Finally, the log-like likelihood ratio (LLR) method was used to score the i-vector in the training and testing stages, and the speaker recognition was completed.The numerical results based on TIMIT database show that the equal error rate is lower than that using MFCC as the feature recognition method.
【作者單位】: 重慶郵電大學(xué)汽車電子實驗室;
【基金】:重慶市教育成果轉(zhuǎn)化基金資助項目(KJZH14207)~~
【分類號】:TN912.3

【相似文獻(xiàn)】

相關(guān)期刊論文 前10條

1 石艷;王曉曄;;新穎檢測法在說話人識別技術(shù)中的應(yīng)用[J];現(xiàn)代計算機(jī)(專業(yè)版);2008年07期

2 劉雪燕;張娜;袁寶玲;;說話人識別綜述[J];電腦知識與技術(shù);2009年01期

3 邱政權(quán);范小春;王俊年;;基于動態(tài)環(huán)境下的說話人識別[J];科學(xué)技術(shù)與工程;2010年02期

4 單進(jìn);;說話人識別技術(shù)研究[J];科技資訊;2010年21期

5 申志生;于明;;說話人識別算法的定點DSP實現(xiàn)[J];單片機(jī)與嵌入式系統(tǒng)應(yīng)用;2011年03期

6 謝建勛;;淺談?wù)f話人識別技術(shù)[J];電腦知識與技術(shù);2011年11期

7 安茂波;劉建;;一個快速說話人識別系統(tǒng)的設(shè)計和實現(xiàn)[J];網(wǎng)絡(luò)新媒體技術(shù);2012年03期

8 楊迪;戚銀城;劉明軍;張華芳子;武軍娜;;說話人識別綜述[J];電子科技;2012年06期

9 武光利;;說話人識別方法概述[J];硅谷;2012年19期

10 曹業(yè)敏,侯風(fēng)雷,王炳錫;說話人識別技術(shù)現(xiàn)狀與進(jìn)展[J];河南科技;1998年09期

相關(guān)會議論文 前10條

1 鮑福良;方志剛;徐潔;;說話人識別綜述[A];第六屆全國信息獲取與處理學(xué)術(shù)會議論文集(2)[C];2008年

2 孫帆;遲惠生;;循環(huán)網(wǎng)絡(luò)說話人識別[A];第二屆全國人機(jī)語音通訊學(xué)術(shù)會議論文集[C];1992年

3 肖劍;歐貴文;;多層前饋神經(jīng)網(wǎng)絡(luò)組的文本無關(guān)說話人識別[A];第七屆全國人機(jī)語音通訊學(xué)術(shù)會議(NCMMSC7)論文集[C];2003年

4 張玲華;鄭寶玉;楊震;;模糊超橢球聚類算法及其在說話人識別中的應(yīng)用研究[A];第八屆全國人機(jī)語音通訊學(xué)術(shù)會議論文集[C];2005年

5 王宏;潘金貴;;基于矩陣正態(tài)分布的文本有關(guān)說話人識別[A];2007通信理論與技術(shù)新發(fā)展——第十二屆全國青年通信學(xué)術(shù)會議論文集(上冊)[C];2007年

6 戴紅霞;趙力;;文本無關(guān)說話人識別系統(tǒng)的研究[A];2007’促進(jìn)西部發(fā)展聲學(xué)學(xué)術(shù)交流會論文集[C];2007年

7 陳聯(lián)武;郭武;戴禮榮;;說話人識別系統(tǒng)中多樣訓(xùn)練的應(yīng)用[A];第十一屆全國人機(jī)語音通訊學(xué)術(shù)會議論文集(一)[C];2011年

8 崔玉紅;胡光銳;;基于神經(jīng)網(wǎng)絡(luò)特征維數(shù)壓縮方法及其在說話人識別中的應(yīng)用[A];第十屆全國信號處理學(xué)術(shù)年會(CCSP-2001)論文集[C];2001年

9 吳麗麗;;基于仿生模式識別的說話人識別學(xué)習(xí)模型研究[A];第二屆中國科學(xué)院博士后學(xué)術(shù)年會暨高新技術(shù)前沿與發(fā)展學(xué)術(shù)會議程序冊[C];2010年

10 張晶;董金明;馮文全;;說話人識別系統(tǒng)研究與實現(xiàn)[A];全國第二屆信號處理與應(yīng)用學(xué)術(shù)會議專刊[C];2008年

相關(guān)博士學(xué)位論文 前10條

1 單振宇;情感說話人識別及其解決方法的研究[D];浙江大學(xué);2010年

2 別凡虎;說話人識別中區(qū)分性問題的研究[D];清華大學(xué);2015年

3 謝怡寧;基于稀疏編碼的魯棒說話人識別方法研究[D];哈爾濱理工大學(xué);2016年

4 安冬;噪聲背景下說話人識別的若干關(guān)鍵問題研究[D];東北大學(xué);2013年

5 吳迪;低信噪比環(huán)境下說話人識別研究[D];蘇州大學(xué);2016年

6 酆勇;基于深度學(xué)習(xí)的說話人識別建模研究[D];重慶大學(xué);2016年

7 陳英;基于含噪短語音的魯棒說話人識別研究[D];南京理工大學(xué);2015年

8 陸偉;基于缺失特征的文本無關(guān)說話人識別魯棒性研究[D];中國科學(xué)技術(shù)大學(xué);2008年

9 劉鏑;說話人識別中信息融合算法的研究[D];北京交通大學(xué);2011年

10 付中華;說話人識別系統(tǒng)魯棒性研究[D];西北工業(yè)大學(xué);2004年

相關(guān)碩士學(xué)位論文 前10條

1 叢菡菡;基于支持相量機(jī)的穩(wěn)鍵說話人識別[D];電子科技大學(xué);2008年

2 任舒彬;面向手持應(yīng)用的說話人識別算法研究[D];浙江大學(xué);2006年

3 申志生;文本相關(guān)說話人識別嵌入式系統(tǒng)及其關(guān)鍵技術(shù)研究[D];河北工業(yè)大學(xué);2011年

4 汪q,

本文編號:1756451


資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/xinxigongchenglunwen/1756451.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶392c5***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com