天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

基于融合特征與高斯混合模型的說話人識別研究

發(fā)布時間:2018-02-01 12:48

  本文關鍵詞: 說話人識別 特征提取 融合特征 高斯混合模型 出處:《東華理工大學》2017年碩士論文 論文類型:學位論文


【摘要】:隨著移動互聯網的快速發(fā)展,方便快捷的生物認證技術越來越受到重視。說話人識別又稱為聲紋識別,是生物認證技術的一種,其憑借更便捷、更安全、更經濟的優(yōu)勢迎來了發(fā)展的契機,廣泛應用于通信網絡、商業(yè)交易、司法鑒定以及軍事安全等領域。說話人識別的關鍵在特征提取與模型訓練上,其常用的語音特征有線性預測倒譜系數(LPCC)、梅爾頻率倒譜系數(MFCC)以及感知線性預測(PLP),其中MFCC與PLP的識別性能要優(yōu)于LPCC,但MFCC與PLP分別作為單一特征用于說話人識別仍不能滿足一些領域的高精確性要求,而高斯混合模型(GMM)由于其方法簡單、識別性能優(yōu)良運用最為廣泛,但簡單的初始參數選擇方法使其有不穩(wěn)定、精確性不足等缺陷,基于此本文提出一種新的融合特征PLP-MFCC以及改進的GMM來提升識別的性能,主要工作內容如下:首先,介紹說話人識別中常用的特征參數LPCC、MFCC、PLP以及它們的提取過程,在分析F比與D比兩種特征參數評價方法后,通過F比和D比選出MFCC與PLP中的部分特征進行融合,得到新的融合特征PLP-MFCC;其次,研究GMM的建模方法,GMM訓練模型的過程就是其參數估計的過程,而參數估計中初始參數的選擇會影響訓練模型的精確性,初始參數的選取通常采用隨機法或K均值算法,在分析它們存在的一些問題后,將一種改進的K均值算法運用到GMM參數估計中對GMM進行改進;最后,在Matlab平臺上構建了基于高斯混合模型的說話人識別系統(tǒng),實驗采用標準的TIMIT語音庫,將融合特征PLP-MFCC與MFCC、PLP進行對比實驗,PLP-MFCC的識別率相比于MFCC、PLP分別提升了4.9%、3.8%,再將改進前后的GMM進行對比實驗,改進后的GMM相比于改進前的GMM識別率提升了2.3%,實驗結果表明,本文提出的融合特征以及改進的GMM對于提升說話人識別系統(tǒng)的性能有一定的效果。
[Abstract]:With the rapid development of mobile Internet, more and more attention has been paid to the convenient and fast biometric authentication technology. Speaker recognition, also known as voiceprint recognition, is a kind of biometric authentication technology, which is more convenient and more secure. The more economical advantage ushered in the development opportunity, widely used in the communication network, the commercial transaction, the judicial appraisal and the military security and so on domain. The speaker recognition key lies in the characteristic extraction and the model training. The commonly used speech features include LPC Cepstrum, Mel Frequency Cepstrum (MFCC) and perceptual Linear Predictive (PLP). The recognition performance of MFCC and PLP is better than that of LPCC, but MFCC and PLP as a single feature for speaker recognition can not meet the requirements of high accuracy in some fields. Gao Si hybrid model (GMMM) is widely used because of its simple method, but the simple initial parameter selection method has some defects, such as instability, inaccuracy and so on. Based on this, a new fusion feature PLP-MFCC and an improved GMM are proposed to improve the performance of recognition. The main work is as follows: first. This paper introduces the commonly used feature parameters LPCC- MFCC-PLP and their extraction process in speaker recognition. The evaluation methods of F / D ratio and D / F ratio are analyzed. A new fusion feature PLP-MFCC is obtained by selecting some features of MFCC and PLP by F / D ratio. Secondly, the study of GMM modeling method and the process of training model is the process of parameter estimation, and the choice of initial parameters in parameter estimation will affect the accuracy of the training model. The selection of initial parameters is usually based on random method or K-means algorithm. After analyzing their problems, an improved K-means algorithm is applied to GMM parameter estimation to improve GMM. Finally, a speaker recognition system based on Gao Si hybrid model is constructed on Matlab platform. The standard TIMIT language database is used in the experiment, and the feature PLP-MFCC and MFCC are fused. Compared with PLP, the recognition rate of PLP-MFCC was increased by 4.9% and 3.8% respectively. Then the GMM before and after the improvement was compared. Compared with the improved GMM, the improved GMM can improve the recognition rate by 2.3%. The experimental results show that. The proposed fusion feature and improved GMM can improve the performance of speaker recognition system.
【學位授予單位】:東華理工大學
【學位級別】:碩士
【學位授予年份】:2017
【分類號】:TN912.34

【相似文獻】

相關期刊論文 前10條

1 邱政權,尹俊勛;針對說話人識別進行的加權小波去噪方法[J];電聲技術;2005年09期

2 石艷;王曉曄;;新穎檢測法在說話人識別技術中的應用[J];現代計算機(專業(yè)版);2008年07期

3 劉雪燕;張娜;袁寶玲;;說話人識別綜述[J];電腦知識與技術;2009年01期

4 邱政權;范小春;王俊年;;基于動態(tài)環(huán)境下的說話人識別[J];科學技術與工程;2010年02期

5 單進;;說話人識別技術研究[J];科技資訊;2010年21期

6 申志生;于明;;說話人識別算法的定點DSP實現[J];單片機與嵌入式系統(tǒng)應用;2011年03期

7 謝建勛;;淺談說話人識別技術[J];電腦知識與技術;2011年11期

8 安茂波;劉建;;一個快速說話人識別系統(tǒng)的設計和實現[J];網絡新媒體技術;2012年03期

9 楊迪;戚銀城;劉明軍;張華芳子;武軍娜;;說話人識別綜述[J];電子科技;2012年06期

10 武光利;;說話人識別方法概述[J];硅谷;2012年19期

相關會議論文 前10條

1 鮑福良;方志剛;徐潔;;說話人識別綜述[A];第六屆全國信息獲取與處理學術會議論文集(2)[C];2008年

2 孫帆;遲惠生;;循環(huán)網絡說話人識別[A];第二屆全國人機語音通訊學術會議論文集[C];1992年

3 肖劍;歐貴文;;多層前饋神經網絡組的文本無關說話人識別[A];第七屆全國人機語音通訊學術會議(NCMMSC7)論文集[C];2003年

4 張玲華;鄭寶玉;楊震;;模糊超橢球聚類算法及其在說話人識別中的應用研究[A];第八屆全國人機語音通訊學術會議論文集[C];2005年

5 王宏;潘金貴;;基于矩陣正態(tài)分布的文本有關說話人識別[A];2007通信理論與技術新發(fā)展——第十二屆全國青年通信學術會議論文集(上冊)[C];2007年

6 戴紅霞;趙力;;文本無關說話人識別系統(tǒng)的研究[A];2007’促進西部發(fā)展聲學學術交流會論文集[C];2007年

7 陳聯武;郭武;戴禮榮;;說話人識別系統(tǒng)中多樣訓練的應用[A];第十一屆全國人機語音通訊學術會議論文集(一)[C];2011年

8 崔玉紅;胡光銳;;基于神經網絡特征維數壓縮方法及其在說話人識別中的應用[A];第十屆全國信號處理學術年會(CCSP-2001)論文集[C];2001年

9 吳麗麗;;基于仿生模式識別的說話人識別學習模型研究[A];第二屆中國科學院博士后學術年會暨高新技術前沿與發(fā)展學術會議程序冊[C];2010年

10 張晶;董金明;馮文全;;說話人識別系統(tǒng)研究與實現[A];全國第二屆信號處理與應用學術會議?痆C];2008年

相關重要報紙文章 前2條

1 汪永安;科大訊飛說話人識別技術世界領先[N];安徽日報;2008年

2 吳長鋒;科大訊飛勇奪說話人識別國際大賽第一[N];科技日報;2008年

相關博士學位論文 前10條

1 單振宇;情感說話人識別及其解決方法的研究[D];浙江大學;2010年

2 別凡虎;說話人識別中區(qū)分性問題的研究[D];清華大學;2015年

3 謝怡寧;基于稀疏編碼的魯棒說話人識別方法研究[D];哈爾濱理工大學;2016年

4 安冬;噪聲背景下說話人識別的若干關鍵問題研究[D];東北大學;2013年

5 吳迪;低信噪比環(huán)境下說話人識別研究[D];蘇州大學;2016年

6 酆勇;基于深度學習的說話人識別建模研究[D];重慶大學;2016年

7 陳英;基于含噪短語音的魯棒說話人識別研究[D];南京理工大學;2015年

8 陸偉;基于缺失特征的文本無關說話人識別魯棒性研究[D];中國科學技術大學;2008年

9 劉鏑;說話人識別中信息融合算法的研究[D];北京交通大學;2011年

10 付中華;說話人識別系統(tǒng)魯棒性研究[D];西北工業(yè)大學;2004年

相關碩士學位論文 前10條

1 叢菡菡;基于支持相量機的穩(wěn)鍵說話人識別[D];電子科技大學;2008年

2 任舒彬;面向手持應用的說話人識別算法研究[D];浙江大學;2006年

3 申志生;文本相關說話人識別嵌入式系統(tǒng)及其關鍵技術研究[D];河北工業(yè)大學;2011年

4 汪q,

本文編號:1481897


資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/shoufeilunwen/xixikjs/1481897.html


Copyright(c)文論論文網All Rights Reserved | 網站地圖 |

版權申明:資料由用戶84faa***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com