天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁 > 科技論文 > 信息工程論文 >

噪聲環(huán)境下基于稀疏表示的說話人識別系統(tǒng)的研究

發(fā)布時(shí)間:2018-09-01 11:23
【摘要】:說話人識別作為一種聲紋識別技術(shù),在模式識別應(yīng)用發(fā)展迅猛的今天有著無可限量的前景,它與其他利用個(gè)人生物特征的識別方式相比,有著操作便捷、設(shè)備低廉的優(yōu)勢,因此近幾年來,對說話人識別的研究引起了人們的廣泛關(guān)注。目前,說話人識別常用的模型是高斯背景混合模型,該模型是根據(jù)通用背景模型訓(xùn)練得到,相比較于其它模型魯棒性較好,但是其計(jì)算量大,識別效果也不盡如人意,隨后很多人在此模型的基礎(chǔ)上進(jìn)行了改進(jìn)。近年來,稀疏表示算法在信號處理領(lǐng)域有著驚人的表現(xiàn),而且已經(jīng)在圖像的識別、處理、分離等方面取得了很好的處理效果。除此之外,還可以將稀疏表示作為一種分類算法引入匹配識別模塊,對說話人識別系統(tǒng)進(jìn)行改進(jìn),并希望通過稀疏表示的特性來解決說話人識別系統(tǒng)中一遇到噪聲干擾,識別效率就會(huì)急劇下降的問題。論文的主要工作包括:首先,將稀疏表示的算法引入說話人識別模型中,利用稀疏表示的分類特性對模型的匹配識別方法進(jìn)行了改進(jìn),通過計(jì)算最小的標(biāo)準(zhǔn)重構(gòu)誤差來找到對應(yīng)的說話人。其次,為了滿足稀疏表示算法的要求我們對字典的組成進(jìn)行設(shè)計(jì),使用目前最主流的GMM均值超向量作為字典原子。針對超向量維度較大的問題,提出了利用Fisher判別比來對字典每一維的分類性能進(jìn)行比較,并制定規(guī)則來控制字典降低的維度,同時(shí)通過在字典中添加單位矩陣I提高系統(tǒng)的抗噪性能,通過仿真證明了將稀疏表示融入說話模型中可以得到更好的識別效率,以及本文提出的I-Fisher算法既能減小字典的維度,也能提高系統(tǒng)的識別與抗噪性能。這種識別模型非常適用于測試語音與訓(xùn)練語音是在相同環(huán)境中錄制的,即兩種語音的噪聲環(huán)境相同,在這種條件下識別效果很好,但是如果想滿足各種噪聲環(huán)境下的要求就需要訓(xùn)練多個(gè)字典,計(jì)算量較大。接下來,針對不同的噪聲環(huán)境下識別率下降的問題,提出了基于稀疏表示的一種新的字典構(gòu)建辦法來解決噪聲的影響。根據(jù)MCA形態(tài)成分分析法的原理,使用純凈語音來訓(xùn)練說話人字典,通過添加噪聲字典的方法可以將求得的稀疏表示系數(shù)分離成純凈語音系數(shù)部分與噪聲系數(shù)部分,對純凈語音的系數(shù)部分計(jì)算重構(gòu)誤差從而排除噪聲的影響來進(jìn)行識別。為了得到能夠滿足設(shè)計(jì)要求的字典,我們使用K-SVD字典學(xué)習(xí)方法分別訓(xùn)練兩種字典并進(jìn)行拼接,將噪聲字典作為說話人字典的一部分融入大字典中一起進(jìn)行稀疏表示分解求取系數(shù)。提出通過對含有噪聲的測試語音進(jìn)行相同的分解辦法,提取重構(gòu)出測試語音所含的噪聲來更新噪聲字典。還通過仿真證明了本文算法能夠在測試語音與訓(xùn)練語音在環(huán)境噪聲不同的情況下有效地減少噪聲對識別率的影響。本文主要提出了噪聲環(huán)境下基于稀疏表示的兩種識別模型,對第一種字典的原子構(gòu)建方式進(jìn)行了改進(jìn)優(yōu)化并通過實(shí)驗(yàn)測試出其適用的識別環(huán)境,提出了基于噪聲字典的第二種字典設(shè)計(jì)方案并對噪聲字典進(jìn)行了更新,兩種方法都取得了良好的識別效果
[Abstract]:Speaker recognition, as a kind of voiceprint recognition technology, has an unlimited prospect in the rapid development of pattern recognition application today. Compared with other recognition methods using personal biological characteristics, it has the advantages of convenient operation and low equipment. Therefore, in recent years, the research on speaker recognition has attracted wide attention. The common model of speaker recognition is Gaussian background mixed model, which is trained according to the general background model. Compared with other models, this model has better robustness, but its computational complexity is large and recognition effect is not satisfactory. Many people have improved on this model. In recent years, sparse representation algorithm is used in signal processing. In addition, sparse representation can be introduced as a classification algorithm into the matching recognition module to improve the speaker recognition system and hope to solve the speaker recognition system through the characteristics of sparse representation. The main work of this paper includes: Firstly, the sparse representation algorithm is introduced into the speaker recognition model, and the matching recognition method of the model is improved by using the classification characteristics of sparse representation. Secondly, in order to satisfy the requirement of sparse representation algorithm, we design the composition of dictionary and use GMM mean hypervector as dictionary atom. Aiming at the problem of large dimension of hypervector, we propose to use Fisher discriminant ratio to compare the classification performance of each dimension of dictionary, and make rules to control dictionary. At the same time, the unit matrix I is added to the dictionary to improve the anti-noise performance of the system. The simulation results show that the sparse representation can be incorporated into the speech model to achieve better recognition efficiency. The I-Fisher algorithm proposed in this paper can not only reduce the dimension of the dictionary, but also improve the recognition and anti-noise performance of the system. T-type is very suitable for testing and training speech in the same environment, that is, the two voices are recorded in the same noise environment, in this condition the recognition effect is very good, but if you want to meet the requirements of various noise environments, you need to train more than one dictionary, the calculation is large. Next, for different noise environments, the recognition rate. According to the principle of MCA morphological component analysis, the speaker dictionary is trained with pure speech, and the sparse representation coefficients can be separated into pure speech coefficients and noise coefficients by adding noise dictionary. In order to get a dictionary that meets the design requirements, we use K-SVD dictionary learning method to train and stitch the two dictionaries separately, and integrate the noise dictionary as part of the speaker dictionary into the large dictionary. Sparse representation decomposition is used to extract and reconstruct the noise contained in the test speech to update the noise dictionary. Simulation results show that the proposed algorithm can effectively reduce the noise pairing between the test speech and the training speech under different ambient noises. In this paper, two recognition models based on sparse representation in noisy environments are proposed, the first dictionary is improved and optimized, and the suitable recognition environment is tested by experiments. The second dictionary design scheme based on noise dictionary is proposed, and the noise dictionary is updated. The method has achieved good recognition effect.
【學(xué)位授予單位】:蘭州交通大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2017
【分類號】:TN912.3

【參考文獻(xiàn)】

相關(guān)期刊論文 前10條

1 李懿;劉曉東;;一種新的模糊稀疏表示人臉識別算法[J];大連理工大學(xué)學(xué)報(bào);2017年02期

2 袁安鼎;荊曉遠(yuǎn);吳飛;;基于局部信息融合的正交稀疏保留投影分析[J];計(jì)算機(jī)技術(shù)與發(fā)展;2017年01期

3 錢陽;李雷;;基于新型魯棒字典學(xué)習(xí)的視頻幀稀疏表示[J];計(jì)算機(jī)技術(shù)與發(fā)展;2017年02期

4 周偉力;賀前華;王亞樓;龐文豐;;基于自適應(yīng)逼近殘差的稀疏表示語音降噪方法[J];電子與信息學(xué)報(bào);2017年02期

5 游大濤;李捷;;基于稀疏譜的魯棒說話人識別[J];河南大學(xué)學(xué)報(bào)(自然科學(xué)版);2016年05期

6 鄧翔宇;劉增力;;基于改進(jìn)的MCA和K-SVD的圖像稀疏表示去噪算法[J];四川大學(xué)學(xué)報(bào)(自然科學(xué)版);2016年04期

7 王偉;韓紀(jì)慶;鄭鐵然;鄭貴濱;陶耀;;基于Fisher判別字典學(xué)習(xí)的說話人識別[J];電子與信息學(xué)報(bào);2016年02期

8 于云;周偉棟;;基于稀疏表示的魯棒性說話人識別系統(tǒng)[J];計(jì)算機(jī)技術(shù)與發(fā)展;2015年12期

9 楊龍;陳建明;;語音增強(qiáng)算法及進(jìn)展[J];電聲技術(shù);2015年07期

10 崔曉;;自訓(xùn)練過完備字典和稀疏表示的語音增強(qiáng)[J];現(xiàn)代電子技術(shù);2015年13期

相關(guān)博士學(xué)位論文 前4條

1 謝怡寧;基于稀疏編碼的魯棒說話人識別方法研究[D];哈爾濱理工大學(xué);2016年

2 鮑光照;基于稀疏表示和字典學(xué)習(xí)的語音增強(qiáng)算法研究[D];中國科學(xué)技術(shù)大學(xué);2015年

3 游大濤;基于聽覺機(jī)理的魯棒特征提取及在說話人識別中的應(yīng)用[D];哈爾濱工業(yè)大學(xué);2013年

4 宋相法;基于稀疏表示和集成學(xué)習(xí)的若干分類問題研究[D];西安電子科技大學(xué);2013年

相關(guān)碩士學(xué)位論文 前8條

1 吳婷婷;基于信號稀疏分解的復(fù)雜環(huán)境下說話人識別研究[D];南京理工大學(xué);2015年

2 宋樂;說話人識別中改進(jìn)特征提取算法的研究[D];太原理工大學(xué);2014年

3 曾祺;文本無關(guān)的多說話人確認(rèn)研究[D];電子科技大學(xué);2014年

4 曹殿元;壓縮感知理論及其算法[D];南京郵電大學(xué);2013年

5 李勝濤;基于稀疏表示的人臉識別算法研究[D];湖南大學(xué);2013年

6 汪桃林;基于稀疏表示的短語音說話人識別[D];電子科技大學(xué);2013年

7 沈益青;基于改進(jìn)的匹配追蹤算法的信號稀疏分解[D];浙江大學(xué);2013年

8 曹孝玉;說話人識別中的特征參數(shù)提取研究[D];湖南大學(xué);2012年

,

本文編號:2217045

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/xinxigongchenglunwen/2217045.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶576bb***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請E-mail郵箱bigeng88@qq.com