天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁 > 科技論文 > 信息工程論文 >

基于含噪語音的說話人識別研究

發(fā)布時(shí)間:2020-03-30 22:02
【摘要】:隨著計(jì)算機(jī)技術(shù)及移動(dòng)互聯(lián)網(wǎng)技術(shù)的快速發(fā)展,說話人識別作為一種特殊生物識別技術(shù)主要用于特定場合的說話人身份鑒定。該技術(shù)在司法鑒定、身份確認(rèn)、軍事國防、遠(yuǎn)程控制、信息安全等領(lǐng)域得到廣泛應(yīng)用,是模式識別和人工智能領(lǐng)域中的研究熱點(diǎn)。在訓(xùn)練與測試環(huán)境均為干凈語音環(huán)境下,說話人識別系統(tǒng)識別率較高,然而,受制于環(huán)境噪音,在實(shí)際應(yīng)用中說話人識別系統(tǒng)的訓(xùn)練與測試環(huán)境不匹配,系統(tǒng)識別性能降低。因此,如何有效提高噪聲環(huán)境下說話人識別系統(tǒng)性能成為了關(guān)鍵的研究點(diǎn)。本文主要對語音增強(qiáng)、特征提取等相關(guān)方面的內(nèi)容進(jìn)行研究,提出了一種非負(fù)矩陣分解優(yōu)化算法,研究了深度學(xué)習(xí)用于特征提取的識別效果,以解決因噪聲因素帶來的不利影響,提高系統(tǒng)識別率。最后設(shè)計(jì)相關(guān)的圖形用戶界面完成語音信號錄制和識別結(jié)果顯示。本文主要研究內(nèi)容如下:1.提出了一種非負(fù)矩陣分解優(yōu)化算法。分析了譜減法和傳統(tǒng)非負(fù)矩陣分解算法的優(yōu)缺點(diǎn),提出非負(fù)矩陣分解優(yōu)化算法對含噪語音信號進(jìn)行處理,得到具有較好語音質(zhì)量的重構(gòu)語音。結(jié)合各算法優(yōu)勢,將譜減法、非負(fù)矩陣分解算法以及非負(fù)矩陣優(yōu)化算法的幅度進(jìn)行加權(quán)融合,進(jìn)一步增強(qiáng)算法泛化能力。實(shí)驗(yàn)證明,與傳統(tǒng)語音增強(qiáng)算法進(jìn)行對比,相同條件下非負(fù)矩陣分解優(yōu)化算法的增強(qiáng)效果更優(yōu)。與單一語音增強(qiáng)算法相比,融合算法在大多數(shù)噪音環(huán)境下具有較好的增強(qiáng)效果。2.提出了深淺層特征融合的特征提取方法。本文采用深度自動(dòng)編碼網(wǎng)絡(luò)對含噪語音信號進(jìn)行特征提取,基于深度置信網(wǎng)絡(luò)的自動(dòng)編碼器能有效過濾語音中的噪聲成分,挖掘淺層特征中隱藏個(gè)性信息的深層表示,將深層特征與淺層特征輸入i-vector模型后進(jìn)行分?jǐn)?shù)級融合。實(shí)驗(yàn)表明與噪聲環(huán)境下單一特征參數(shù)相比,融合特征能更全面地描述說話人信息,提高系統(tǒng)識別率。3.設(shè)計(jì)了基于MATLAB的圖形用戶界面。利用MATLAB自帶工具箱和內(nèi)置函數(shù)設(shè)計(jì)說話人識別平臺界面。通過錄制語音信號以及識別說話人對系統(tǒng)平臺進(jìn)行測試,結(jié)果表明平臺具有較好的可交互性。
【圖文】:

說話人識別,語音識別,聲紋,說話人


第 2 章 說話人識別的關(guān)鍵技術(shù).1 說話人識別概述說話人識別是一種通過對語音信號中包含的聲紋特征進(jìn)行分析獲取說話人信息進(jìn)行身份驗(yàn)證的特殊生物技術(shù),又稱為“聲紋識別”。語音識別與說話別的區(qū)別在于語音識別中所使用的特征參數(shù)主要表征的是語音中的語義信息說話人識別中的特征參數(shù)主要表征的是說話人的個(gè)性信息[63],兩者的側(cè)重點(diǎn),,所建立的模型也不相同。對語音信號處理技術(shù)進(jìn)行分類,圖 2.1 可以表示說識別技術(shù)與語音識別、語義識別等語音信號處理技術(shù)的關(guān)系。

說話人識別


圖 2.2 說話人識別分類說話人識別和文本無關(guān)的說話人識別是說話人識行劃分的。前者規(guī)定語音文本內(nèi)容,要求說話人說的內(nèi)容相同。一般情況下這類說話人識別系統(tǒng)的有一定限制。后者預(yù)先不確定文本內(nèi)容,即訓(xùn)練與文本相關(guān)的說話人識別技術(shù)相比,該技術(shù)識別應(yīng)用相對比較廣泛。識別的基本組成系統(tǒng)分為訓(xùn)練和測試兩個(gè)階段。訓(xùn)練階段是對輸特征提取,然后為每個(gè)說話人建立一個(gè)描述說話并且模型的訓(xùn)練階段也被稱為模型預(yù)留。測試階
【學(xué)位授予單位】:重慶郵電大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2019
【分類號】:TN912.34

【相似文獻(xiàn)】

相關(guān)期刊論文 前10條

1 劉倩;李時(shí);;細(xì)菌趨藥性算法在說話人識別中的應(yīng)用[J];宿州學(xué)院學(xué)報(bào);2017年11期

2 趙艷;呂亮;趙力;;基于修正Fukunaga-Koontz變換的說話人識別方法[J];電子器件;2018年04期

3 李為州;楊印根;;說話人識別中基于深度信念網(wǎng)絡(luò)的超向量降維的研究[J];電腦知識與技術(shù);2017年22期

4 雷震春;萬艷紅;羅劍;朱明華;;基于Mahalanobis距離的說話人識別模型研究[J];中國語音學(xué)報(bào);2016年00期

5 王華朋;李寧;許鋒;蔡能斌;;基于元音共振峰特征的法庭說話人識別[J];中國刑警學(xué)院學(xué)報(bào);2014年02期

6 王華朋;楊軍;許勇;;應(yīng)用似然比框架的法庭說話人識別[J];數(shù)據(jù)采集與處理;2013年02期

7 檀蕊蓮;劉建平;;說話人識別技術(shù)的研究進(jìn)展[J];科技資訊;2007年33期

8 寧飛,陳頻;說話人識別的幾種方法[J];電聲技術(shù);2001年12期

9 曹業(yè)敏,侯風(fēng)雷,王炳錫;說話人識別技術(shù)現(xiàn)狀與進(jìn)展[J];河南科技;1998年09期

10 王華朋;楊軍;吳鳴;許勇;;基于自適應(yīng)同源方差控制的法庭自動(dòng)說話人識別[J];應(yīng)用科學(xué)學(xué)報(bào);2014年06期

相關(guān)會議論文 前10條

1 黃猛;唐琳;王雅芬;;說話人識別技術(shù)綜述[A];第十三屆全國信號和智能信息處理與應(yīng)用學(xué)術(shù)會議論文集[C];2019年

2 孫帆;遲惠生;;循環(huán)網(wǎng)絡(luò)說話人識別[A];第二屆全國人機(jī)語音通訊學(xué)術(shù)會議(NCMMSC1992)論文集[C];1992年

3 肖劍;歐貴文;;多層前饋神經(jīng)網(wǎng)絡(luò)組的文本無關(guān)說話人識別[A];第七屆全國人機(jī)語音通訊學(xué)術(shù)會議(NCMMSC7)論文集[C];2003年

4 吳璽宏;劉文舉;;聽神經(jīng)計(jì)算模型及其在抗噪說話人識別中的應(yīng)用[A];第六屆全國人機(jī)語音通訊學(xué)術(shù)會議論文集[C];2001年

5 任舒彬;楊瑩春;吳朝暉;;面向多通道說話人識別的預(yù)處理方法實(shí)驗(yàn)研究(類別:聲紋鑒定)[A];第六屆全國現(xiàn)代語音學(xué)學(xué)術(shù)會議論文集(下)[C];2003年

6 劉大力;趙力;;與文本無關(guān)說話人識別系統(tǒng)的性能比較[A];2004年全國物理聲學(xué)會議論文集[C];2004年

7 張陳昊;鄭方;王琳琳;;基于多音素類模型的文本無關(guān)短語音說話人識別[A];需將論文集名稱修改為“第十二屆全國人機(jī)語音通訊學(xué)術(shù)會議(NCMMSC2013)論文集[C];2013年

8 周昊朗;王嵐;陳珂;;一個(gè)面向說話人識別的漢語語音數(shù)據(jù)庫[A];第六屆全國人機(jī)語音通訊學(xué)術(shù)會議論文集[C];2001年

9 龍川;景新幸;楊海燕;;矢量量化與協(xié)方差矩陣結(jié)合的說話人識別方法[A];泛在信息社會中的聲學(xué)——中國聲學(xué)學(xué)會2010年全國會員代表大會暨學(xué)術(shù)會議論文集[C];2010年

10 周昊朗;王嵐;吳璽宏;遲惠生;;一個(gè)面向說話人識別的漢語語音數(shù)據(jù)庫[A];信號與信息處理技術(shù)——第一屆信號與信息處理聯(lián)合學(xué)術(shù)會議論文集[C];2002年

相關(guān)重要報(bào)紙文章 前2條

1 汪永安;科大訊飛說話人識別技術(shù)世界領(lǐng)先[N];安徽日報(bào);2008年

2 吳長鋒;科大訊飛勇奪說話人識別國際大賽第一[N];科技日報(bào);2008年

相關(guān)博士學(xué)位論文 前10條

1 徐瓏婷;基于稀疏分解的說話人識別技術(shù)研究[D];南京郵電大學(xué);2017年

2 陸偉;基于缺失特征的文本無關(guān)說話人識別魯棒性研究[D];中國科學(xué)技術(shù)大學(xué);2008年

3 俞一彪;基于互信息理論的說話人識別研究[D];上海大學(xué);2004年

4 付中華;說話人識別系統(tǒng)魯棒性研究[D];西北工業(yè)大學(xué);2004年

5 侯麗敏;基于非線性理論和信息融合的說話人識別[D];上海大學(xué);2005年

6 雷震春;支持向量機(jī)在說話人識別中的應(yīng)用研究[D];浙江大學(xué);2006年

7 姚志強(qiáng);說話人識別中提高GMM性能方法的研究[D];中國科學(xué)技術(shù)大學(xué);2006年

8 包永強(qiáng);噪聲環(huán)境下說話人識別的研究[D];東南大學(xué);2006年

9 林琳;基于模糊聚類與遺傳算法的說話人識別理論研究及應(yīng)用[D];吉林大學(xué);2007年

10 解焱陸;基于特征變換和分類的文本無關(guān)電話語音說話人識別研究[D];中國科學(xué)技術(shù)大學(xué);2007年

相關(guān)碩士學(xué)位論文 前10條

1 姜孝偉;說話人識別系統(tǒng)的設(shè)計(jì)與研究[D];上海交通大學(xué);2018年

2 陳松;基于VQ的室內(nèi)說話人識別及FPGA實(shí)現(xiàn)研究[D];安徽理工大學(xué);2019年

3 蔡國都;基于x-vector的說話人識別研究[D];北京交通大學(xué);2019年

4 孫念;基于多特征I-Vector的短語音說話人識別方法研究[D];重慶郵電大學(xué);2019年

5 巴莉芳;基于含噪語音的說話人識別研究[D];重慶郵電大學(xué);2019年

6 劉崇鳴;基于三元組損失與流形降維的文本無關(guān)說話人識別方法研究[D];哈爾濱工業(yè)大學(xué);2019年

7 林婷;基于ICA和ASR語音特征選取的說話人識別算法[D];南昌大學(xué);2019年

8 陳園允;變形欺騙性語音的檢測算法研究及對其魯棒的說話人識別系統(tǒng)實(shí)現(xiàn)[D];廣東技術(shù)師范大學(xué);2019年

9 徐鈺婷;跨語言背景下基于單元音的說話人識別研究[D];深圳大學(xué);2018年

10 陳莉芬;基于英語爆破音和摩擦音的跨語言說話人識別研究[D];深圳大學(xué);2018年



本文編號:2608122

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/xinxigongchenglunwen/2608122.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶69851***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請E-mail郵箱bigeng88@qq.com