天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁 > 科技論文 > 信息工程論文 >

面向說話人識別的深度學(xué)習(xí)方法研究

發(fā)布時間:2020-10-13 05:06
   說話人識別作為當(dāng)今社會最熱門的生物特征識別技術(shù)之一,被廣泛應(yīng)用在人機交互、身份驗證、信息檢索等方面,具有重要的研究意義和實用價值。近年來,隨著深度學(xué)習(xí)在語音識別的成功應(yīng)用,基于深度學(xué)習(xí)的說話人識別研究也受到研究學(xué)者們的廣泛關(guān)注。本文主要研究面向說話人識別的深度學(xué)習(xí)方法,研究解決如何有效結(jié)合深度學(xué)習(xí)理論和說話人識別技術(shù),在有限訓(xùn)練數(shù)據(jù)的條件下建立識別系統(tǒng);如何結(jié)合不同種類的深度神經(jīng)網(wǎng)絡(luò),構(gòu)建高性能的說話人識別模型。主要研究內(nèi)容如下:(1)研究了基于MFCC-CNN的說話人識別方法。雖然深度神經(jīng)網(wǎng)絡(luò)可以將特征提取與識別分類集為一體,直接對原始語音進(jìn)行端對端識別,但前提是需要大量的訓(xùn)練數(shù)據(jù)才能獲得較好的識別效果。為了提高少量數(shù)據(jù)環(huán)境下說話人識別效果,本文構(gòu)建一種基于MFCC-CNN的說話人識別模型。該模型是先從原始語音中提取MFCC(Mel-Frequency Cepstral Coefficients,MFCC)參數(shù)作為語音特征,再利用CNN(Convolutional Neural Network,CNN)進(jìn)行識別。同時,為了防止過擬合,通過引入Dropout和L2正則化的方式對模型進(jìn)行優(yōu)化。實驗結(jié)果表明,基于MFCC-CNN的說話人識別方法在網(wǎng)絡(luò)訓(xùn)練時間大幅縮短的情況下,識別率高于基于端對端的深度說話人識別方法。(2)研究了基于MFCC-CNN-LSTM混合深度神經(jīng)網(wǎng)絡(luò)的說話人識別方法。CNN可以克服傳統(tǒng)說話人識別中時頻偏移導(dǎo)致的不穩(wěn)定問題,卻沒有考慮語音上下文之間的關(guān)聯(lián)信息。本文提出一種基于MFCC-CNN-LSTM的說話人識別方法,首先用CNN提取幀間特征,然后用LSTM(Long Short Term Memory,LSTM)對上下文語音幀識別。該方法結(jié)合了CNN和LSTM模型的優(yōu)點。實驗結(jié)果表明,MFCC-CNN-LSTM混合模型識別性能優(yōu)于單一的MFCC-CNN模型和MFCC-LSTM模型,且具有較好的魯棒性。
【學(xué)位單位】:南昌航空大學(xué)
【學(xué)位級別】:碩士
【學(xué)位年份】:2019
【中圖分類】:TN912.34;TP183
【部分圖文】:

說話人識別,語音處理,說話人確認(rèn),研究領(lǐng)域


航空大學(xué)碩士學(xué)位論文 第 1 章 緒論重要研究方向之一,它們同屬于語音處理領(lǐng)域[6],語音處理研究領(lǐng)域的分支如 1-1。語音識別技術(shù)是一個廣義的概念,根據(jù)識別內(nèi)容的不同分為語音識別(識說話內(nèi)容)、說話人識別(識別說話人是誰)、語種識別[7](識別說話語言種)。說話人識別又叫聲紋識別[8,9],是根據(jù)說話人所發(fā)出的語音來推斷出一個身份的技術(shù)。其中這個語音信號除了包含單詞或句子內(nèi)容之外,還包含其他關(guān)說話人的身份、性別、年齡、情緒、錄音環(huán)境等信息,同時也會因為說話人自咽喉、鼻腔等發(fā)音器官的差異而有所不同。說話人識別技術(shù)就是利用語音信號含有的特定說話人信息來自動識別說話者身份。通俗來講就是它不關(guān)心語音表的含義和文字信息,而是強調(diào)說話人的個性特征,通過語音的特征參數(shù)去辨別段語音出自哪個說話人。

頻譜,語音信號,分幀


-1H z 1 -az重系數(shù)取值 a=0.94。語音信號 s (s ( n) s(n) as(n 1)語音信號。平穩(wěn)的,但在短時間內(nèi)(一般為 1有改變[35],可認(rèn)為頻譜也是不樣把語音信號分為若干個短時長,用這一幀語音信號代替整幀是采用可移動的有限長度窗口-100 幀。為了使幀與幀之間平滑示的交疊分段的方法,前一幀和半。

頻譜,矩形窗,加窗


會產(chǎn)生頻譜泄露,所以還要進(jìn)行加窗處函數(shù) w (n)相乘得到加窗函數(shù) ( ) ( ) ( )ws n s n w n。形窗,如圖 2-3,表達(dá)式為: 0,其他1,(01)()nNw nHamming)窗,如圖 2-4,表達(dá)式為: 0,其他,(0)120.540.46cos()nNNnwn 數(shù)對短時參數(shù)的計算有很大的影響,由于矩形窗漏,所以通常采用帶寬較大,高頻分量幅度較小。經(jīng)過分幀加窗后得到的語音幀就更加平穩(wěn),便
【相似文獻(xiàn)】

相關(guān)期刊論文 前10條

1 劉倩;李時;;細(xì)菌趨藥性算法在說話人識別中的應(yīng)用[J];宿州學(xué)院學(xué)報;2017年11期

2 趙艷;呂亮;趙力;;基于修正Fukunaga-Koontz變換的說話人識別方法[J];電子器件;2018年04期

3 李為州;楊印根;;說話人識別中基于深度信念網(wǎng)絡(luò)的超向量降維的研究[J];電腦知識與技術(shù);2017年22期

4 雷震春;萬艷紅;羅劍;朱明華;;基于Mahalanobis距離的說話人識別模型研究[J];中國語音學(xué)報;2016年00期

5 王華朋;李寧;許鋒;蔡能斌;;基于元音共振峰特征的法庭說話人識別[J];中國刑警學(xué)院學(xué)報;2014年02期

6 王華朋;楊軍;許勇;;應(yīng)用似然比框架的法庭說話人識別[J];數(shù)據(jù)采集與處理;2013年02期

7 檀蕊蓮;劉建平;;說話人識別技術(shù)的研究進(jìn)展[J];科技資訊;2007年33期

8 寧飛,陳頻;說話人識別的幾種方法[J];電聲技術(shù);2001年12期

9 曹業(yè)敏,侯風(fēng)雷,王炳錫;說話人識別技術(shù)現(xiàn)狀與進(jìn)展[J];河南科技;1998年09期

10 王華朋;楊軍;吳鳴;許勇;;基于自適應(yīng)同源方差控制的法庭自動說話人識別[J];應(yīng)用科學(xué)學(xué)報;2014年06期


相關(guān)博士學(xué)位論文 前10條

1 徐瓏婷;基于稀疏分解的說話人識別技術(shù)研究[D];南京郵電大學(xué);2017年

2 陸偉;基于缺失特征的文本無關(guān)說話人識別魯棒性研究[D];中國科學(xué)技術(shù)大學(xué);2008年

3 俞一彪;基于互信息理論的說話人識別研究[D];上海大學(xué);2004年

4 付中華;說話人識別系統(tǒng)魯棒性研究[D];西北工業(yè)大學(xué);2004年

5 侯麗敏;基于非線性理論和信息融合的說話人識別[D];上海大學(xué);2005年

6 雷震春;支持向量機在說話人識別中的應(yīng)用研究[D];浙江大學(xué);2006年

7 姚志強;說話人識別中提高GMM性能方法的研究[D];中國科學(xué)技術(shù)大學(xué);2006年

8 包永強;噪聲環(huán)境下說話人識別的研究[D];東南大學(xué);2006年

9 林琳;基于模糊聚類與遺傳算法的說話人識別理論研究及應(yīng)用[D];吉林大學(xué);2007年

10 解焱陸;基于特征變換和分類的文本無關(guān)電話語音說話人識別研究[D];中國科學(xué)技術(shù)大學(xué);2007年


相關(guān)碩士學(xué)位論文 前10條

1 梅文星;說話人識別中通用背景模型研究及深度學(xué)習(xí)初探[D];浙江大學(xué);2019年

2 樊云云;面向說話人識別的深度學(xué)習(xí)方法研究[D];南昌航空大學(xué);2019年

3 楊志勇;基于模糊神經(jīng)網(wǎng)絡(luò)的說話人識別方法研究[D];南昌航空大學(xué);2019年

4 韓旭;噪聲環(huán)境下基于RNN的說話人識別方法研究[D];哈爾濱理工大學(xué);2019年

5 徐鈺婷;跨語言背景下基于單元音的說話人識別研究[D];深圳大學(xué);2018年

6 陳莉芬;基于英語爆破音和摩擦音的跨語言說話人識別研究[D];深圳大學(xué);2018年

7 易中曼;關(guān)于法庭說話人識別的評估[D];西南政法大學(xué);2018年

8 郭慧陽;基于深度學(xué)習(xí)的說話人識別技術(shù)研究[D];廈門大學(xué);2018年

9 楊楠;基于深度學(xué)習(xí)的說話人識別研究與實現(xiàn)[D];鄭州大學(xué);2019年

10 方祥;基于多信息融合的說話人識別[D];哈爾濱理工大學(xué);2018年



本文編號:2838771

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/xinxigongchenglunwen/2838771.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶75181***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com