天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁 > 科技論文 > 信息工程論文 >

基于DNN聲學(xué)模型的說話人自適應(yīng)方法研究

發(fā)布時(shí)間:2021-01-07 01:25
  隨著神經(jīng)網(wǎng)絡(luò)及語音識別的迅速發(fā)展,對語音識別中的說話人自適應(yīng)技術(shù)的深入研究越來越受到重視。對基于DNN聲學(xué)模型的說話人自適應(yīng)方法展開研究,通過依據(jù)說話人的自適應(yīng)數(shù)據(jù),對聲學(xué)模型進(jìn)行自適應(yīng)訓(xùn)練,從而提高聲學(xué)模型對說話人的自適應(yīng)能力,使得識別系統(tǒng)獲得比沒有自適應(yīng)下更高的識別準(zhǔn)確率。同時(shí)對自適應(yīng)過程中的信道干擾進(jìn)行研究,以提高系統(tǒng)的魯棒性?偠灾,說話人自適應(yīng)具有重要的研究價(jià)值。本文在對基于DNN聲學(xué)模型的說話人自適應(yīng)方法研究中,主要研究了對表征說話人身份(identity-vector,i-vector)特征訓(xùn)練及提取,為了減少信道差異帶來的影響,對i-vector特征的信道補(bǔ)償方法進(jìn)行研究,而后,對DNN聲學(xué)模型進(jìn)行自適應(yīng)訓(xùn)練方法進(jìn)行研究。具體內(nèi)容如下:首先,針對因自適應(yīng)數(shù)據(jù)稀疏訓(xùn)練中出現(xiàn)過擬合問題,本文提出了一種基于奇異值分解(Singular Value Decomposition,SVD)的低維特征提取技術(shù),給出了對DNN網(wǎng)絡(luò)中的權(quán)重矩陣進(jìn)行SVD分解公式以及相應(yīng)的解析,利用該網(wǎng)絡(luò)提取低維特征。另外,針對i-vector模型中總變換矩陣T訓(xùn)練與估計(jì)困難問題,給出改進(jìn)后總變換矩陣T... 

【文章來源】:西安電子科技大學(xué)陜西省 211工程院校 教育部直屬院校

【文章頁數(shù)】:87 頁

【學(xué)位級別】:碩士

【部分圖文】:

基于DNN聲學(xué)模型的說話人自適應(yīng)方法研究


激活函數(shù)圖像

關(guān)系圖,實(shí)際頻率,關(guān)系圖,頻率


圖 3.3 Mel 頻率與實(shí)際頻率關(guān)系圖中的折線大致可以分為兩段,在 1000Hz 一下 Mel 頻率與實(shí)際頻率 呈線性 1000Hz 以上兩者近似呈對數(shù)增長。符合我們?nèi)硕鷮τ?1000Hz 以下的語音的還原原始語音源,而在 1000Hz 以上的語音會自動屏蔽。而提出來的特征,在嘈雜的環(huán)境中,我們?nèi)硕阅苷5胤直娓鞣N語音信息,主要是耳蝸起作用。們耳蝸就有濾波的特性,同濾波器組的作用一樣。語音信號中的信息大多集部分,高頻部分容易收到噪聲干擾,濾波器組在低頻部分分布比較密集,在相對稀疏。如下是 MFCC 的提取流程圖:預(yù)加重歸一化分幀加窗差分FFTDCTMel濾波器組求對數(shù)能量信號CC特征


本文編號:2961621

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/xinxigongchenglunwen/2961621.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶0ed8d***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com