基于GMM模型和LPC-MFCC聯(lián)合特征的聲道譜轉(zhuǎn)換研究
發(fā)布時(shí)間:2024-03-10 11:57
聲道譜轉(zhuǎn)換是語(yǔ)音轉(zhuǎn)換中的關(guān)鍵技術(shù)。目前,大多數(shù)語(yǔ)音轉(zhuǎn)換方法對(duì)聲道譜的轉(zhuǎn)換都是先提取語(yǔ)音中的某一種聲道特征參數(shù),然后對(duì)其進(jìn)行訓(xùn)練轉(zhuǎn)換,進(jìn)而合成轉(zhuǎn)換語(yǔ)音。由于不同的聲道特征參數(shù)表征著不同的物理和聲學(xué)意義,因此這些方法通常忽略了不同聲道特征參數(shù)之間可能存在的互補(bǔ)性。針對(duì)這一問(wèn)題,研究了不同聲道特征參數(shù)之間進(jìn)行聯(lián)合建模的方法,引入了一種由線性預(yù)測(cè)系數(shù)(LinearPredictionCoefficient,LPC)和梅爾頻率倒譜系數(shù)(Mel-Frequency Cepstral Coefficient, MFCC)聯(lián)合構(gòu)成的LPC-MFCC特征參數(shù),提出了一種基于高斯混合模型(Gaussian Mixture Model, GMM)和LPC-MFCC聯(lián)合特征參數(shù)的語(yǔ)音轉(zhuǎn)換方法。為驗(yàn)證文中方法的有效性,仿真實(shí)驗(yàn)選取了基于GMM和LPC的語(yǔ)音轉(zhuǎn)換方法進(jìn)行對(duì)比,對(duì)多組實(shí)驗(yàn)數(shù)據(jù)進(jìn)行主觀和客觀測(cè)試,結(jié)果表明,文中提出的語(yǔ)音轉(zhuǎn)換方法可以獲得相似度更高的轉(zhuǎn)換語(yǔ)音。
【文章頁(yè)數(shù)】:5 頁(yè)
【部分圖文】:
本文編號(hào):3924756
【文章頁(yè)數(shù)】:5 頁(yè)
【部分圖文】:
圖2MFCC特征提取流程
圖1基于GMM模型和LPC-MFCC聯(lián)合特征的轉(zhuǎn)換框圖2.2.4時(shí)間對(duì)齊
圖1基于GMM模型和LPC-MFCC聯(lián)合特征的轉(zhuǎn)換框圖
為了便于闡述參數(shù)的聯(lián)合過(guò)程,假設(shè)矩陣Alpc表示根據(jù)某一句語(yǔ)音提取得到的LPC參數(shù),階數(shù)為M×N,其中M表示幀數(shù),N表示特征維度。矩陣Amfcc表示根據(jù)同一語(yǔ)音提取得到的MFCC參數(shù),階數(shù)為M×N。對(duì)兩個(gè)矩陣按列拼接得到聯(lián)合矩陣,即LPC-MFCC特征參數(shù)對(duì)應(yīng)的矩陣,階數(shù)大小為M....
本文編號(hào):3924756
本文鏈接:http://sikaile.net/kejilunwen/xinxigongchenglunwen/3924756.html
最近更新
教材專著