基于MFCC和GMM語(yǔ)音轉(zhuǎn)換技術(shù)研究
發(fā)布時(shí)間:2017-10-04 09:49
本文關(guān)鍵詞:基于MFCC和GMM語(yǔ)音轉(zhuǎn)換技術(shù)研究
更多相關(guān)文章: 語(yǔ)音轉(zhuǎn)換 梅爾倒譜參數(shù) 混合高斯模型 平均意見(jiàn)得分測(cè)試
【摘要】:語(yǔ)音是人們最直接的溝通方式,對(duì)語(yǔ)音信號(hào)的處理一直是目前最為熱門(mén)的研究方向之一。語(yǔ)音轉(zhuǎn)換指通過(guò)語(yǔ)音處理手段改變一個(gè)人的語(yǔ)音個(gè)性特征,使之具有另一個(gè)人的語(yǔ)音特征,但同時(shí)保持原有的語(yǔ)義信息不變。語(yǔ)音轉(zhuǎn)換是語(yǔ)音信號(hào)處理一個(gè)重要的分支領(lǐng)域,其涉及到了多個(gè)學(xué)科,包括生理、聲學(xué)、信號(hào)處理等多個(gè)學(xué)科,在多媒體配音,醫(yī)學(xué)治療發(fā)聲器官受損及保密領(lǐng)域都有十分廣闊的應(yīng)用前景。本文考慮在梅爾倒譜系數(shù)和高斯混合模型的基礎(chǔ)上設(shè)計(jì)一個(gè)語(yǔ)音轉(zhuǎn)換系統(tǒng)。為此,本文首先介紹了語(yǔ)音轉(zhuǎn)換的定義以及研究的現(xiàn)實(shí)價(jià)值;接著在此基礎(chǔ)上對(duì)語(yǔ)音轉(zhuǎn)換的兩大主要步驟進(jìn)行了分析:特征參數(shù)的提取以及轉(zhuǎn)換函數(shù)的確定。梅爾倒譜系數(shù)考慮了人耳的聽(tīng)覺(jué)特性,高斯混合模型也很好的擬合了轉(zhuǎn)換函數(shù)的曲線(xiàn),二者都是語(yǔ)音轉(zhuǎn)換領(lǐng)域中熱門(mén)的選擇之一;隨后本文設(shè)計(jì)了一個(gè)語(yǔ)音轉(zhuǎn)換系統(tǒng),將系統(tǒng)分為三個(gè)部分:提取部分、訓(xùn)練部分和轉(zhuǎn)換部分,對(duì)每一個(gè)部分的設(shè)計(jì)與實(shí)現(xiàn)都加以詳細(xì)的介紹;最后,本文設(shè)定了不同的測(cè)試方向,采用頻譜失真度和平均意見(jiàn)得分測(cè)試兩種方法從主觀和客觀兩個(gè)方面對(duì)轉(zhuǎn)換的效果做出了評(píng)價(jià)。
【關(guān)鍵詞】:語(yǔ)音轉(zhuǎn)換 梅爾倒譜參數(shù) 混合高斯模型 平均意見(jiàn)得分測(cè)試
【學(xué)位授予單位】:南京理工大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2015
【分類(lèi)號(hào)】:TN912.3
【目錄】:
- 摘要3-4
- Abstract4-7
- 1 緒論7-12
- 1.1 語(yǔ)音轉(zhuǎn)換的定義7
- 1.2 語(yǔ)音轉(zhuǎn)換的意義與應(yīng)用7-8
- 1.3 國(guó)內(nèi)外研究現(xiàn)狀及問(wèn)題8-9
- 1.4 論文內(nèi)容和結(jié)構(gòu)安排9-12
- 2 語(yǔ)音轉(zhuǎn)換相關(guān)理論12-26
- 2.1 語(yǔ)音發(fā)音系統(tǒng)12-13
- 2.2 語(yǔ)音信號(hào)的數(shù)學(xué)模型13-15
- 2.3 語(yǔ)音信號(hào)的時(shí)域分析15-16
- 2.3.1 短時(shí)能量和短時(shí)平均幅度15-16
- 2.3.2 短時(shí)平均過(guò)零率16
- 2.4 語(yǔ)音信號(hào)的頻域分析16-17
- 2.5 相關(guān)聲學(xué)參數(shù)17-18
- 2.6 語(yǔ)音轉(zhuǎn)換的主要方法18-23
- 2.6.1 矢量量化法18-19
- 2.6.2 說(shuō)話(huà)人插值法19-20
- 2.6.3 線(xiàn)性多變量回歸法20-21
- 2.6.4 神經(jīng)網(wǎng)絡(luò)法21
- 2.6.5 高斯混合模型法21-22
- 2.6.6 隱馬爾科夫模型法22-23
- 2.7 評(píng)價(jià)標(biāo)準(zhǔn)23-26
- 2.7.1 客觀評(píng)價(jià)標(biāo)準(zhǔn)24
- 2.7.2 主觀測(cè)試標(biāo)準(zhǔn)24-26
- 3 特征參數(shù)26-36
- 3.1 常見(jiàn)特征參數(shù)26-28
- 3.1.1 LPC系數(shù)26-27
- 3.1.2 LPCC特征參數(shù)27-28
- 3.1.3 MFCC特征參數(shù)28
- 3.2 人的聽(tīng)覺(jué)系統(tǒng)和語(yǔ)音的感知28-30
- 3.2.1 聽(tīng)覺(jué)系統(tǒng)的生理機(jī)制28-29
- 3.2.2 聽(tīng)覺(jué)特性29-30
- 3.3 Mel頻率簡(jiǎn)介30-36
- 3.3.1 梅爾倒譜系數(shù)MFCC及其提取算法31
- 3.3.2 求取MFCC系數(shù)的具體算法和步驟31-36
- 4 語(yǔ)音轉(zhuǎn)換的實(shí)現(xiàn)過(guò)程36-49
- 4.1 提取部分36-41
- 4.2 訓(xùn)練部分41-45
- 4.2.1 動(dòng)態(tài)時(shí)間規(guī)整DTW41
- 4.2.2 訓(xùn)練算法41-45
- 4.3 轉(zhuǎn)換部分45-49
- 4.3.1 最小均方誤差(MMSE)準(zhǔn)則45
- 4.3.2 轉(zhuǎn)換算法45-47
- 4.3.3 語(yǔ)音的后期處理47-49
- 5 實(shí)驗(yàn)與仿真49-53
- 5.1 實(shí)驗(yàn)準(zhǔn)備49
- 5.1.1 實(shí)驗(yàn)的語(yǔ)音庫(kù)49
- 5.1.2 性能指標(biāo)49
- 5.2 實(shí)驗(yàn)結(jié)果與分析49-52
- 5.2.1 MFCC系數(shù)對(duì)轉(zhuǎn)換性能的影響49-50
- 5.2.2 GMM方法對(duì)轉(zhuǎn)換性能的影響50-51
- 5.2.3 說(shuō)話(huà)人對(duì)轉(zhuǎn)換性能的影響51-52
- 5.3 本章小結(jié)52-53
- 6 總結(jié)與展望53-55
- 6.1 工作總結(jié)53
- 6.2 工作展望53-55
- 致謝55-56
- 參考文獻(xiàn)56-59
【參考文獻(xiàn)】
中國(guó)期刊全文數(shù)據(jù)庫(kù) 前1條
1 宋鵬;王浩;趙力;;基于混合Gauss歸一化的語(yǔ)音轉(zhuǎn)換方法[J];清華大學(xué)學(xué)報(bào)(自然科學(xué)版);2013年06期
中國(guó)碩士學(xué)位論文全文數(shù)據(jù)庫(kù) 前2條
1 張曉楓;基于小波變換與GMM的說(shuō)話(huà)人識(shí)別研究[D];西安電子科技大學(xué);2002年
2 任永梅;自適應(yīng)閾值小波包語(yǔ)音增強(qiáng)算法的研究[D];太原理工大學(xué);2013年
,本文編號(hào):969992
本文鏈接:http://sikaile.net/kejilunwen/wltx/969992.html
最近更新
教材專(zhuān)著