約束條件下的結(jié)構(gòu)化統(tǒng)計(jì)聲學(xué)模型及非平行語(yǔ)料語(yǔ)音轉(zhuǎn)換
發(fā)布時(shí)間:2017-10-09 17:46
本文關(guān)鍵詞:約束條件下的結(jié)構(gòu)化統(tǒng)計(jì)聲學(xué)模型及非平行語(yǔ)料語(yǔ)音轉(zhuǎn)換
更多相關(guān)文章: 語(yǔ)音轉(zhuǎn)換 結(jié)構(gòu)化高斯混合模型 非平行語(yǔ)料 約束條件 快速匹配算法
【摘要】:語(yǔ)音轉(zhuǎn)換是指將A說(shuō)話人的語(yǔ)音進(jìn)行轉(zhuǎn)換并使其聽起來(lái)像B說(shuō)話人的語(yǔ)音,且保持語(yǔ)義內(nèi)容不變的一種技術(shù)。傳統(tǒng)的說(shuō)話人語(yǔ)音轉(zhuǎn)換方法大多基于平行語(yǔ)料,通過(guò)對(duì)平行訓(xùn)練語(yǔ)料的聯(lián)合訓(xùn)練得到短時(shí)譜轉(zhuǎn)換函數(shù)。但由于實(shí)際情況的限制,完全平行的高質(zhì)量訓(xùn)練語(yǔ)料是非常難以獲得有時(shí)甚至是不可能獲得的,并且聯(lián)合訓(xùn)練計(jì)算量大,故平行語(yǔ)料語(yǔ)音轉(zhuǎn)換的發(fā)展受到限制。本文提出約束條件下結(jié)構(gòu)化高斯混合模型并將其應(yīng)用于非平行語(yǔ)料語(yǔ)音轉(zhuǎn)換。首先,從源與目標(biāo)說(shuō)話人的非平行語(yǔ)料中提取出少量相同音節(jié),在結(jié)構(gòu)化高斯混合模型(SGMM:Structure Gaussian Mixture Model)的訓(xùn)練過(guò)程中,利用這些相同音節(jié)包含的語(yǔ)義信息及聲學(xué)特征對(duì)應(yīng)關(guān)系對(duì)K均值聚類中心進(jìn)行約束,并在期望最大化迭代過(guò)程中對(duì)語(yǔ)音幀屬于某高斯分量的后驗(yàn)概率進(jìn)行修正,訓(xùn)練出基于約束的結(jié)構(gòu)化高斯混合模型。然后,根據(jù)全局聲學(xué)結(jié)構(gòu)原理,利用模型快速匹配算法對(duì)源和目標(biāo)說(shuō)話人的約束條件下的結(jié)構(gòu)化高斯混合模型的高斯分布進(jìn)行匹配對(duì)準(zhǔn),得到短時(shí)譜轉(zhuǎn)換函數(shù)。主觀及客觀評(píng)價(jià)實(shí)驗(yàn)結(jié)果表明,在轉(zhuǎn)換后語(yǔ)音與目標(biāo)語(yǔ)音之間的譜失真,轉(zhuǎn)換后語(yǔ)音的目標(biāo)傾向性和轉(zhuǎn)換后語(yǔ)音的質(zhì)量等方面,使用本文提出的轉(zhuǎn)換方法優(yōu)于傳統(tǒng)的結(jié)構(gòu)化語(yǔ)音轉(zhuǎn)換方法,轉(zhuǎn)換系統(tǒng)的性能也與基于平行語(yǔ)料的語(yǔ)音轉(zhuǎn)換方法的性能更為接近。本課題主要對(duì)以下幾個(gè)方面進(jìn)行研究:1、通過(guò)對(duì)高斯混合模型(GMM:Gaussian Mixture Model)的理解和分析,將GMM應(yīng)用于平行語(yǔ)料語(yǔ)音轉(zhuǎn)換系統(tǒng),對(duì)其轉(zhuǎn)換性能進(jìn)行評(píng)價(jià)并指出該方法的特點(diǎn)及存在的問(wèn)題。2、深入研究全局聲學(xué)結(jié)構(gòu)及其原理,詳細(xì)分析傳統(tǒng)結(jié)構(gòu)化非平行語(yǔ)料語(yǔ)音轉(zhuǎn)換方法存在的問(wèn)題,提出了一種快速模型匹配算法和基于約束條件的結(jié)構(gòu)化高斯混合模型的非平行語(yǔ)料語(yǔ)音轉(zhuǎn)換方法。3、在基于少量約束信息的基礎(chǔ)上,實(shí)現(xiàn)高質(zhì)量結(jié)構(gòu)化非平行語(yǔ)料語(yǔ)音轉(zhuǎn)換系統(tǒng)。4、利用主觀和客觀測(cè)評(píng)準(zhǔn)則,對(duì)傳統(tǒng)的高斯混合模型轉(zhuǎn)換法,傳統(tǒng)的結(jié)構(gòu)化方法以及約束條件下的SGMM(C-SGMM)方法的實(shí)驗(yàn)結(jié)果進(jìn)行測(cè)評(píng),并對(duì)測(cè)評(píng)結(jié)果進(jìn)行詳細(xì)的分析,說(shuō)明本課題提出方法的有效性及優(yōu)越性。
【關(guān)鍵詞】:語(yǔ)音轉(zhuǎn)換 結(jié)構(gòu)化高斯混合模型 非平行語(yǔ)料 約束條件 快速匹配算法
【學(xué)位授予單位】:蘇州大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2015
【分類號(hào)】:TN912.3
【目錄】:
- 中文摘要4-6
- Abstract6-10
- 第一章 緒論10-17
- 1.1 語(yǔ)音轉(zhuǎn)換的定義10-11
- 1.2 語(yǔ)音轉(zhuǎn)換的研究意義與應(yīng)用前景11-13
- 1.3 課題的國(guó)內(nèi)外研究現(xiàn)狀13-14
- 1.4 課題研究目標(biāo)及主要工作14-16
- 1.5 論文內(nèi)容安排16-17
- 第二章 語(yǔ)音轉(zhuǎn)換理論基礎(chǔ)17-40
- 2.1 語(yǔ)音信號(hào)概述17-21
- 2.1.1 語(yǔ)音信號(hào)的產(chǎn)生原理17-18
- 2.1.2 語(yǔ)音信號(hào)產(chǎn)生的數(shù)學(xué)模型18-21
- 2.2 語(yǔ)音信號(hào)分析21-31
- 2.2.1 預(yù)處理22-28
- 2.2.2 基音周期估計(jì)28-29
- 2.2.3 線性預(yù)測(cè)分析29-31
- 2.2.4 倒譜分析31
- 2.3 語(yǔ)音的個(gè)性特征分析31-32
- 2.4 STRAIGHT語(yǔ)音分析-合成算法32-34
- 2.4.1 去除周期性影響的譜估計(jì)33
- 2.4.2 平滑可靠的基頻軌跡的提取33-34
- 2.4.3 語(yǔ)音合成34
- 2.5 語(yǔ)音轉(zhuǎn)換系統(tǒng)概述34-40
- 2.5.1 語(yǔ)音轉(zhuǎn)換的基本原理34-35
- 2.5.2 語(yǔ)音轉(zhuǎn)換系統(tǒng)的系統(tǒng)組成35
- 2.5.3 語(yǔ)音轉(zhuǎn)換的主要方法35-38
- 2.5.4 語(yǔ)音轉(zhuǎn)換性能的評(píng)價(jià)準(zhǔn)則38-40
- 第三章 基于平行語(yǔ)料聯(lián)合訓(xùn)練的語(yǔ)音轉(zhuǎn)換方法40-45
- 3.1 系統(tǒng)構(gòu)成40
- 3.2 語(yǔ)音特征參數(shù)的時(shí)間對(duì)齊40-42
- 3.3 高斯混合模型42-43
- 3.3.1 高斯混合模型的基本原理42
- 3.3.2 高斯混合模型的訓(xùn)練42-43
- 3.3.3 高斯混合模型訓(xùn)練的參數(shù)設(shè)置43
- 3.4 基于高斯混合模型語(yǔ)音轉(zhuǎn)換的轉(zhuǎn)換函數(shù)43-44
- 3.4.1 基頻轉(zhuǎn)換函數(shù)43-44
- 3.4.2 短時(shí)譜轉(zhuǎn)換函數(shù)44
- 3.5 基于平行語(yǔ)料聯(lián)合訓(xùn)練的語(yǔ)音轉(zhuǎn)換的局限性44-45
- 第四章 約束條件下的結(jié)構(gòu)化統(tǒng)計(jì)聲學(xué)模型及非平行語(yǔ)料語(yǔ)音轉(zhuǎn)換45-56
- 4.1 系統(tǒng)構(gòu)成45-46
- 4.2 約束條件下的結(jié)構(gòu)化高斯混合模型46-50
- 4.2.1 結(jié)構(gòu)化高斯混合模型的基本原理46-48
- 4.2.2 基于約束的K均值聚類48-49
- 4.2.3 基于約束的EM算法49-50
- 4.3 基于約束條件下結(jié)構(gòu)化高斯混合模型的語(yǔ)音轉(zhuǎn)換50-52
- 4.4 快速模型匹配算法52-56
- 第五章 語(yǔ)音轉(zhuǎn)換實(shí)驗(yàn)及分析56-59
- 5.1 語(yǔ)料庫(kù)描述及參數(shù)設(shè)置56
- 5.2 客觀評(píng)價(jià)56-57
- 5.3 主觀評(píng)價(jià)57-59
- 第六章 總結(jié)與展望59-61
- 6.1 總結(jié)59-60
- 6.2 展望60-61
- 參考文獻(xiàn)61-66
- 攻讀碩士學(xué)位期間公開發(fā)表的論文66-67
- 致謝67-68
【參考文獻(xiàn)】
中國(guó)期刊全文數(shù)據(jù)庫(kù) 前2條
1 左國(guó)玉,劉文舉,阮曉鋼;聲音轉(zhuǎn)換技術(shù)的研究與進(jìn)展[J];電子學(xué)報(bào);2004年07期
2 左國(guó)玉,劉文舉,阮曉鋼;基于遺傳徑向基神經(jīng)網(wǎng)絡(luò)的聲音轉(zhuǎn)換[J];中文信息學(xué)報(bào);2004年01期
,本文編號(hào):1001582
本文鏈接:http://sikaile.net/kejilunwen/wltx/1001582.html
最近更新
教材專著