基于非平行語(yǔ)料的多人語(yǔ)音轉(zhuǎn)換
發(fā)布時(shí)間:2023-06-27 22:42
隨著計(jì)算機(jī)技術(shù)的發(fā)展以及語(yǔ)音處理技術(shù)的突破,語(yǔ)音在生活中發(fā)揮了重要的作用,如車(chē)載系統(tǒng)的語(yǔ)音助手和安防系統(tǒng)中的聲紋識(shí)別,為人們的生活提供了極大的便利。其中語(yǔ)音轉(zhuǎn)換是語(yǔ)音生成領(lǐng)域的一個(gè)重要子方向,其任務(wù)是在保證內(nèi)容不變、僅改變音色的情況下,將一個(gè)人的語(yǔ)音轉(zhuǎn)換成其他人的語(yǔ)音。而基于平行語(yǔ)料的傳統(tǒng)語(yǔ)音轉(zhuǎn)換方法對(duì)語(yǔ)料的要求影響了語(yǔ)音轉(zhuǎn)換的推廣,其語(yǔ)音動(dòng)態(tài)規(guī)整的過(guò)程中易引入噪音,在該基礎(chǔ)上建模多人語(yǔ)音轉(zhuǎn)換有較大的模型代價(jià),所以基于非平行語(yǔ)料的多人語(yǔ)音轉(zhuǎn)換方法有較高的研究?jī)r(jià)值。對(duì)比基于自編碼器架構(gòu)的語(yǔ)音轉(zhuǎn)換模型,基于星型生成對(duì)抗網(wǎng)絡(luò)的轉(zhuǎn)換模型可顯式建模多說(shuō)話(huà)人間的轉(zhuǎn)換關(guān)系,避免對(duì)平行語(yǔ)料的依賴(lài),以領(lǐng)域信息為條件可在單一模型中完成多人語(yǔ)音轉(zhuǎn)換任務(wù)。本文以該模型為基礎(chǔ)開(kāi)展了以下工作:本文針對(duì)基于輔助分類(lèi)器生成對(duì)抗網(wǎng)絡(luò)的語(yǔ)音轉(zhuǎn)換模型在目標(biāo)說(shuō)話(huà)人數(shù)量較多時(shí)存在無(wú)法轉(zhuǎn)換的問(wèn)題展開(kāi)研究,提出了兩種基于多說(shuō)話(huà)人博弈的多人語(yǔ)音轉(zhuǎn)換方法:基于多說(shuō)話(huà)人博弈的輔助分類(lèi)器生成對(duì)抗網(wǎng)絡(luò)的語(yǔ)音轉(zhuǎn)換方法和基于類(lèi)最大化激活與譜歸一化的生成對(duì)抗網(wǎng)絡(luò)的語(yǔ)音轉(zhuǎn)換方法。這兩種方法通過(guò)將說(shuō)話(huà)人信息引入鑒別器進(jìn)行博弈,完成對(duì)說(shuō)話(huà)人音色信息的捕...
【文章頁(yè)數(shù)】:63 頁(yè)
【學(xué)位級(jí)別】:碩士
【文章目錄】:
摘要
ABSTRACT
第1章 緒論
1.1 課題來(lái)源
1.2 課題研究的目的及意義
1.3 國(guó)內(nèi)外相關(guān)技術(shù)研究現(xiàn)狀
1.3.1 語(yǔ)音轉(zhuǎn)換的研究現(xiàn)狀
1.3.2 聲碼器的研究現(xiàn)狀
1.4 相關(guān)基本技術(shù)
1.4.1 卷積神經(jīng)網(wǎng)絡(luò)
1.4.2 實(shí)例歸一化
1.4.3 語(yǔ)音特征梅爾譜圖
1.5 本文的主要研究?jī)?nèi)容
1.6 本文的章節(jié)結(jié)構(gòu)
第2章 基于非平行語(yǔ)料的多人語(yǔ)音轉(zhuǎn)換相關(guān)技術(shù)概述
2.1 引言
2.2 基于條件變分自編碼器的語(yǔ)音轉(zhuǎn)換方法
2.3 基于星型生成對(duì)抗網(wǎng)絡(luò)的語(yǔ)音轉(zhuǎn)換方法
2.4 基于自編碼器重構(gòu)損失的語(yǔ)音轉(zhuǎn)換方法
2.5 本章小結(jié)
第3章 基于多說(shuō)話(huà)人博弈的語(yǔ)音轉(zhuǎn)換方法
3.1 引言
3.2 基于輔助分類(lèi)器生成對(duì)抗網(wǎng)絡(luò)的語(yǔ)音轉(zhuǎn)換
3.3 基于多說(shuō)話(huà)人博弈的輔助分類(lèi)器生成對(duì)抗網(wǎng)絡(luò)的語(yǔ)音轉(zhuǎn)換
3.4 基于類(lèi)最大化激活與譜歸一化的生成對(duì)抗網(wǎng)絡(luò)的語(yǔ)音轉(zhuǎn)換
3.4.1 基于類(lèi)最大化激活的條件轉(zhuǎn)換損失
3.4.2 基于譜歸一化的約束
3.5 實(shí)驗(yàn)
3.5.1 實(shí)驗(yàn)數(shù)據(jù)集介紹
3.5.2 評(píng)價(jià)指標(biāo)
3.5.3 模型參數(shù)介紹
3.5.4 實(shí)驗(yàn)設(shè)置介紹
3.5.5 實(shí)驗(yàn)結(jié)果及分析
3.6 本章小結(jié)
第4章 基于自注意力機(jī)制與知識(shí)遷移的語(yǔ)音轉(zhuǎn)換方法
4.1 引言
4.2 基于自注意力機(jī)制的語(yǔ)音轉(zhuǎn)換方法
4.3 基于說(shuō)話(huà)人聲紋遷移的語(yǔ)音轉(zhuǎn)換方法
4.4 基于可遷移聲碼器的語(yǔ)音轉(zhuǎn)換方法
4.5 實(shí)驗(yàn)
4.5.1 模型參數(shù)介紹
4.5.2 實(shí)驗(yàn)設(shè)置介紹
4.5.3 實(shí)驗(yàn)結(jié)果及分析
4.6 本章小結(jié)
結(jié)論
參考文獻(xiàn)
攻讀碩士學(xué)位期間發(fā)表的論文及其它成果
致謝
本文編號(hào):3835476
【文章頁(yè)數(shù)】:63 頁(yè)
【學(xué)位級(jí)別】:碩士
【文章目錄】:
摘要
ABSTRACT
第1章 緒論
1.1 課題來(lái)源
1.2 課題研究的目的及意義
1.3 國(guó)內(nèi)外相關(guān)技術(shù)研究現(xiàn)狀
1.3.1 語(yǔ)音轉(zhuǎn)換的研究現(xiàn)狀
1.3.2 聲碼器的研究現(xiàn)狀
1.4 相關(guān)基本技術(shù)
1.4.1 卷積神經(jīng)網(wǎng)絡(luò)
1.4.2 實(shí)例歸一化
1.4.3 語(yǔ)音特征梅爾譜圖
1.5 本文的主要研究?jī)?nèi)容
1.6 本文的章節(jié)結(jié)構(gòu)
第2章 基于非平行語(yǔ)料的多人語(yǔ)音轉(zhuǎn)換相關(guān)技術(shù)概述
2.1 引言
2.2 基于條件變分自編碼器的語(yǔ)音轉(zhuǎn)換方法
2.3 基于星型生成對(duì)抗網(wǎng)絡(luò)的語(yǔ)音轉(zhuǎn)換方法
2.4 基于自編碼器重構(gòu)損失的語(yǔ)音轉(zhuǎn)換方法
2.5 本章小結(jié)
第3章 基于多說(shuō)話(huà)人博弈的語(yǔ)音轉(zhuǎn)換方法
3.1 引言
3.2 基于輔助分類(lèi)器生成對(duì)抗網(wǎng)絡(luò)的語(yǔ)音轉(zhuǎn)換
3.3 基于多說(shuō)話(huà)人博弈的輔助分類(lèi)器生成對(duì)抗網(wǎng)絡(luò)的語(yǔ)音轉(zhuǎn)換
3.4 基于類(lèi)最大化激活與譜歸一化的生成對(duì)抗網(wǎng)絡(luò)的語(yǔ)音轉(zhuǎn)換
3.4.1 基于類(lèi)最大化激活的條件轉(zhuǎn)換損失
3.4.2 基于譜歸一化的約束
3.5 實(shí)驗(yàn)
3.5.1 實(shí)驗(yàn)數(shù)據(jù)集介紹
3.5.2 評(píng)價(jià)指標(biāo)
3.5.3 模型參數(shù)介紹
3.5.4 實(shí)驗(yàn)設(shè)置介紹
3.5.5 實(shí)驗(yàn)結(jié)果及分析
3.6 本章小結(jié)
第4章 基于自注意力機(jī)制與知識(shí)遷移的語(yǔ)音轉(zhuǎn)換方法
4.1 引言
4.2 基于自注意力機(jī)制的語(yǔ)音轉(zhuǎn)換方法
4.3 基于說(shuō)話(huà)人聲紋遷移的語(yǔ)音轉(zhuǎn)換方法
4.4 基于可遷移聲碼器的語(yǔ)音轉(zhuǎn)換方法
4.5 實(shí)驗(yàn)
4.5.1 模型參數(shù)介紹
4.5.2 實(shí)驗(yàn)設(shè)置介紹
4.5.3 實(shí)驗(yàn)結(jié)果及分析
4.6 本章小結(jié)
結(jié)論
參考文獻(xiàn)
攻讀碩士學(xué)位期間發(fā)表的論文及其它成果
致謝
本文編號(hào):3835476
本文鏈接:http://sikaile.net/kejilunwen/xinxigongchenglunwen/3835476.html
最近更新
教材專(zhuān)著