基于隱變量模型的歌曲轉(zhuǎn)換方法研究
發(fā)布時間:2017-05-04 09:00
本文關(guān)鍵詞:基于隱變量模型的歌曲轉(zhuǎn)換方法研究,由筆耕文化傳播整理發(fā)布。
【摘要】:語音轉(zhuǎn)換技術(shù)(Voice Conversion)是語音信號處理的一個重要分支,近幾年國內(nèi)外研究學(xué)者在該領(lǐng)域取得了許多研究成果。本文研究內(nèi)容就是要將語音轉(zhuǎn)換技術(shù)應(yīng)用到歌聲轉(zhuǎn)換領(lǐng)域,通過改變源唱歌人的語音個性特征使其聽起來像目標(biāo)唱歌人在唱歌,同時維持歌曲內(nèi)容不變。歌聲轉(zhuǎn)換技術(shù)將在電影配音、生理學(xué)、智能人機(jī)交互和生活娛樂等方面均有廣闊前景。目前主流的語音轉(zhuǎn)換方法關(guān)注于建立源和目標(biāo)說話人的語音個性特征映射關(guān)系,通過這種映射關(guān)系建立語音轉(zhuǎn)換模型。因此語音個性特征的表征和提取就成了決定模型好壞的關(guān)鍵。本文在對歌聲中語音信號特征表征深入研究的基礎(chǔ)上,研究了兩種歌曲轉(zhuǎn)換模型:(1)本文構(gòu)建一種隱變量模型(Latent Variable Model,LVM)將歌曲分解成表示語義的內(nèi)容信息參數(shù)矩陣和體現(xiàn)唱歌人個性特征信息參數(shù)矩陣,采用個性特征信息參數(shù)矩陣替換的方法轉(zhuǎn)換唱歌人個性特征信息;(2)本文設(shè)計了一種基于深度神經(jīng)網(wǎng)絡(luò)(Deep Belief Networks,DBN)模型歌曲轉(zhuǎn)換方法。首先分別用提取出的源唱歌人和目標(biāo)唱歌人語音頻譜參數(shù)來訓(xùn)練DBN,分別得到其在高階空間的語音個性特征表征;然后通過人工神經(jīng)網(wǎng)絡(luò)(Artificial Neural Networks ANN)來連接這兩個高階空間并進(jìn)行特征轉(zhuǎn)換;最后使用基于目標(biāo)唱歌人數(shù)據(jù)訓(xùn)練出的DBN來對轉(zhuǎn)換后的特征信息進(jìn)行逆處理得到語音頻譜參數(shù),合成轉(zhuǎn)換后的語音。同時,本文進(jìn)行了實驗以對上述兩種算法轉(zhuǎn)換性能進(jìn)行分析,實驗表明歌聲轉(zhuǎn)換的是具有可行性的。
【關(guān)鍵詞】:歌聲轉(zhuǎn)換 隱變量模型 深度信念網(wǎng)絡(luò)模型 語音個性特征
【學(xué)位授予單位】:西安建筑科技大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2015
【分類號】:TN912.3
【目錄】:
- 摘要3-4
- Abstract4-7
- 第一章 緒論7-11
- 1.1 課題研究背景7
- 1.2 課題研究的目的及意義7-8
- 1.3 國內(nèi)外研究現(xiàn)狀8-10
- 1.4 本文主要研究內(nèi)容10
- 1.5 本章小結(jié)10-11
- 第二章 語音轉(zhuǎn)換基本原理11-25
- 2.1 語音信號的產(chǎn)生機(jī)理11-13
- 2.2 語音信號的特征參數(shù)13-14
- 2.3 語音轉(zhuǎn)換的關(guān)鍵技術(shù)14-19
- 2.3.1 語音信號的預(yù)處理14-15
- 2.3.2 語音信號分析合成模型15-17
- 2.3.3 特征參數(shù)對齊17-18
- 2.3.4 語音庫設(shè)計18-19
- 2.4 語音轉(zhuǎn)換系統(tǒng)模型19-24
- 2.4.1 語音轉(zhuǎn)換系統(tǒng)結(jié)構(gòu)19-21
- 2.4.2 經(jīng)典語音轉(zhuǎn)換模型21-23
- 2.4.3 轉(zhuǎn)換效果的評價方法23-24
- 2.5 本章小結(jié)24-25
- 第三章基于隱變量模型的歌聲轉(zhuǎn)換方法25-35
- 3.1 隱變量模型的基本知識25-30
- 3.1.1 數(shù)據(jù)降維的意義25
- 3.1.2 隱變量模型介紹25-26
- 3.1.3 經(jīng)典隱變量模型26-30
- 3.2 基于隱變量模型的歌聲轉(zhuǎn)換算法30-32
- 3.2.1 雙因子隱變量模型30-31
- 3.2.2 基于隱變量模型的語音轉(zhuǎn)換方案31-32
- 3.3 實驗結(jié)果與分析32-34
- 3.4 本章小結(jié)34-35
- 第四章 基于深度信念網(wǎng)絡(luò)模型的歌聲轉(zhuǎn)換方法35-50
- 4.1 深度學(xué)習(xí)的基本知識35-40
- 4.1.1 深度學(xué)習(xí)發(fā)展歷史35-36
- 4.1.2 典型的深度學(xué)習(xí)結(jié)構(gòu)36-39
- 4.1.3 深度學(xué)習(xí)應(yīng)用39-40
- 4.2 基于DBN的歌聲轉(zhuǎn)換模型40-46
- 4.2.1 DBN的基本原理40-43
- 4.2.2 基于DBN的語音轉(zhuǎn)換算法43-44
- 4.2.3 基于DBN的歌聲轉(zhuǎn)換方案44-46
- 4.3 實驗結(jié)果與分析46-49
- 4.3.1 實驗設(shè)置46
- 4.3.2 轉(zhuǎn)換語音結(jié)果與分析46-49
- 4.4 本章小結(jié)49-50
- 第五章 總結(jié)與展望50-52
- 參考文獻(xiàn)52-55
- 攻讀碩士期間主要的研究成果55-56
- 致謝56
【參考文獻(xiàn)】
中國期刊全文數(shù)據(jù)庫 前1條
1 余凱;賈磊;陳雨強(qiáng);徐偉;;深度學(xué)習(xí)的昨天、今天和明天[J];計算機(jī)研究與發(fā)展;2013年09期
本文關(guān)鍵詞:基于隱變量模型的歌曲轉(zhuǎn)換方法研究,,由筆耕文化傳播整理發(fā)布。
本文編號:344739
本文鏈接:http://sikaile.net/kejilunwen/wltx/344739.html
最近更新
教材專著