天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁(yè) > 碩博論文 > 信息類博士論文 >

基于統(tǒng)計(jì)模型的漢語歌聲合成研究

發(fā)布時(shí)間:2017-05-19 01:02

  本文關(guān)鍵詞:基于統(tǒng)計(jì)模型的漢語歌聲合成研究,,由筆耕文化傳播整理發(fā)布。


【摘要】:所謂歌聲是指人類有意識(shí)地通過控制自身聲帶的振動(dòng)和口腔、鼻腔等發(fā)音器官的形變而發(fā)出的有樂感的聲音,而歌聲合成則是指利用語音合成相關(guān)技術(shù)讓計(jì)算機(jī)合成出模擬人的歌唱聲。隨著基于統(tǒng)計(jì)模型的語音合成技術(shù)的快速發(fā)展和逐漸成熟,尤其基于隱馬爾科夫模型的方法取得了最多的關(guān)注和最為充分的進(jìn)展。2006年左右上述基于統(tǒng)計(jì)模型的語音合成技術(shù)開始被用于歌聲合成,并取得了不錯(cuò)的結(jié)果。由于所述方法具有所需語料數(shù)據(jù)少、語料標(biāo)注的自動(dòng)化程度高等諸多優(yōu)點(diǎn),使其的可用性大大增加,引起了眾多學(xué)者的廣泛關(guān)注。本文以歌聲合成為主要研究目標(biāo),重點(diǎn)研究基于統(tǒng)計(jì)模型的歌聲合成算法,并在此基礎(chǔ)上構(gòu)建一個(gè)可以從輸入樂譜、歌詞和歌唱人的個(gè)性化歌唱特征直接輸出個(gè)性化歌聲的歌聲合成系統(tǒng)。本文的主要貢獻(xiàn)和創(chuàng)新點(diǎn)如下:1.為了給個(gè)性化歌聲合成提供充分和優(yōu)質(zhì)的歌聲數(shù)據(jù),自主設(shè)計(jì)了歌聲錄制方案,并依據(jù)該方案錄制了包含210張樂譜,共132分鐘的歌聲數(shù)據(jù)庫(kù),為構(gòu)建歌唱合成系統(tǒng)奠定了可靠的數(shù)據(jù)基礎(chǔ)。2.以上述歌聲數(shù)據(jù)庫(kù)為基礎(chǔ),利用基于統(tǒng)計(jì)模型的語音合成相關(guān)技術(shù)構(gòu)建了一套完整的歌聲合成系統(tǒng)。所構(gòu)建的系統(tǒng)能夠合成出適度音強(qiáng)、精準(zhǔn)音高和節(jié)奏以及個(gè)性化音色的歌唱聲。對(duì)比實(shí)驗(yàn)結(jié)果表明,利用本文方法所合成的歌聲在質(zhì)量和表現(xiàn)力上均取得了與目前世界上公認(rèn)最好的參數(shù)合成法(日語)相當(dāng)?shù)慕Y(jié)果。3.結(jié)合歌聲的基頻的特點(diǎn),提出了一系列的改進(jìn)的基頻模型!め槍(duì)歌聲基頻存在的數(shù)據(jù)稀疏問題,提出了參考樂譜的基頻引導(dǎo)方法。該方法將樂譜中包含的基頻信息引入到歌聲基頻的生成算法中,避免了因數(shù)據(jù)稀疏而造成的合成音高在時(shí)間和頻譜結(jié)構(gòu)上出現(xiàn)偏差的問題,可以合成出與樂譜相一致的具有精準(zhǔn)音高的基頻!(duì)真實(shí)基頻和樂譜基頻之間可能存在差異的問題進(jìn)行了研究,提出了在訓(xùn)練中也考慮樂譜基頻因素從而準(zhǔn)確得到兩者之間的差值的方法。利用該方法可以得到相比樂譜基頻引導(dǎo)方法更加準(zhǔn)確和真實(shí)的基頻估計(jì)。上述方法也可用于連音符的合成。·提出了結(jié)合兩個(gè)不同時(shí)間尺度的統(tǒng)計(jì)模型來合成歌唱基頻的方法。該方法結(jié)合了狀態(tài)與音節(jié)兩個(gè)不同時(shí)間尺度的模型以克服合成歌唱基頻時(shí)存在的過平滑現(xiàn)象,從而合成出表現(xiàn)力更強(qiáng)的基頻!ぬ岢隽藢⑻暨x出的真實(shí)單元進(jìn)行拼接的基頻合成方法。該方法將基頻的形狀曲線和顫音曲線分開處理。其中,顫音以音符為單位進(jìn)行建模,大大提高了所合成顫音的正確性。實(shí)驗(yàn)結(jié)果表明,基于真實(shí)單元的拼接方法可顯著提高所合成基頻的真實(shí)感和表現(xiàn)力。4.提出了基于統(tǒng)計(jì)模型的情感韻律轉(zhuǎn)換方法。該方法可以利用一個(gè)較小的情感語音數(shù)據(jù)庫(kù),生成具備情感表達(dá)能力的語音。5.提出了一個(gè)利用幀間相關(guān)性實(shí)現(xiàn)音質(zhì)轉(zhuǎn)換的方法,并將其用于歌者轉(zhuǎn)換。所述幀間相關(guān)性使用混合高斯模型框架下的自回歸模型進(jìn)行度量。該方法適用于具有低延時(shí)的應(yīng)用場(chǎng)合。
【關(guān)鍵詞】:歌聲 歌聲合成 音樂四要素 歌聲數(shù)據(jù)庫(kù) 隱馬爾科夫模型 混合高斯模型
【學(xué)位授予單位】:中國(guó)科學(xué)技術(shù)大學(xué)
【學(xué)位級(jí)別】:博士
【學(xué)位授予年份】:2015
【分類號(hào)】:TN912.3
【目錄】:
  • 摘要5-7
  • ABSTRACT7-15
  • 第一章 緒論15-27
  • 1.1 歌聲合成的研究背景15-18
  • 1.1.1 概述15-16
  • 1.1.2 歌聲合成的原理16-18
  • 1.2 歌聲合成的研究歷史和現(xiàn)狀18-23
  • 1.2.1 歌聲合成模型18-20
  • 1.2.2 早期的歌聲合成系統(tǒng)20
  • 1.2.3 歌聲合成研究現(xiàn)狀20-23
  • 1.3 本文研究?jī)?nèi)容和論文結(jié)構(gòu)23-27
  • 第二章 基于統(tǒng)計(jì)模型的歌聲合成研究概述27-41
  • 2.1 隱馬爾科夫模型27-28
  • 2.1.1 馬爾科夫鏈27
  • 2.1.2 隱馬爾科夫模型27-28
  • 2.2 基于隱馬爾科夫模型的聲音合成框架28-32
  • 2.2.1 建模尺度28
  • 2.2.2 模型結(jié)構(gòu)28-29
  • 2.2.3 特征提取29
  • 2.2.4 模型訓(xùn)練階段29-31
  • 2.2.5 聲音合成階段31-32
  • 2.3 歌聲合成的特點(diǎn)32-34
  • 2.3.1 歌聲的時(shí)長(zhǎng)與樂譜的關(guān)系32-33
  • 2.3.2 歌聲的基頻與樂譜的關(guān)系33-34
  • 2.4 時(shí)間模型34
  • 2.5 基頻稀疏問題34-36
  • 2.5.1 偽基頻訓(xùn)練34-35
  • 2.5.2 實(shí)際基頻與樂譜差值建模35-36
  • 2.6 顫音建模36-37
  • 2.7 歌聲合成的評(píng)價(jià)方式37-38
  • 2.8 本章小結(jié)38-41
  • 第三章 歌聲庫(kù)的建立41-53
  • 3.1 歌聲庫(kù)設(shè)計(jì)與錄制41-46
  • 3.1.1 曲目選擇41-42
  • 3.1.2 樂譜文件格式42-46
  • 3.1.3 歌聲庫(kù)信息總覽46
  • 3.2 樂譜分析46-50
  • 3.3 基線系統(tǒng)搭建50-51
  • 3.4 本章小結(jié)51-53
  • 第四章 歌聲基頻生成方法53-73
  • 4.1 本章概述53-54
  • 4.2 基于樂譜基頻引導(dǎo)的基頻生成方法54-59
  • 4.2.1 調(diào)名歸一化54-55
  • 4.2.2 樂譜基頻引導(dǎo)55
  • 4.2.3 實(shí)驗(yàn)結(jié)果55-59
  • 4.3 聯(lián)合音節(jié)和狀態(tài)層次模型的基頻生成59-70
  • 4.3.1 存在的問題59-60
  • 4.3.2 系統(tǒng)框架60
  • 4.3.3 DF0模型60-62
  • 4.3.4 音節(jié)層模型62-63
  • 4.3.5 聯(lián)合兩個(gè)層次的基頻生成63-65
  • 4.3.6 實(shí)驗(yàn)65-70
  • 4.4 本章小結(jié)70-73
  • 第五章 有表現(xiàn)力的歌聲及語音合成73-93
  • 5.1 有表現(xiàn)力的歌聲合成73-81
  • 5.1.1 相關(guān)工作73-74
  • 5.1.2 基頻分解74
  • 5.1.3 特征參數(shù)74-76
  • 5.1.4 建模76-77
  • 5.1.5 單元挑選及拼接77-78
  • 5.1.6 實(shí)驗(yàn)78-79
  • 5.1.7 小結(jié)79-81
  • 5.2 具備情感表達(dá)能力的語音轉(zhuǎn)換81-93
  • 5.2.1 引言81-82
  • 5.2.2 韻律轉(zhuǎn)換框架82-83
  • 5.2.3 基頻參數(shù)化83-85
  • 5.2.4 基頻轉(zhuǎn)換85-87
  • 5.2.5 時(shí)長(zhǎng)轉(zhuǎn)換87-88
  • 5.2.6 實(shí)驗(yàn)設(shè)計(jì)與結(jié)果88-92
  • 5.2.7 小結(jié)92-93
  • 第六章 歌者轉(zhuǎn)換93-105
  • 6.1 概述93
  • 6.2 基于GMM的音質(zhì)轉(zhuǎn)換93-95
  • 6.3 GMM-AR95-98
  • 6.3.1 模型細(xì)節(jié)95-96
  • 6.3.2 模型參數(shù)估計(jì)96-97
  • 6.3.3 最大似然轉(zhuǎn)換方法97-98
  • 6.4 實(shí)驗(yàn)98-100
  • 6.4.1 實(shí)驗(yàn)條件98
  • 6.4.2 客觀準(zhǔn)則98-99
  • 6.4.3 實(shí)驗(yàn)結(jié)果99-100
  • 6.5 改進(jìn)模型100-101
  • 6.6 實(shí)驗(yàn)101-102
  • 6.7 小結(jié)102-105
  • 第七章 總結(jié)與展望105-109
  • 參考文獻(xiàn)109-117
  • 致謝117-119
  • 在讀期間發(fā)表的學(xué)術(shù)論文119

【相似文獻(xiàn)】

中國(guó)期刊全文數(shù)據(jù)庫(kù) 前10條

1 夏新華,潘志庚;基于統(tǒng)計(jì)模型的海水運(yùn)動(dòng)仿真[J];計(jì)算機(jī)仿真;2005年01期

2 趙培東;謝劍英;;圖像小波域局部統(tǒng)計(jì)模型的擬合優(yōu)度檢驗(yàn)[J];應(yīng)用概率統(tǒng)計(jì);2008年06期

3 朱青;;Mathematica軟件在工業(yè)統(tǒng)計(jì)模型中的應(yīng)用研究[J];電子技術(shù);2012年06期

4 曾建軍;統(tǒng)計(jì)模型的計(jì)算機(jī)模擬教學(xué)系統(tǒng)[J];安徽大學(xué)學(xué)報(bào)(自然科學(xué)版);1997年02期

5 董軍;徐淼;潘云鶴;;基于統(tǒng)計(jì)模型的書法創(chuàng)作模擬[J];計(jì)算機(jī)學(xué)報(bào);2008年07期

6 駱楨軒;;組合統(tǒng)計(jì)模型在程序錯(cuò)誤定位中的應(yīng)用[J];計(jì)算機(jī)工程與設(shè)計(jì);2010年19期

7 朱忠林;丁輝;王廣志;;利用可變形統(tǒng)計(jì)模型進(jìn)行膝關(guān)節(jié)建模與運(yùn)動(dòng)測(cè)量[J];清華大學(xué)學(xué)報(bào)(自然科學(xué)版);2013年01期

8 彭嘉雄;張?zhí)煨?;隨機(jī)離散圖象的統(tǒng)計(jì)模型研究[J];自動(dòng)化學(xué)報(bào);1984年01期

9 許小劍,黃培康;一種新的雷達(dá)目標(biāo)散射截面統(tǒng)計(jì)模型[J];系統(tǒng)工程與電子技術(shù);1990年02期

10 季玲玲;陳浩;張曄;;基于統(tǒng)計(jì)模型預(yù)測(cè)截?cái)嗟拇a率控制算法[J];計(jì)算機(jī)工程;2008年18期

中國(guó)重要會(huì)議論文全文數(shù)據(jù)庫(kù) 前10條

1 陽(yáng)德青;肖仰華;汪衛(wèi);;基于統(tǒng)計(jì)模型的社會(huì)網(wǎng)絡(luò)群體關(guān)注度的分析與預(yù)測(cè)[A];NDBC2010第27屆中國(guó)數(shù)據(jù)庫(kù)學(xué)術(shù)會(huì)議論文集(B輯)[C];2010年

2 蔣丹寧;秦勇;劉文;劉義;;基于統(tǒng)計(jì)模型的哼唱旋律識(shí)別算法[A];第九屆全國(guó)人機(jī)語音通訊學(xué)術(shù)會(huì)議論文集[C];2007年

3 陳永勝;劉小明;任福田;張黔芳;;道路安全設(shè)計(jì)支持平臺(tái)之統(tǒng)計(jì)模型的研究[A];第七次城市道路與交通工程學(xué)術(shù)會(huì)議論文集[C];2002年

4 嚴(yán)力蛟;全為民;趙曉慧;;千島湖浮游植物統(tǒng)計(jì)模型及其預(yù)測(cè)[A];浙江省第二屆生物多樣性保護(hù)與可持續(xù)發(fā)展研討會(huì)論文摘要集[C];2004年

5 劉晶晶;衛(wèi)水愛;孫俊君;胡海云;邢修三;;生物材料的非平衡統(tǒng)計(jì)模型[A];中國(guó)力學(xué)學(xué)會(huì)學(xué)術(shù)大會(huì)'2005論文摘要集(上)[C];2005年

6 高山;張艷;徐波;宗成慶;韓兆兵;;基于三元統(tǒng)計(jì)模型的漢語分詞及標(biāo)注一體化研究[A];自然語言理解與機(jī)器翻譯——全國(guó)第六屆計(jì)算語言學(xué)聯(lián)合學(xué)術(shù)會(huì)議論文集[C];2001年

7 彭T3忠謀;;訓(xùn)練用漢語語音資料之音素標(biāo)示[A];第四屆全國(guó)人機(jī)語音通訊學(xué)術(shù)會(huì)議論文集[C];1996年

8 信飛;孫國(guó)武;陳伯民;;自回歸統(tǒng)計(jì)模型在延伸期預(yù)報(bào)中的應(yīng)用[A];第六屆長(zhǎng)三角氣象科技論壇論文集[C];2009年

9 胡振濤;劉先省;;機(jī)動(dòng)目標(biāo)跟蹤的一種改進(jìn)多傳感器數(shù)據(jù)融合算法[A];第二十四屆中國(guó)控制會(huì)議論文集(下冊(cè))[C];2005年

10 張本愛;莫俊永;張玉蘭;劉海燕;;任意自旋粒子的一種改進(jìn)光學(xué)統(tǒng)計(jì)模型[A];第八屆全國(guó)核物理會(huì)議文摘集(上冊(cè))[C];1991年

中國(guó)重要報(bào)紙全文數(shù)據(jù)庫(kù) 前5條

1 葛新權(quán) 北京信息科技大學(xué)經(jīng)濟(jì)管理學(xué)院;經(jīng)濟(jì)統(tǒng)計(jì)模型的建模原則與創(chuàng)新[N];中國(guó)社會(huì)科學(xué)報(bào);2010年

2 李傳金;設(shè)計(jì)新的統(tǒng)計(jì)模型[N];經(jīng)濟(jì)視點(diǎn)報(bào);2006年

3 沈

本文編號(hào):377446


資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/shoufeilunwen/xxkjbs/377446.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶9ec0f***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com