天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

基于HMM的中文情感語(yǔ)音合成的研究

發(fā)布時(shí)間:2019-10-12 13:47
【摘要】:語(yǔ)音是人類(lèi)最直接、最有效的交流方式。隨著計(jì)算機(jī)智能和情感計(jì)算的發(fā)展,人們對(duì)語(yǔ)音處理技術(shù)的要求越來(lái)越高。本文針對(duì)多樣化的語(yǔ)音,提出了基于HMM的語(yǔ)音合成方法,實(shí)現(xiàn)了系統(tǒng)的自動(dòng)訓(xùn)練與構(gòu)建。在此基礎(chǔ)上,研究了語(yǔ)音的情感分類(lèi)方法以及情感語(yǔ)音的特征分析,通過(guò)分析情感語(yǔ)音在基頻、時(shí)長(zhǎng)、能量和上下文等方面的特征,總結(jié)出情感語(yǔ)音和中性語(yǔ)句之間的關(guān)聯(lián)。為了合成出高質(zhì)量的情感語(yǔ)句,特別引入了PAD三維情感模型,將離散化的情感語(yǔ)音擴(kuò)展為可計(jì)算的量化語(yǔ)音。最后,通過(guò)語(yǔ)音合成器合成目標(biāo)情感語(yǔ)音。本文采用PAD情感狀態(tài)模型分析語(yǔ)音的情感特征,這為今后語(yǔ)音的情感處理研究提供了理論依據(jù)。通過(guò)Boosting-GMM算法來(lái)預(yù)測(cè)建模,為后續(xù)的目標(biāo)情感語(yǔ)音合成奠定了良好的實(shí)驗(yàn)基礎(chǔ)和分析依據(jù)。本文主要研究工作和研究成果如下:1.提出一種基于統(tǒng)計(jì)聲學(xué)模型的語(yǔ)音合成方法,建立了一個(gè)完整的可訓(xùn)練的語(yǔ)音合成系統(tǒng)框架。該系統(tǒng)對(duì)輸入的語(yǔ)音數(shù)據(jù)進(jìn)行聲學(xué)參數(shù)建模,并以訓(xùn)練得到的統(tǒng)計(jì)模型為基礎(chǔ)構(gòu)建相應(yīng)的合成系統(tǒng),能夠很好地滿(mǎn)足目前對(duì)多樣化和高表現(xiàn)力的語(yǔ)音合成需求。2.采用了PAD情感狀態(tài)模型對(duì)情感語(yǔ)音特征參數(shù)進(jìn)行了定量分析,得出不同情感狀態(tài)與PAD三個(gè)維度之間的映射關(guān)系,為后續(xù)的目標(biāo)情感語(yǔ)音合成提供了理論基礎(chǔ),提高了合成語(yǔ)音的音質(zhì)。3.通過(guò)Boosting-GMM算法進(jìn)行情感預(yù)測(cè)建模。針對(duì)實(shí)驗(yàn)中的四種目標(biāo)情感,建立四種弱預(yù)測(cè)模型。每個(gè)弱預(yù)測(cè)模型由一種基本的預(yù)測(cè)模型和其它輔助預(yù)測(cè)模型組成。實(shí)驗(yàn)對(duì)比了基于GMM和基于Boosting-GMM的特征預(yù)測(cè)模型的效果。由于Boosting-GMM實(shí)現(xiàn)了重新采樣的過(guò)程,在訓(xùn)練集中增大了包含大預(yù)測(cè)誤差的樣本比例,所以基于Boosting-GMM算法對(duì)于GMM算法的預(yù)測(cè)模型有更高的預(yù)測(cè)準(zhǔn)確率。最后通過(guò)預(yù)測(cè)模型得到的參數(shù)和STRAIGHT算法合成出目標(biāo)情感語(yǔ)音。實(shí)驗(yàn)表明,通過(guò)該方法合成的情感語(yǔ)音具有較好的音質(zhì)和自然度。
【圖文】:

情感,情感狀態(tài),維度


Fig邋3.1邋Emotion邋6NB口化55{011邋based邋011邋emotion邋wheel逡逑在連續(xù)空間中描述惰感的維度論中,還有一個(gè)重要的模型是由Cowie等研究逡逑者提出的激勵(lì)-評(píng)價(jià)(Activation—Evaluation邋)模型,如圖3.2所示,該模型認(rèn)為不同逡逑情感是不斷變化的,根據(jù)其在維度空間中的距離來(lái)體現(xiàn)不同的情感狀態(tài)。逡逑激勵(lì)-評(píng)價(jià)模型中包含兩個(gè)二維空間:激活度(Activation)和評(píng)價(jià)度逡逑(Evaluation邋)。激活度表示與情感狀態(tài)相關(guān)聯(lián)的機(jī)能激活程度,評(píng)價(jià)度表示其理論逡逑基礎(chǔ)來(lái)自于正負(fù)情感的分離程度。橫軸表示評(píng)價(jià)度,指引起情感的客觀(guān)事物評(píng)價(jià)逡逑23逡逑

分布情況,情感,均值,分布情況


圖3.邋4不同情感下F0范圍的分布逡逑Kg邋3.4邋Distribution邋for邋F0邋i*ange邋of邋diffei*ent邋emotions逡逑從w上圖表中分析得出,不同情感狀態(tài)下的基頻相關(guān)特性參數(shù)分布有很大的逡逑差異,離興情感下的F0的均值,F0最大值和最小值W及F0范圍明顯較大。驚奇逡逑的基頻均值較大,但基頻變化范圍不大。悲傷的基頻相關(guān)的特征參數(shù)都比中性語(yǔ)逡逑調(diào)的要小,基頻均值最低。對(duì)于生氣的情感語(yǔ)句,它的基頻均值和基頻變化范圍逡逑較大。男性的基頻相關(guān)特征參數(shù)在這幾種情感下均低于女性基頻相關(guān)參數(shù)。逡逑同時(shí),,由圖表可知,不同情感狀態(tài)下F0均值和F0最大值整體變化相對(duì)F0最逡逑小值較小,這意味F0均值和F0最大值比F0最小值更適合來(lái)描述情感語(yǔ)音的基頻逡逑特征。逡逑3.3.3情感語(yǔ)音的時(shí)長(zhǎng)分析逡逑對(duì)情感語(yǔ)音的時(shí)長(zhǎng)分析是通過(guò)語(yǔ)句的長(zhǎng)短來(lái)判斷相應(yīng)的情感類(lèi)型。計(jì)算的情逡逑感語(yǔ)句從語(yǔ)音數(shù)據(jù)開(kāi)始到結(jié)束的持續(xù)時(shí)間,也包括停頓的部分。實(shí)驗(yàn)中,我們直逡逑
【學(xué)位授予單位】:合肥工業(yè)大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2014
【分類(lèi)號(hào)】:TN912.3

【相似文獻(xiàn)】

相關(guān)期刊論文 前10條

1 周海濤;;語(yǔ)音合成中多音字識(shí)別的實(shí)現(xiàn)[J];科技資訊;2008年11期

2 彭騰;孫萍;;基于C#語(yǔ)音合成的實(shí)現(xiàn)[J];電腦編程技巧與維護(hù);2010年12期

3 張世平;;會(huì)說(shuō)四種話(huà)的語(yǔ)音合成卡——聲威一號(hào)[J];今日電子;1993年01期

4 趙建洋;;一種高效語(yǔ)音合成方法[J];電子技術(shù);1993年08期

5 馬義德,張新國(guó),羅長(zhǎng)印;語(yǔ)音合成電路在我國(guó)的應(yīng)用前景[J];電子技術(shù);1994年12期

6 郝杰;語(yǔ)音合成:引領(lǐng)“耳朵經(jīng)濟(jì)”[J];中國(guó)電子商務(wù);2001年Z2期

7 羅三定,賈建華,沙莎;基于波形音頻段處理的中文語(yǔ)音合成研究[J];電腦與信息技術(shù);2002年01期

8 ;國(guó)內(nèi)語(yǔ)音合成領(lǐng)域?qū)@夹g(shù)發(fā)展趨勢(shì)[J];電子知識(shí)產(chǎn)權(quán);2003年10期

9 周潔,趙力,鄒采榮;情感語(yǔ)音合成的研究[J];電聲技術(shù);2005年10期

10 王永生;柴佩琪;曾令平;;英語(yǔ)語(yǔ)音合成中基于約束樹(shù)的音節(jié)切分算法[J];微型電腦應(yīng)用;2005年11期

相關(guān)會(huì)議論文 前10條

1 楊靜;孫金城;;關(guān)于錄制語(yǔ)音合成數(shù)據(jù)庫(kù)的幾個(gè)問(wèn)題[A];中國(guó)聲學(xué)學(xué)會(huì)2002年全國(guó)聲學(xué)學(xué)術(shù)會(huì)議論文集[C];2002年

2 徐俊;蔡蓮紅;吳志勇;;多語(yǔ)種語(yǔ)音合成平臺(tái)的設(shè)計(jì)與實(shí)現(xiàn)[A];第一屆建立和諧人機(jī)環(huán)境聯(lián)合學(xué)術(shù)會(huì)議(HHME2005)論文集[C];2005年

3 陳益強(qiáng);高文;王兆其;楊長(zhǎng)水;姜大龍;;多模式語(yǔ)音合成[A];第六屆全國(guó)人機(jī)語(yǔ)音通訊學(xué)術(shù)會(huì)議論文集[C];2001年

4 陶建華;董宏輝;許曉穎;;情感語(yǔ)音合成的關(guān)鍵技術(shù)分析[A];第六屆全國(guó)現(xiàn)代語(yǔ)音學(xué)學(xué)術(shù)會(huì)議論文集(下)[C];2003年

5 劉東華;馮靜;力梅;;深圳市新一代“12121”語(yǔ)音合成業(yè)務(wù)系統(tǒng)[A];中國(guó)氣象學(xué)會(huì)2007年年會(huì)氣象軟科學(xué)論壇分會(huì)場(chǎng)論文集[C];2007年

6 黃小明;熊子瑜;;基于古音系統(tǒng)的漢語(yǔ)方言語(yǔ)音合成研究[A];第十二屆全國(guó)人機(jī)語(yǔ)音通訊學(xué)術(shù)會(huì)議(NCMMSC'2013)論文集[C];2013年

7 鄒煜;何偉;侯敏;滕永林;朱維彬;;面向語(yǔ)音合成的新聞播報(bào)語(yǔ)音庫(kù)構(gòu)建及其特殊韻律結(jié)構(gòu)[A];中國(guó)計(jì)算機(jī)語(yǔ)言學(xué)研究前沿進(jìn)展(2007-2009)[C];2009年

8 賀琳;張蕊;俞舸;;大規(guī)模語(yǔ)音合成語(yǔ)料庫(kù)的錄制及常見(jiàn)問(wèn)題[A];中國(guó)聲學(xué)學(xué)會(huì)2002年全國(guó)聲學(xué)學(xué)術(shù)會(huì)議論文集[C];2002年

9 陶建華;康永國(guó);;基于多元激勵(lì)的高質(zhì)量語(yǔ)音合成聲學(xué)模型[A];第七屆全國(guó)人機(jī)語(yǔ)音通訊學(xué)術(shù)會(huì)議(NCMMSC7)論文集[C];2003年

10 吳志勇;蔡蓮紅;蒙美玲;;可視語(yǔ)音合成中基于音視頻關(guān)聯(lián)模型的視位參數(shù)優(yōu)化[A];第八屆全國(guó)人機(jī)語(yǔ)音通訊學(xué)術(shù)會(huì)議論文集[C];2005年

相關(guān)重要報(bào)紙文章 前10條

1 記者 桂運(yùn)安;中科大11項(xiàng)語(yǔ)音合成指標(biāo)世界第一[N];安徽日?qǐng)?bào);2014年

2 本報(bào)記者 何進(jìn)偉;語(yǔ)音合成露崢嶸[N];網(wǎng)絡(luò)世界;2001年

3 李羚;多語(yǔ)種語(yǔ)音合成助力數(shù)字奧運(yùn)[N];中國(guó)計(jì)算機(jī)報(bào);2003年

4 清華大學(xué)計(jì)算機(jī)系人機(jī)交互與媒體集成研究所 陶建華 蔡蓮紅;語(yǔ)音合成的應(yīng)用系統(tǒng)設(shè)計(jì)[N];計(jì)算機(jī)世界;2001年

5 ;嵌入式語(yǔ)音合成平臺(tái)[N];計(jì)算機(jī)世界;2002年

6 孫曉聞;語(yǔ)音合成 讓機(jī)器“像人一樣說(shuō)話(huà)”[N];中國(guó)勞動(dòng)保障報(bào);2005年

7 ;新型語(yǔ)音合成軟件面世[N];人民郵電;2008年

8 炎黃新星公司供稿;炎黃之聲SinoSonic[N];計(jì)算機(jī)世界;2002年

9 劉權(quán);語(yǔ)音合成融入證券客服[N];中國(guó)計(jì)算機(jī)報(bào);2003年

10 ;語(yǔ)音產(chǎn)品走向開(kāi)放式架構(gòu)[N];中國(guó)計(jì)算機(jī)報(bào);2004年

相關(guān)博士學(xué)位論文 前9條

1 高裴裴;人眼驅(qū)動(dòng)語(yǔ)音合成的若干關(guān)鍵技術(shù)研究[D];南開(kāi)大學(xué);2012年

2 趙暉;真實(shí)感漢語(yǔ)可視語(yǔ)音合成關(guān)鍵技術(shù)研究[D];國(guó)防科學(xué)技術(shù)大學(xué);2010年

3 蘇莊鑾;情感語(yǔ)音合成[D];中國(guó)科學(xué)技術(shù)大學(xué);2006年

4 盧恒;基于統(tǒng)計(jì)模型與發(fā)音錯(cuò)誤檢測(cè)的語(yǔ)音合成方法研究[D];中國(guó)科學(xué)技術(shù)大學(xué);2011年

5 雷鳴;統(tǒng)計(jì)參數(shù)語(yǔ)音合成中的聲學(xué)模型建模方法研究[D];中國(guó)科學(xué)技術(shù)大學(xué);2012年

6 蔡明琦;融合發(fā)音機(jī)理的統(tǒng)計(jì)參數(shù)語(yǔ)音合成方法研究[D];中國(guó)科學(xué)技術(shù)大學(xué);2015年

7 凌震華;基于統(tǒng)計(jì)聲學(xué)建模的語(yǔ)音合成技術(shù)研究[D];中國(guó)科學(xué)技術(shù)大學(xué);2008年

8 楊辰雨;語(yǔ)音合成音庫(kù)自動(dòng)標(biāo)注方法研究[D];中國(guó)科學(xué)技術(shù)大學(xué);2014年

9 尉洪;漢語(yǔ)基元音素獨(dú)立分量譜分析對(duì)比及語(yǔ)音合成研究[D];云南大學(xué);2011年

相關(guān)碩士學(xué)位論文 前10條

1 王澤勛;多層次韻律和短時(shí)譜同步變換的情感語(yǔ)音合成[D];蘇州大學(xué);2015年

2 熊林云;基于ARM Cortex-M3的語(yǔ)音合成軟件系統(tǒng)設(shè)計(jì)與實(shí)現(xiàn)[D];電子科技大學(xué);2014年

3 章琴;基于HMM的中文情感語(yǔ)音合成的研究[D];合肥工業(yè)大學(xué);2014年

4 聶軍;基于HMM可訓(xùn)練的漢語(yǔ)語(yǔ)音合成系統(tǒng)[D];吉林大學(xué);2010年

5 曾一鳴;情感語(yǔ)音合成的研究和系統(tǒng)實(shí)現(xiàn)[D];上海交通大學(xué);2010年

6 劉航;基于隱馬爾可夫模型的跨語(yǔ)種語(yǔ)音合成方法研究[D];中國(guó)科學(xué)技術(shù)大學(xué);2011年

7 張桂香;個(gè)性化語(yǔ)音合成的研究與實(shí)現(xiàn)[D];哈爾濱工程大學(xué);2007年

8 胡瓊;基于隱馬爾科夫模型的天津方言語(yǔ)音合成[D];上海交通大學(xué);2011年

9 劉博;藏語(yǔ)拉薩方言的統(tǒng)計(jì)參數(shù)語(yǔ)音合成的研究[D];西北師范大學(xué);2012年

10 呂斌;嵌入式語(yǔ)音合成及其關(guān)鍵算法的研究與實(shí)現(xiàn)[D];西安電子科技大學(xué);2009年



本文編號(hào):2548093

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/wltx/2548093.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶(hù)47ca4***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com