基于HMM的單元挑選語音合成方法研究
本文關(guān)鍵詞:基于HMM的單元挑選語音合成方法研究
更多相關(guān)文章: 語音合成 隱馬爾可夫模型 基音同步疊加 波形拼接 自然度
【摘要】:語音合成即文語轉(zhuǎn)換(TTS)技術(shù),是智能語音交互方式的重要分支。在當(dāng)今這個(gè)快速發(fā)展的信息化社會(huì)中,人們普遍追求智能化的交互方式,其中語音合成技術(shù)已經(jīng)在一些應(yīng)用中廣泛使用,如智能汽車的導(dǎo)航系統(tǒng)、電子設(shè)備中的語音助手、盲人閱讀器等,這些應(yīng)用為人類的生活帶來無限方便。毋庸置疑,語音合成將在人們未來的生活中扮演非常重要的角色,但目前該技術(shù)在合成自然度方面與人們期望的目標(biāo)仍然有一定差距,影響了語音合成技術(shù)的進(jìn)一步發(fā)展,所以本文在研究語音合成的基礎(chǔ)上,對(duì)傳統(tǒng)的方法進(jìn)行改進(jìn)以提高合成語音的自然度。目前比較流行的兩種語音合成方法分別是:基于統(tǒng)計(jì)建模的語音合成和基于波形拼接的語音合成,這兩種方法各有優(yōu)缺點(diǎn),其中波形拼接合成方法得到的語音比較自然,非常接近人的原始聲音,而基于統(tǒng)計(jì)建模的合成方法具有快速構(gòu)建系統(tǒng),合成效果穩(wěn)定,存儲(chǔ)空間較小等優(yōu)點(diǎn),所以本文深入研究這兩種合成方法,結(jié)合二者的優(yōu)點(diǎn)進(jìn)行基于HMM的單元挑選語音合成方法的研究。在單元挑選準(zhǔn)則方面,傳統(tǒng)方法采用以幀為單位挑選語音幀單元,容易導(dǎo)致語音的連續(xù)性下降,同時(shí)算法的高復(fù)雜度也為實(shí)際應(yīng)用帶來不便,針對(duì)該不足本文將增大挑選單元的尺度,采用以聲韻母為單位進(jìn)行單元挑選,可以改善語音不連續(xù)的問題;在單元拼接過程中深入研究PSOLA算法,對(duì)傳統(tǒng)自相關(guān)函數(shù)法基音標(biāo)注產(chǎn)生的誤判進(jìn)行改進(jìn),采用中心削波函數(shù)與自相關(guān)函數(shù)相結(jié)合的方法實(shí)現(xiàn)基音提取,提高基音標(biāo)注的準(zhǔn)確度,此外為了簡化計(jì)算量以便提高程序的運(yùn)行效率,將中心削波函數(shù)改進(jìn)為三電平函數(shù);在單元拼接時(shí)由于拼接點(diǎn)之間出現(xiàn)的高頻噪聲對(duì)合成語音自然度影響較大,所以采取在拼接單元之間添加相應(yīng)的過渡單元來平滑拼接處的不連續(xù),以及在拼接過程中采用平滑算法進(jìn)一步平滑處理,旨在提高合成語音的流暢性及自然度。文章最后將基于HMM的單元挑選語音合成系統(tǒng)同基于波形拼接語音合成系統(tǒng)以及基于HMM參數(shù)語音合成系統(tǒng)作對(duì)比,并分別從主觀評(píng)價(jià)和客觀分析上對(duì)三個(gè)系統(tǒng)作定性以及定量比較,結(jié)果表明由基于HMM的單元挑選語音合成系統(tǒng)得到的語音自然度有所提高。
【學(xué)位授予單位】:西安工業(yè)大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2017
【分類號(hào)】:TN912.33
【相似文獻(xiàn)】
中國期刊全文數(shù)據(jù)庫 前10條
1 鄭騏;情感語音合成——研究現(xiàn)狀與發(fā)展[J];寧波廣播電視大學(xué)學(xué)報(bào);2005年03期
2 周海濤;;語音合成中多音字識(shí)別的實(shí)現(xiàn)[J];科技資訊;2008年11期
3 彭騰;孫萍;;基于C#語音合成的實(shí)現(xiàn)[J];電腦編程技巧與維護(hù);2010年12期
4 張世平;;會(huì)說四種話的語音合成卡——聲威一號(hào)[J];今日電子;1993年01期
5 趙建洋;;一種高效語音合成方法[J];電子技術(shù);1993年08期
6 馬義德,,張新國,羅長印;語音合成電路在我國的應(yīng)用前景[J];電子技術(shù);1994年12期
7 郝杰;語音合成:引領(lǐng)“耳朵經(jīng)濟(jì)”[J];中國電子商務(wù);2001年Z2期
8 羅三定,賈建華,沙莎;基于波形音頻段處理的中文語音合成研究[J];電腦與信息技術(shù);2002年01期
9 ;國內(nèi)語音合成領(lǐng)域?qū)@夹g(shù)發(fā)展趨勢[J];電子知識(shí)產(chǎn)權(quán);2003年10期
10 周潔,趙力,鄒采榮;情感語音合成的研究[J];電聲技術(shù);2005年10期
中國重要會(huì)議論文全文數(shù)據(jù)庫 前10條
1 楊靜;孫金城;;關(guān)于錄制語音合成數(shù)據(jù)庫的幾個(gè)問題[A];中國聲學(xué)學(xué)會(huì)2002年全國聲學(xué)學(xué)術(shù)會(huì)議論文集[C];2002年
2 徐俊;蔡蓮紅;吳志勇;;多語種語音合成平臺(tái)的設(shè)計(jì)與實(shí)現(xiàn)[A];第一屆建立和諧人機(jī)環(huán)境聯(lián)合學(xué)術(shù)會(huì)議(HHME2005)論文集[C];2005年
3 陳益強(qiáng);高文;王兆其;楊長水;姜大龍;;多模式語音合成[A];第六屆全國人機(jī)語音通訊學(xué)術(shù)會(huì)議論文集[C];2001年
4 陶建華;董宏輝;許曉穎;;情感語音合成的關(guān)鍵技術(shù)分析[A];第六屆全國現(xiàn)代語音學(xué)學(xué)術(shù)會(huì)議論文集(下)[C];2003年
5 劉東華;馮靜;力梅;;深圳市新一代“12121”語音合成業(yè)務(wù)系統(tǒng)[A];中國氣象學(xué)會(huì)2007年年會(huì)氣象軟科學(xué)論壇分會(huì)場論文集[C];2007年
6 黃小明;熊子瑜;;基于古音系統(tǒng)的漢語方言語音合成研究[A];第十二屆全國人機(jī)語音通訊學(xué)術(shù)會(huì)議(NCMMSC'2013)論文集[C];2013年
7 鄒煜;何偉;侯敏;滕永林;朱維彬;;面向語音合成的新聞播報(bào)語音庫構(gòu)建及其特殊韻律結(jié)構(gòu)[A];中國計(jì)算機(jī)語言學(xué)研究前沿進(jìn)展(2007-2009)[C];2009年
8 賀琳;張蕊;俞舸;;大規(guī)模語音合成語料庫的錄制及常見問題[A];中國聲學(xué)學(xué)會(huì)2002年全國聲學(xué)學(xué)術(shù)會(huì)議論文集[C];2002年
9 陶建華;康永國;;基于多元激勵(lì)的高質(zhì)量語音合成聲學(xué)模型[A];第七屆全國人機(jī)語音通訊學(xué)術(shù)會(huì)議(NCMMSC7)論文集[C];2003年
10 吳志勇;蔡蓮紅;蒙美玲;;可視語音合成中基于音視頻關(guān)聯(lián)模型的視位參數(shù)優(yōu)化[A];第八屆全國人機(jī)語音通訊學(xué)術(shù)會(huì)議論文集[C];2005年
中國重要報(bào)紙全文數(shù)據(jù)庫 前10條
1 記者 桂運(yùn)安;中科大11項(xiàng)語音合成指標(biāo)世界第一[N];安徽日報(bào);2014年
2 本報(bào)記者 何進(jìn)偉;語音合成露崢嶸[N];網(wǎng)絡(luò)世界;2001年
3 李羚;多語種語音合成助力數(shù)字奧運(yùn)[N];中國計(jì)算機(jī)報(bào);2003年
4 清華大學(xué)計(jì)算機(jī)系人機(jī)交互與媒體集成研究所 陶建華 蔡蓮紅;語音合成的應(yīng)用系統(tǒng)設(shè)計(jì)[N];計(jì)算機(jī)世界;2001年
5 ;嵌入式語音合成平臺(tái)[N];計(jì)算機(jī)世界;2002年
6 孫曉聞;語音合成 讓機(jī)器“像人一樣說話”[N];中國勞動(dòng)保障報(bào);2005年
7 ;新型語音合成軟件面世[N];人民郵電;2008年
8 炎黃新星公司供稿;炎黃之聲SinoSonic[N];計(jì)算機(jī)世界;2002年
9 劉權(quán);語音合成融入證券客服[N];中國計(jì)算機(jī)報(bào);2003年
10 ;語音產(chǎn)品走向開放式架構(gòu)[N];中國計(jì)算機(jī)報(bào);2004年
中國博士學(xué)位論文全文數(shù)據(jù)庫 前10條
1 高瑩瑩;面向情感語音合成的言語情感建模研究[D];北京交通大學(xué);2016年
2 高裴裴;人眼驅(qū)動(dòng)語音合成的若干關(guān)鍵技術(shù)研究[D];南開大學(xué);2012年
3 趙暉;真實(shí)感漢語可視語音合成關(guān)鍵技術(shù)研究[D];國防科學(xué)技術(shù)大學(xué);2010年
4 蘇莊鑾;情感語音合成[D];中國科學(xué)技術(shù)大學(xué);2006年
5 盧恒;基于統(tǒng)計(jì)模型與發(fā)音錯(cuò)誤檢測的語音合成方法研究[D];中國科學(xué)技術(shù)大學(xué);2011年
6 雷鳴;統(tǒng)計(jì)參數(shù)語音合成中的聲學(xué)模型建模方法研究[D];中國科學(xué)技術(shù)大學(xué);2012年
7 蔡明琦;融合發(fā)音機(jī)理的統(tǒng)計(jì)參數(shù)語音合成方法研究[D];中國科學(xué)技術(shù)大學(xué);2015年
8 凌震華;基于統(tǒng)計(jì)聲學(xué)建模的語音合成技術(shù)研究[D];中國科學(xué)技術(shù)大學(xué);2008年
9 楊辰雨;語音合成音庫自動(dòng)標(biāo)注方法研究[D];中國科學(xué)技術(shù)大學(xué);2014年
10 尉洪;漢語基元音素獨(dú)立分量譜分析對(duì)比及語音合成研究[D];云南大學(xué);2011年
中國碩士學(xué)位論文全文數(shù)據(jù)庫 前10條
1 王澤勛;多層次韻律和短時(shí)譜同步變換的情感語音合成[D];蘇州大學(xué);2015年
2 熊林云;基于ARM Cortex-M3的語音合成軟件系統(tǒng)設(shè)計(jì)與實(shí)現(xiàn)[D];電子科技大學(xué);2014年
3 章琴;基于HMM的中文情感語音合成的研究[D];合肥工業(yè)大學(xué);2014年
4 李冰潔;基于聲韻母的嵌入式語音合成[D];北京交通大學(xué);2016年
5 李煥君;個(gè)性化語音合成在船舶導(dǎo)航系統(tǒng)中應(yīng)用研究[D];大連海事大學(xué);2016年
6 馮歡;基于HMM的歌詞到歌聲轉(zhuǎn)換的研究[D];西北師范大學(xué);2015年
7 王海燕;漢藏雙語跨語言統(tǒng)計(jì)參數(shù)語音合成的研究[D];西北師范大學(xué);2015年
8 孫曉輝;結(jié)合聽感度量的語音合成方法研究[D];中國科學(xué)技術(shù)大學(xué);2016年
9 李翔凰;基于HMM-RBM的蒙古語語音合成研究[D];內(nèi)蒙古大學(xué);2016年
10 王雨蒙;英語文語轉(zhuǎn)換系統(tǒng)中的ToBl韻律自動(dòng)標(biāo)注方法與實(shí)現(xiàn)[D];云南大學(xué);2016年
本文編號(hào):1272189
本文鏈接:http://sikaile.net/shoufeilunwen/xixikjs/1272189.html