基于聲韻母的嵌入式語音合成

發(fā)布時(shí)間：2017-03-30 06:07

本文關(guān)鍵詞：基于聲韻母的嵌入式語音合成，由筆耕文化傳播整理發(fā)布。

【摘要】：隨著人工智能的發(fā)展,嵌入式語音合成成為最自然的人機(jī)交互方式,擁有廣泛的應(yīng)用前景。目前,由于大規(guī)模的語音合成對運(yùn)算速度和存儲(chǔ)容量的要求較高,嵌入式設(shè)備在進(jìn)行語音合成時(shí),一部分采用網(wǎng)絡(luò)和云計(jì)算的方式,在離線狀態(tài)下不能使用,還有一部分自帶一個(gè)語音芯片,在離線狀態(tài)下可以進(jìn)行一些簡單的語音合成,但使用環(huán)境比較受限。此外,由于構(gòu)建大規(guī)模語料庫的工作量較為龐大,導(dǎo)致定制個(gè)性化語料庫成為了一個(gè)難題。鑒于大規(guī)模語料庫進(jìn)行語音合成時(shí)所帶來的種種問題,本文舍棄了大規(guī)模語料庫的主流思想,采用聲韻母作為合成基元,對連續(xù)語音段內(nèi)聲韻母進(jìn)行分割和篩選,最后語料庫中只保留適量的聲韻母樣本。這樣的處理方式在存儲(chǔ)空間、匹配調(diào)用以及定制個(gè)性化語料庫上都有很大的優(yōu)勢。本文基于聲韻母的語音合成主要完成了以下三方面的工作：(1)連續(xù)語音段內(nèi)聲韻母的分割：提出一種基于損失函數(shù)和聽覺譜邊界特征參數(shù)的連續(xù)語音段內(nèi)聲韻母分割的方法。首先建立自相關(guān)函數(shù)和代價(jià)損失函數(shù),采用動(dòng)態(tài)規(guī)劃方法進(jìn)行濁音的檢測,然后根據(jù)統(tǒng)計(jì)規(guī)律,在聲母段時(shí)長范圍內(nèi)檢測聽覺譜邊界特征參數(shù)參數(shù)的特征突變點(diǎn),進(jìn)行聲韻母分割。仿真實(shí)驗(yàn)結(jié)果表明,該分割方法減小了由于聲母發(fā)音方式、音變和噪聲對分割結(jié)果的影響,提高了聲韻母分割的準(zhǔn)確性。(2)建立聲韻母語料庫：設(shè)計(jì)語料庫中需要包含的聲母和韻母的樣本模型。首先針對不同聲韻母組合的協(xié)同發(fā)音規(guī)律,將聲韻母進(jìn)行分類,依此對語料庫中需要包含的內(nèi)容進(jìn)行設(shè)計(jì)。然后從連續(xù)語音段中提取這些聲韻母基元,進(jìn)行人工校對和修正。最后統(tǒng)一編輯命名,完成聲韻母語料庫的建立。(3)基于聲韻母的語音合成：改進(jìn)了時(shí)域基音同步疊加(Time Domain Pitch Synchronous Overlap Add, TD-PSOLA)的語音合成方法,使其適用在基于聲韻母的語音合成中。首先引入合成的韻律修改參數(shù),然后建立了字和詞的韻律模型,最后針對復(fù)雜的發(fā)音情況設(shè)計(jì)了一套韻律符號(hào)。仿真實(shí)驗(yàn)結(jié)果表明,該方法具有較高的準(zhǔn)確度和自然度。
【關(guān)鍵詞】：語音合成 TD-PSOLA 詞韻律模型 聲韻母分割 語料庫建立
【學(xué)位授予單位】：北京交通大學(xué)
【學(xué)位級(jí)別】：碩士
【學(xué)位授予年份】：2016
【分類號(hào)】：TN912.33
【目錄】：

致謝5-6
摘要6-7
ABSTRACT7-11
1 引言11-16
1.1 本文的研究背景11-12
1.2 國內(nèi)外研究現(xiàn)狀12-13
1.3 本文的研究內(nèi)容13-14
1.4 本文的研究意義14
1.5 本文的組織結(jié)構(gòu)14-16
2 連續(xù)語音段內(nèi)聲韻母的分割16-30
2.1 聲韻母的頻譜分析16-17
2.2 聲母的檢測范圍17-19
2.3 聲韻母分割的總體流程19-20
2.4 引入損失函數(shù)的濁音段檢測20-21
2.5 基于聽覺譜邊界特征參數(shù)的聲韻母分割21-25
2.5.1 聽覺感知模型21-24
2.5.2 聲韻母邊界特征參數(shù)的選取24
2.5.3 特征參數(shù)突變點(diǎn)的確定24-25
2.6 實(shí)驗(yàn)結(jié)果及分析25-29
2.6.1 各方法分割結(jié)果的對比25-27
2.6.2 噪聲的影響27-28
2.6.3 分割結(jié)果的修正28-29
2.7 小結(jié)29-30
3 聲韻母語料庫的建立30-36
3.1 語料庫內(nèi)容的設(shè)計(jì)30-32
3.2 語音單元的后期處理32-35
3.3 小結(jié)35-36
4 基于聲韻母的語音合成36-59
4.1 語音合成算法的研究36-43
4.1.1 共振峰合成法(Formant Synthesis)36-38
4.1.2 線性預(yù)測參數(shù)合成法(Linear Predictive Coding Synthesis)38-40
4.1.3 隱馬爾可夫模型合成法(HMM Synthesis)40-42
4.1.4 基音同步波形疊加法(Pitch Synchronous Over Lap Add)42-43
4.2 基于TD-PSOLA算法的聲韻母語音合成43-47
4.2.1 基音同步分析和標(biāo)注44
4.2.2 基音同步修改44-45
4.2.3 基音同步疊加45
4.2.4 韻律參數(shù)修改45-47
4.3 詞韻律模型的設(shè)計(jì)47-52
4.3.1 音高模型47-49
4.3.2 音長模型49-50
4.3.3 韻律符號(hào)模型50-52
4.4 實(shí)驗(yàn)結(jié)果及分析52-58
4.4.1 波形分析和譜分析52-57
4.4.2 主觀印象測試(Mean Opinion Score)57-58
4.5 小結(jié)58-59
5 總結(jié)與展望59-61
5.1 工作總結(jié)59-60
5.2 工作展望60-61
參考文獻(xiàn)61-64
作者簡歷及攻讀碩士學(xué)位期間取得的研究成果64-66
學(xué)位論文數(shù)據(jù)集66

【相似文獻(xiàn)】

中國期刊全文數(shù)據(jù)庫前10條

1 周海濤;;語音合成中多音字識(shí)別的實(shí)現(xiàn)[J];科技資訊;2008年11期

2 彭騰;孫萍;;基于C#語音合成的實(shí)現(xiàn)[J];電腦編程技巧與維護(hù);2010年12期

3 張世平;;會(huì)說四種話的語音合成卡——聲威一號(hào)[J];今日電子;1993年01期

4 趙建洋;;一種高效語音合成方法[J];電子技術(shù);1993年08期

5 馬義德，，張新國，羅長印;語音合成電路在我國的應(yīng)用前景[J];電子技術(shù);1994年12期

6 郝杰;語音合成:引領(lǐng)“耳朵經(jīng)濟(jì)”[J];中國電子商務(wù);2001年Z2期

7 羅三定,賈建華,沙莎;基于波形音頻段處理的中文語音合成研究[J];電腦與信息技術(shù);2002年01期

8 ;國內(nèi)語音合成領(lǐng)域?qū)＠夹g(shù)發(fā)展趨勢[J];電子知識(shí)產(chǎn)權(quán);2003年10期

9 周潔,趙力,鄒采榮;情感語音合成的研究[J];電聲技術(shù);2005年10期

10 王永生;柴佩琪;曾令平;;英語語音合成中基于約束樹的音節(jié)切分算法[J];微型電腦應(yīng)用;2005年11期

中國重要會(huì)議論文全文數(shù)據(jù)庫前10條

1 楊靜;孫金城;;關(guān)于錄制語音合成數(shù)據(jù)庫的幾個(gè)問題[A];中國聲學(xué)學(xué)會(huì)2002年全國聲學(xué)學(xué)術(shù)會(huì)議論文集[C];2002年

2 徐俊;蔡蓮紅;吳志勇;;多語種語音合成平臺(tái)的設(shè)計(jì)與實(shí)現(xiàn)[A];第一屆建立和諧人機(jī)環(huán)境聯(lián)合學(xué)術(shù)會(huì)議（HHME2005）論文集[C];2005年

3 陳益強(qiáng);高文;王兆其;楊長水;姜大龍;;多模式語音合成[A];第六屆全國人機(jī)語音通訊學(xué)術(shù)會(huì)議論文集[C];2001年

4 陶建華;董宏輝;許曉穎;;情感語音合成的關(guān)鍵技術(shù)分析[A];第六屆全國現(xiàn)代語音學(xué)學(xué)術(shù)會(huì)議論文集（下）[C];2003年

5 劉東華;馮靜;力梅;;深圳市新一代“12121”語音合成業(yè)務(wù)系統(tǒng)[A];中國氣象學(xué)會(huì)2007年年會(huì)氣象軟科學(xué)論壇分會(huì)場論文集[C];2007年

6 黃小明;熊子瑜;;基于古音系統(tǒng)的漢語方言語音合成研究[A];第十二屆全國人機(jī)語音通訊學(xué)術(shù)會(huì)議（NCMMSC'2013）論文集[C];2013年

7 鄒煜;何偉;侯敏;滕永林;朱維彬;;面向語音合成的新聞播報(bào)語音庫構(gòu)建及其特殊韻律結(jié)構(gòu)[A];中國計(jì)算機(jī)語言學(xué)研究前沿進(jìn)展（2007-2009）[C];2009年

8 賀琳;張蕊;俞舸;;大規(guī)模語音合成語料庫的錄制及常見問題[A];中國聲學(xué)學(xué)會(huì)2002年全國聲學(xué)學(xué)術(shù)會(huì)議論文集[C];2002年

9 陶建華;康永國;;基于多元激勵(lì)的高質(zhì)量語音合成聲學(xué)模型[A];第七屆全國人機(jī)語音通訊學(xué)術(shù)會(huì)議（NCMMSC7）論文集[C];2003年

10 吳志勇;蔡蓮紅;蒙美玲;;可視語音合成中基于音視頻關(guān)聯(lián)模型的視位參數(shù)優(yōu)化[A];第八屆全國人機(jī)語音通訊學(xué)術(shù)會(huì)議論文集[C];2005年

中國重要報(bào)紙全文數(shù)據(jù)庫前10條

1 記者桂運(yùn)安;中科大11項(xiàng)語音合成指標(biāo)世界第一[N];安徽日報(bào);2014年

2 本報(bào)記者何進(jìn)偉;語音合成露崢嶸[N];網(wǎng)絡(luò)世界;2001年

3 李羚;多語種語音合成助力數(shù)字奧運(yùn)[N];中國計(jì)算機(jī)報(bào);2003年

4 清華大學(xué)計(jì)算機(jī)系人機(jī)交互與媒體集成研究所陶建華蔡蓮紅;語音合成的應(yīng)用系統(tǒng)設(shè)計(jì)[N];計(jì)算機(jī)世界;2001年

5 ;嵌入式語音合成平臺(tái)[N];計(jì)算機(jī)世界;2002年

6 孫曉聞;語音合成讓機(jī)器“像人一樣說話”[N];中國勞動(dòng)保障報(bào);2005年

7 ;新型語音合成軟件面世[N];人民郵電;2008年

8 炎黃新星公司供稿;炎黃之聲SinoSonic[N];計(jì)算機(jī)世界;2002年

9 劉權(quán);語音合成融入證券客服[N];中國計(jì)算機(jī)報(bào);2003年

10 ;語音產(chǎn)品走向開放式架構(gòu)[N];中國計(jì)算機(jī)報(bào);2004年

中國博士學(xué)位論文全文數(shù)據(jù)庫前9條

1 高裴裴;人眼驅(qū)動(dòng)語音合成的若干關(guān)鍵技術(shù)研究[D];南開大學(xué);2012年

2 趙暉;真實(shí)感漢語可視語音合成關(guān)鍵技術(shù)研究[D];國防科學(xué)技術(shù)大學(xué);2010年

3 蘇莊鑾;情感語音合成[D];中國科學(xué)技術(shù)大學(xué);2006年

4 盧恒;基于統(tǒng)計(jì)模型與發(fā)音錯(cuò)誤檢測的語音合成方法研究[D];中國科學(xué)技術(shù)大學(xué);2011年

5 雷鳴;統(tǒng)計(jì)參數(shù)語音合成中的聲學(xué)模型建模方法研究[D];中國科學(xué)技術(shù)大學(xué);2012年

6 蔡明琦;融合發(fā)音機(jī)理的統(tǒng)計(jì)參數(shù)語音合成方法研究[D];中國科學(xué)技術(shù)大學(xué);2015年

7 凌震華;基于統(tǒng)計(jì)聲學(xué)建模的語音合成技術(shù)研究[D];中國科學(xué)技術(shù)大學(xué);2008年

8 楊辰雨;語音合成音庫自動(dòng)標(biāo)注方法研究[D];中國科學(xué)技術(shù)大學(xué);2014年

9 尉洪;漢語基元音素獨(dú)立分量譜分析對比及語音合成研究[D];云南大學(xué);2011年

中國碩士學(xué)位論文全文數(shù)據(jù)庫前10條

1 王澤勛;多層次韻律和短時(shí)譜同步變換的情感語音合成[D];蘇州大學(xué);2015年

2 熊林云;基于ARM Cortex-M3的語音合成軟件系統(tǒng)設(shè)計(jì)與實(shí)現(xiàn)[D];電子科技大學(xué);2014年

3 章琴;基于HMM的中文情感語音合成的研究[D];合肥工業(yè)大學(xué);2014年

4 李冰潔;基于聲韻母的嵌入式語音合成[D];北京交通大學(xué);2016年

5 聶軍;基于HMM可訓(xùn)練的漢語語音合成系統(tǒng)[D];吉林大學(xué);2010年

6 曾一鳴;情感語音合成的研究和系統(tǒng)實(shí)現(xiàn)[D];上海交通大學(xué);2010年

7 劉航;基于隱馬爾可夫模型的跨語種語音合成方法研究[D];中國科學(xué)技術(shù)大學(xué);2011年

8 張桂香;個(gè)性化語音合成的研究與實(shí)現(xiàn)[D];哈爾濱工程大學(xué);2007年

9 胡瓊;基于隱馬爾科夫模型的天津方言語音合成[D];上海交通大學(xué);2011年

10 劉博;藏語拉薩方言的統(tǒng)計(jì)參數(shù)語音合成的研究[D];西北師范大學(xué);2012年

本文關(guān)鍵詞：基于聲韻母的嵌入式語音合成，由筆耕文化傳播整理發(fā)布。

本文編號(hào)：276387

資料下載

論文發(fā)表

支付寶下載

Download by Alipay
微信下載

Download by Wechat
會(huì)員下載

Download by Member

本文鏈接：http://sikaile.net/kejilunwen/xinxigongchenglunwen/276387.html

上一篇：基于DSP和GPRS的無人船運(yùn)動(dòng)控制系統(tǒng)設(shè)計(jì)
下一篇：S頻段衛(wèi)星信道OFDM通信系統(tǒng)信道估計(jì)研究

論文發(fā)表

·知網(wǎng)|萬方|維普|龍?jiān)磡省級(jí)|國家級(jí)|科技核心|北大核心|南大核心CSSCI|EI|SCI|SSCI|

天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

基于聲韻母的嵌入式語音合成