天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

面向大語料庫的語音合成方法研究

發(fā)布時間:2018-01-11 00:32

  本文關(guān)鍵詞:面向大語料庫的語音合成方法研究 出處:《北京大學(xué)學(xué)報(自然科學(xué)版)》2014年05期  論文類型:期刊論文


  更多相關(guān)文章: 語音數(shù)據(jù)篩選 聲學(xué)模型訓(xùn)練 基于HMM的單元挑選與波形拼接


【摘要】:針對幾百小時粗標(biāo)注大語料庫,提出一種新穎的語音合成系統(tǒng)構(gòu)建方法。首先,借助于語音識別、文本對齊和句法分析等技術(shù)實(shí)現(xiàn)大語料庫的自動篩選與標(biāo)注。然后,為了有效解決大語料庫聲學(xué)模型訓(xùn)練中存在的內(nèi)存空間以及計(jì)算時間開銷過大等問題,優(yōu)化了傳統(tǒng)的訓(xùn)練流程,在不損失聲學(xué)模型準(zhǔn)確性的前提下,顯著提高了模型的訓(xùn)練速度。主觀實(shí)驗(yàn)表明,與具有精標(biāo)注的小語料庫相比,引入粗標(biāo)注的大語料庫可以帶來0.5分左右的MOS提升。
[Abstract]:A novel method of constructing speech synthesis system is proposed for hundreds of hours rough tagging large corpus. Firstly, speech recognition is used. Text alignment and syntactic analysis techniques can automatically screen and annotate large corpora. Then, in order to effectively solve the problems of memory space and excessive computational time in large corpus acoustic model training. The traditional training process is optimized and the training speed of the model is significantly improved without losing the accuracy of the acoustic model. The subjective experiment shows that compared with the small corpus with fine tagging. The introduction of a large corpus of coarse tagging can lead to a MOS upgrade of about 0. 5 minutes.
【作者單位】: 北京大學(xué)言語聽覺研究中心 機(jī)器感知與智能教育部重點(diǎn)實(shí)驗(yàn)室;
【基金】:國家自然科學(xué)基金(91120001,61121002) 國家社會科學(xué)基金重大項(xiàng)目(12&ZD119) 國家重點(diǎn)基礎(chǔ)研究發(fā)展計(jì)劃(2013CB329304)資助
【分類號】:TN912.3
【正文快照】: 語音合成是智能人機(jī)交互中必不可少的關(guān)鍵技術(shù),它讓計(jì)算機(jī)可以像人一樣具備說話能力。目前最流行的兩種方法是基于大語料庫的單元挑選與波形拼接方法[1]和基于隱馬爾科夫模型(HMM)的語音合成方法[2]。前者直接利用挑選出波形拼接得到合成語音,優(yōu)點(diǎn)是保持了原始發(fā)音人的音質(zhì),缺

【參考文獻(xiàn)】

相關(guān)期刊論文 前2條

1 曹劍芬;基于語法信息的漢語韻律結(jié)構(gòu)預(yù)測[J];中文信息學(xué)報;2003年03期

2 蔡蓮紅;崔丹丹;蔡銳;;漢語普通話語音合成語料庫TH-CoSS的建設(shè)和分析[J];中文信息學(xué)報;2007年02期

相關(guān)博士學(xué)位論文 前1條

1 凌震華;基于統(tǒng)計(jì)聲學(xué)建模的語音合成技術(shù)研究[D];中國科學(xué)技術(shù)大學(xué);2008年

【共引文獻(xiàn)】

相關(guān)期刊論文 前10條

1 郭淑妮;圖雅;斯琴高娃;;蒙古語語音合成語料庫的設(shè)計(jì)及韻律標(biāo)注規(guī)范的建立[J];電腦與電信;2012年03期

2 甘星超;陳毅東;;引入韻律結(jié)構(gòu)信息的層次短語模型改進(jìn)研究[J];電腦知識與技術(shù);2013年12期

3 錢揖麗;荀恩東;;基于分類回歸樹CART的漢語韻律短語邊界識別[J];計(jì)算機(jī)工程與應(yīng)用;2008年06期

4 姑麗加瑪麗·麥麥提艾力;艾斯卡爾·肉孜;艾斯卡爾·艾木都拉;;三音素模型的維吾爾語最佳文本選取算法[J];計(jì)算機(jī)工程與應(yīng)用;2009年18期

5 郭威彤;楊鴻武;梁青青;裴東;;普通話到西安話的韻律轉(zhuǎn)換[J];計(jì)算機(jī)工程與應(yīng)用;2011年16期

6 錢揖麗;荀恩東;宋柔;;基于SLM的二叉樹在語音停頓預(yù)測中的應(yīng)用[J];計(jì)算機(jī)工程;2006年19期

7 嚴(yán)志宇;趙欣如;王璐;謝簪;李嶠;譚軍華;;普通話測試語音信息庫的設(shè)計(jì)與實(shí)現(xiàn)[J];計(jì)算機(jī)時代;2010年03期

8 章森;劉磊;刁麓弘;;大規(guī)模語音語料庫及其在TTS中應(yīng)用的幾個問題[J];計(jì)算機(jī)學(xué)報;2010年04期

9 趙永貞 ,劉挺 ,王志偉 ,陳惠鵬 ,邵艷秋;漢語文語轉(zhuǎn)換系統(tǒng)中停頓指數(shù)的自動標(biāo)注[J];中文信息學(xué)報;2004年05期

10 劉浩杰;杜利民;;漢語韻律詞F0曲線的優(yōu)化[J];中文信息學(xué)報;2006年01期

相關(guān)博士學(xué)位論文 前10條

1 柳春;甘肅臨夏方言回腔語音格局研究[D];西北民族大學(xué);2010年

2 李鳳杰;漢英對比韻律系學(xué)中的若干問題[D];南開大學(xué);2010年

3 單振宇;情感說話人識別及其解決方法的研究[D];浙江大學(xué);2010年

4 尉洪;漢語基元音素獨(dú)立分量譜分析對比及語音合成研究[D];云南大學(xué);2011年

5 李冬冬;基于拓展和聚類的情感魯棒說話人識別研究[D];浙江大學(xué);2008年

6 孫愛珍;計(jì)算文體學(xué)工作模式探究[D];河南大學(xué);2008年

7 黃平牧;中文TTS系統(tǒng)中若干關(guān)鍵技術(shù)研究[D];北京郵電大學(xué);2008年

8 敖敏;基于韻律的蒙古語語音合成研究[D];內(nèi)蒙古大學(xué);2012年

9 宋時黃;韓國學(xué)生漢語簡單介紹句韻律研究[D];北京大學(xué);2013年

10 陳釩;語言節(jié)奏提取及其在文本分析中的應(yīng)用[D];天津大學(xué);2011年

相關(guān)碩士學(xué)位論文 前10條

1 左石凱;語音合成算法研究與FPGA實(shí)現(xiàn)[D];哈爾濱理工大學(xué);2010年

2 景娟;中文話費(fèi)文語轉(zhuǎn)換系統(tǒng)的研究與實(shí)現(xiàn)[D];中南大學(xué);2011年

3 梁青青;蘭州方言的聲學(xué)特征分析和語音合成的研究[D];西北師范大學(xué);2010年

4 索南扎西;藏語語音合成關(guān)鍵技術(shù)研究[D];西藏大學(xué);2011年

5 賈瑩;韻律句法理論觀照下的現(xiàn)代漢語副詞研究[D];西北師范大學(xué);2011年

6 洪灃;基于嵌入式Linux語音合成關(guān)鍵技術(shù)的研究與實(shí)現(xiàn)[D];哈爾濱工程大學(xué);2011年

7 陳琪;藏語拉薩話新聞體韻律模型研究[D];西北民族大學(xué);2011年

8 賈志浩;漢語語音合成系統(tǒng)的改進(jìn)與實(shí)現(xiàn)[D];南京理工大學(xué);2012年

9 姚益龍;“VP+NP_1+的+NP_2”結(jié)構(gòu)歧義的研究[D];首都師范大學(xué);2007年

10 李芳蘭;留學(xué)生朗讀說話中停延能力研究[D];暨南大學(xué);2007年

【二級參考文獻(xiàn)】

相關(guān)期刊論文 前4條

1 崔丹丹;蔡蓮紅;;基于決策樹的語料庫分析[J];計(jì)算機(jī)工程;2006年21期

2 應(yīng)宏,蔡蓮紅;基于結(jié)構(gòu)助詞驅(qū)動的韻律短語界定的研究[J];中文信息學(xué)報;1999年06期

3 王洪君;;漢語的韻律詞與韻律短語[J];中國語文;2000年06期

4 蔡蓮紅,趙世霞;漢語語音合成語料庫的研究與建立[J];語言文字應(yīng)用;1999年03期

相關(guān)博士學(xué)位論文 前1條

1 吳義堅(jiān);基于隱馬爾科夫模型的語音合成技術(shù)研究[D];中國科學(xué)技術(shù)大學(xué);2006年

【相似文獻(xiàn)】

相關(guān)期刊論文 前10條

1 楊慶江,謝子殿,于海英,郭明良;智能語音人體秤的設(shè)計(jì)[J];黑龍江礦業(yè)學(xué)院學(xué)報;1997年02期

2 韓麗萍,張麗紅;語音應(yīng)答系統(tǒng)的設(shè)計(jì)[J];錦州師范學(xué)院學(xué)報(自然科學(xué)版);2001年01期

3 何去非;方恒;;機(jī)器人語音接口的開發(fā)[J];蕪湖職業(yè)技術(shù)學(xué)院學(xué)報;2007年04期

4 陳麗娟,劉淑英,劉書琴;MCS-51單片機(jī)用于語音合成系統(tǒng)[J];信息技術(shù);1994年04期

5 唐明道;大容量可編程語音合成電路[J];電子技術(shù);1996年07期

6 梁志強(qiáng),李海洲;線性預(yù)測編碼在變音長語音合成中的應(yīng)用[J];華南理工大學(xué)學(xué)報(自然科學(xué)版);1998年03期

7 杜凱;計(jì)算機(jī)語音技術(shù)及其展望(上)[J];黑龍江水利科技;1998年01期

8 左岐;新型智能變送器的研制[J];儀表技術(shù)與傳感器;1999年08期

9 趙曉虹,葉建明;小型電話語音查詢系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)[J];四川通信技術(shù);2001年05期

10 趙歡,譚華;Apriori算法在語音合成應(yīng)用中的一種改進(jìn)[J];湖南大學(xué)學(xué)報(自然科學(xué)版);2004年05期

相關(guān)會議論文 前10條

1 祝韶暉;劉文舉;吳璽宏;;一種新的基于匹配的語音合成基元選取算法[A];第六屆全國人機(jī)語音通訊學(xué)術(shù)會議論文集[C];2001年

2 楊靜;孫金城;;關(guān)于錄制語音合成數(shù)據(jù)庫的幾個問題[A];中國聲學(xué)學(xué)會2002年全國聲學(xué)學(xué)術(shù)會議論文集[C];2002年

3 江源;朱雙華;凌震華;戴禮榮;;基于HMM的單元挑選語音合成中的改進(jìn)方法研究[A];第十一屆全國人機(jī)語音通訊學(xué)術(shù)會議論文集(一)[C];2011年

4 易立夫;蘇鶴玲;孫金城;;基于HNM算法的漢語語音合成系統(tǒng)[A];第六屆全國現(xiàn)代語音學(xué)學(xué)術(shù)會議論文集(下)[C];2003年

5 易立夫;蘇鶴玲;孫金城;;基于HNM算法的漢語語音合成系統(tǒng)[A];第七屆全國人機(jī)語音通訊學(xué)術(shù)會議(NCMMSC7)論文集[C];2003年

6 高璐;陳琪;李永宏;于洪志;;藏語語音合成中本文分析的若干問題研究[A];第九屆中國語音學(xué)學(xué)術(shù)會議論文集[C];2010年

7 陶建華;康永國;;基于多元激勵的高質(zhì)量語音合成聲學(xué)模型[A];第七屆全國人機(jī)語音通訊學(xué)術(shù)會議(NCMMSC7)論文集[C];2003年

8 陳益強(qiáng);高文;王兆其;楊長水;姜大龍;;多模式語音合成[A];第六屆全國人機(jī)語音通訊學(xué)術(shù)會議論文集[C];2001年

9 那興宇;謝湘;匡鏡明;何婭玲;;用于統(tǒng)計(jì)語音合成的大尺度壓縮HMM的方法[A];第十一屆全國人機(jī)語音通訊學(xué)術(shù)會議論文集(二)[C];2011年

10 那興宇;謝湘;匡鏡明;何婭玲;;一種用于統(tǒng)計(jì)語音合成的大尺度壓縮HMM的方法[A];第十一屆全國人機(jī)語音通訊學(xué)術(shù)會議論文集(一)[C];2011年

相關(guān)重要報紙文章 前10條

1 ;嵌入式語音合成平臺[N];計(jì)算機(jī)世界;2002年

2 孫曉聞;語音合成 讓機(jī)器“像人一樣說話”[N];中國勞動保障報;2005年

3 記者 汪永安;科大訊飛獲國際英文合成大賽“六連冠”[N];安徽日報;2011年

4 劉權(quán);語音合成融入證券客服[N];中國計(jì)算機(jī)報;2003年

5 劉羚;語音合成發(fā)揮作用[N];中國計(jì)算機(jī)報;2003年

6 李羚;多語種語音合成助力數(shù)字奧運(yùn)[N];中國計(jì)算機(jī)報;2003年

7 本報記者 何進(jìn)偉;語音合成露崢嶸[N];網(wǎng)絡(luò)世界;2001年

8 李壯;陶建華 行勝于言的語音合成專家[N];中國高新技術(shù)產(chǎn)業(yè)導(dǎo)報;2007年

9 記者 吳長鋒;科大訊飛英文語音合成系統(tǒng)獲獎[N];科技日報;2006年

10 ;開放架構(gòu)支持更多應(yīng)用[N];中國計(jì)算機(jī)報;2004年

相關(guān)博士學(xué)位論文 前10條

1 盧恒;基于統(tǒng)計(jì)模型與發(fā)音錯誤檢測的語音合成方法研究[D];中國科學(xué)技術(shù)大學(xué);2011年

2 高裴裴;人眼驅(qū)動語音合成的若干關(guān)鍵技術(shù)研究[D];南開大學(xué);2012年

3 雷鳴;統(tǒng)計(jì)參數(shù)語音合成中的聲學(xué)模型建模方法研究[D];中國科學(xué)技術(shù)大學(xué);2012年

4 楊辰雨;語音合成音庫自動標(biāo)注方法研究[D];中國科學(xué)技術(shù)大學(xué);2014年

5 凌震華;基于統(tǒng)計(jì)聲學(xué)建模的語音合成技術(shù)研究[D];中國科學(xué)技術(shù)大學(xué);2008年

6 尉洪;漢語基元音素獨(dú)立分量譜分析對比及語音合成研究[D];云南大學(xué);2011年

7 周群群;多帶激勵聲碼器關(guān)鍵算法的研究[D];華中科技大學(xué);2013年

8 雙志偉;個性化語音生成研究[D];中國科學(xué)技術(shù)大學(xué);2011年

9 孫俊;基于激勵源及其韻律特征的源—目標(biāo)說話人聲音轉(zhuǎn)換研究[D];中國科學(xué)技術(shù)大學(xué);2006年

10 孫穎;情感語音識別與合成的研究[D];太原理工大學(xué);2011年

相關(guān)碩士學(xué)位論文 前10條

1 史水平;漢語語音合成技術(shù)的研究[D];廣西大學(xué);2004年

2 孟利青;基于DSP的中文電子閱讀系統(tǒng)的研究[D];遼寧工程技術(shù)大學(xué);2005年

3 賈建華;語音合成及語音處理[D];中南大學(xué);2002年

4 黨培霞;基于情感基音模板的情感語音合成[D];中南大學(xué);2010年

5 史學(xué)晶;基于原型波形內(nèi)插算法的語音問題的研究[D];北京化工大學(xué);2004年

6 陳翔;基于板卡“教師家長一線通系統(tǒng)”研究和實(shí)現(xiàn)[D];西南交通大學(xué);2005年

7 杜朝陽;語音合成技術(shù)及手機(jī)語音詞典的研究[D];山東大學(xué);2005年

8 趙博;中文語音合成系統(tǒng)的評測方法研究[D];清華大學(xué);2005年

9 喬英霞;語音合成算法研究及嵌入式語音合成系統(tǒng)的實(shí)現(xiàn)[D];山東大學(xué);2005年

10 努爾比婭·塔依爾;面向語音合成的維吾爾語韻律層級自動標(biāo)注算法研究[D];新疆大學(xué);2010年

,

本文編號:1407458

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/wltx/1407458.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶24ec0***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com