天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當前位置:主頁 > 科技論文 > 信息工程論文 >

面向中文廣告文本的語音合成技術(shù)研究

發(fā)布時間:2020-06-12 08:58
【摘要】:語音合成技術(shù)是指通過機器將自然文本轉(zhuǎn)換為語音信號的技術(shù),是人工智能技術(shù)的重要組成部分之一,在人機交互中占據(jù)不可或缺的地位。語音合成技術(shù)發(fā)展至今,已經(jīng)形成了基于波形拼接合成和統(tǒng)計參數(shù)合成兩大主流方法。前者通過分析文本韻律特征,從語音庫中挑選出候選的單元波形進行拼接,從而得到合成語音,這種方法合成的語音質(zhì)量較高,但是需要建立對應的語音庫,成本比較高,可移植性差。后者通過利用隱馬爾科夫技術(shù)對文本和語音進行參數(shù)建模,預測合成語音的聲學特征,并且通過聲碼器重建語音,但是這種方法比較依賴聲碼器的質(zhì)量,而且合成的語音自然度不夠。近年來,基于深度學習的語音合成技術(shù)成為當下語音合成領(lǐng)域的研究熱點之一,并且逐漸展現(xiàn)出卓越的性能優(yōu)勢。基于以上的研究背景,本論文圍繞基于深度學習方法的語音合成技術(shù)展開研究工作,探索高效的中文廣告文本語音合成技術(shù),并構(gòu)建了對應的語音合成系統(tǒng)。該語音合成系統(tǒng)包含兩個主要模塊:文本到聲學特征的預測模塊和將聲學特征轉(zhuǎn)換為語音的聲碼器模塊。在文本到聲學特征預測模塊研究中,論文以端到端的聲學特征預測技術(shù)為研究基礎(chǔ),針對聲學特征預測速度慢的問題,論文提出了將獨立循環(huán)神經(jīng)網(wǎng)絡引入預測模塊的方法,提高了聲學特征的預測速度。同時,在基于端到端的聲學特征預測技術(shù)研究中論文發(fā)現(xiàn),基于端到端的聲學特征預測技術(shù)雖然可以簡化聲學特征預測流程,但是最終合成出的聲音比較單調(diào),缺少韻律信息。針對這一問題,論文通過引進Lattice LSTM網(wǎng)絡的方法,對文本的字詞,韻律等信息進行融合,豐富了合成語音的細節(jié)。在聲學特征到語音的轉(zhuǎn)換研究中,論文探究了基于自回歸深度生成網(wǎng)絡的WaveNet模型。針對其預測速度慢的問題,論文引進了基于逆自回歸流的并行WaveNet技術(shù),使聲碼器可以實時的將聲學特征轉(zhuǎn)換為對應的語音。同時論文提出了基于說話人標識的多人語音合成技術(shù),提高了模型訓練效率,降低了模型對單人語料時長的依賴性。針對中文廣告文本領(lǐng)域的語音合成,論文形成了完整的合成流程,搭建了面向中文廣告文本的語音合成系統(tǒng),可以根據(jù)廣告文本合成清晰流暢的廣告語音。
【圖文】:

波形,拼接算法,計算機內(nèi)存,和音


圖 1-1 基于波形拼接方法在波形拼接合成算法提出之初[6],由于計算機內(nèi)存限制和音庫數(shù)據(jù)的缺種拼接算法并沒有優(yōu)秀的合成效果。隨著計算機內(nèi)存的不斷增大和音庫數(shù)不斷增多,,這種波形拼接算法逐漸大放異彩,并形成了基于大尺度單元拼小尺度單元拼接[8]兩種主流的形式。

波形,語音合成,統(tǒng)計參數(shù),語音合成技術(shù)


針對波形拼接方法的缺陷提出了基于統(tǒng)計參數(shù)的語音合成技術(shù)。這種方法利用機器學習的技術(shù)自動的學習訓練聲學模型,利用學習到的聲學模型預測聲學特征,最終利用聲碼器將聲學特征轉(zhuǎn)換為語音。在基于統(tǒng)計參數(shù)的語音合成技術(shù)研究中最成功,并且效果最好的是基于隱馬爾科夫(HMM)[9]的統(tǒng)計參數(shù)語音合成方法[10]。其過程如圖 1-2 所示。
【學位授予單位】:哈爾濱工業(yè)大學
【學位級別】:碩士
【學位授予年份】:2018
【分類號】:TN912.33

【相似文獻】

相關(guān)期刊論文 前10條

1 牛其其日樂格;;蒙古語語音合成技術(shù)的研究[J];民營科技;2016年04期

2 劉豫軍;夏聰;;語音合成技術(shù)在網(wǎng)絡服務中的應用[J];網(wǎng)絡安全技術(shù)與應用;2015年04期

3 馬珊珊;汪劍超;;隱馬氏過程在語音合成技術(shù)中的應用[J];電聲技術(shù);2012年S1期

4 暢新愛;;個性化語音合成技術(shù)走入尋常百姓家[J];家電科技;2011年06期

5 曾誰飛;王仁波;;語音合成技術(shù)在智能語音播報系統(tǒng)中的應用探析[J];電信科學;2010年03期

6 項劍鋒;王艷紅;朱江;李志明;;語音合成技術(shù)在機載產(chǎn)品上的應用[J];飛機設計;2008年01期

7 陳靜;李薇;崔忠偉;劉霞;;語音合成技術(shù)的研究及其發(fā)展[J];中國科技信息;2007年14期

8 郭丹;魏愛民;;計算機語音合成技術(shù)及其應用[J];通化師范學院學報;2006年04期

9 喬英霞;崔鳳玉;;語音合成技術(shù)在旅游業(yè)的應用[J];信息技術(shù)與信息化;2006年05期

10 ;嵌入式操作系統(tǒng)下的語音合成技術(shù)及應用[J];科技資訊;2004年01期

相關(guān)會議論文 前10條

1 沈晉苑;;語音合成技術(shù)的現(xiàn)狀及發(fā)展前景[A];第一屆學生計算語言學研討會論文集[C];2002年

2 艾斯卡爾·艾木都拉;姑麗加瑪麗·麥麥提艾力;;基于音素波形拼接的維吾爾語音合成技術(shù)研究[A];民族語言文字信息技術(shù)研究——第十一屆全國民族語言文字信息學術(shù)研討會論文集[C];2007年

3 孟和吉雅;白音門德;敖其爾;田會利;;蒙古文語音合成技術(shù)研究[A];民族語言文字信息技術(shù)研究——第十一屆全國民族語言文字信息學術(shù)研討會論文集[C];2007年

4 于鴻洋;楊紅雨;朱維樂;;基于脈寬調(diào)制的語音合成技術(shù)研究[A];第三屆全國人機語音通訊學術(shù)會議(NCMMSC1994)論文集[C];1994年

5 ;構(gòu)筑技術(shù)創(chuàng)新平臺,推動語音技術(shù)突破——中文語音合成技術(shù)研究進展及成果展示[A];中國中文信息學會第六次全國會員代表大會暨成立二十五周年學術(shù)會議中文信息處理重大成果匯報展資料匯編[C];2006年

6 徐俊;蔡蓮紅;吳志勇;;多語種語音合成平臺的設計與實現(xiàn)[A];第一屆建立和諧人機環(huán)境聯(lián)合學術(shù)會議(HHME2005)論文集[C];2005年

7 呂林望;偠大舉;林道發(fā);;語音識別與語音合成在絲綢質(zhì)量檢驗中的應用[A];第三屆全國人機語音通訊學術(shù)會議(NCMMSC1994)論文集[C];1994年

8 張逸屏;黃競億;郭志忠;;中文標點符號對停頓韻律之分析與合成(論文類別:言語合成)[A];第六屆全國現(xiàn)代語音學學術(shù)會議論文集(下)[C];2003年

9 楊博;達哇彭措;于洪志;;韻律控制技術(shù)及在藏語TTS中的應用研究[A];第十屆全國少數(shù)民族語言文字信息處理學術(shù)研討會論文集[C];2005年

10 朱耀庭;李霞;;基于TTS的WEB瀏覽器[A];計算機與教育——全國計算機輔助教育學會第十一屆學術(shù)年會論文集[C];2003年

相關(guān)重要報紙文章 前10條

1 記者 愛民;語音合成技術(shù)我國達到國際領(lǐng)先水平[N];中國電子報;2001年

2 記者 周劍虹;有聲郵件 接收方便[N];新華每日電訊;2001年

3 ;日立開發(fā)高音質(zhì)中文語音合成技術(shù)[N];人民郵電;2008年

4 ;國內(nèi)語音合成技術(shù)“叫板”IBM[N];中國經(jīng)營報;2000年

5 本報記者 吳珊珊;語音合成技術(shù)(TTS)讓文字開口說話[N];中國高新技術(shù)產(chǎn)業(yè)導報;2001年

6 本報記者 卜娜;天行聽書:借HCI解聽書App市場“死穴”[N];中國計算機報;2013年

7 ;企業(yè)當自強[N];中國計算機報;2000年

8 舒志軍;IT產(chǎn)業(yè)的創(chuàng)新前景 先驅(qū)技術(shù)[N];國際商報;2001年

9 孫曉聞;社保12333語音應用技術(shù)方案[N];中國勞動保障報;2004年

10 李亞波;實現(xiàn)統(tǒng)一消息[N];中國計算機報;2001年

相關(guān)博士學位論文 前2條

1 吳義堅;基于隱馬爾科夫模型的語音合成技術(shù)研究[D];中國科學技術(shù)大學;2006年

2 才讓卓瑪;基于混合基元的藏語語音合成技術(shù)研究[D];陜西師范大學;2016年

相關(guān)碩士學位論文 前10條

1 都格草;基于神經(jīng)網(wǎng)絡的藏語語音合成技術(shù)研究[D];青海師范大學;2019年

2 侯建康;面向中文廣告文本的語音合成技術(shù)研究[D];哈爾濱工業(yè)大學;2018年

3 張斌;嵌入式語音合成技術(shù)研究[D];北方工業(yè)大學;2012年

4 黃華;嵌入式語音合成技術(shù)的研究[D];重慶大學;2011年

5 杜朝陽;語音合成技術(shù)及手機語音詞典的研究[D];山東大學;2005年

6 史水平;漢語語音合成技術(shù)的研究[D];廣西大學;2004年

7 薩其容貴;蒙古語語音合成技術(shù)的研究[D];內(nèi)蒙古大學;2005年

8 張向豐;鍋爐的單片機控制系統(tǒng)[D];山東大學;2006年

9 侯亭武;基于語料庫的中文語音合成技術(shù)研究[D];華中科技大學;2015年

10 肖佩嵐;基于嵌入式平臺的語音合成技術(shù)的研究與實現(xiàn)[D];北京交通大學;2011年



本文編號:2709302

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/xinxigongchenglunwen/2709302.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶69b88***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com