天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當前位置:主頁 > 科技論文 > 信息工程論文 >

語音合成系統(tǒng)中語音庫樣本能量均衡方法研究

發(fā)布時間:2018-04-10 19:10

  本文選題:語音合成 + 能量均衡 ; 參考:《信號處理》2017年02期


【摘要】:語音合成(Text to Speech,TTS)技術是實現(xiàn)人機語音通信的一項關鍵技術,語音庫的質量是決定TTS效果的重要因素。本文針對TTS語音庫制作周期長,發(fā)音人錄音狀態(tài)(音色、能量)差異而導致的TTS語音數(shù)據(jù)庫錄制后能量不一致問題,提出了一種語音能量均衡方法,包括時域包絡波動檢測和幀能量平均兩個步驟。首先分析獲得標準語音的相關能量參數(shù)和波動參數(shù)作為模板,利用時域包絡波動檢測算法對預調節(jié)語音樣本的合格性進行檢驗;最后,根據(jù)幀能量平均準則,對所有合格語音樣本進行時域幅值調整,以最大限度地保證語音庫整體能量的一致性。實驗結果表明,本文提出的語音能量均衡方法可以有效提升TTS語音庫質量,具有實際工程意義。
[Abstract]:Speech synthesis (text to speech TTS) technology is a key technology in man-machine speech communication. The quality of speech base is an important factor to determine the effect of TTS.In this paper, a speech energy equalization method is proposed to solve the problem of energy inconsistency after recording in TTS speech database caused by long production period of TTS phonetic corpus and different phonetic recording states (timbre, energy).It includes two steps: time domain envelope wave detection and frame energy average.Firstly, the relevant energy parameters and fluctuation parameters of the standard speech are analyzed as templates, and the time-domain envelope wave detection algorithm is used to test the eligibility of the pre-adjusted speech samples. Finally, according to the frame energy average criterion,All the qualified speech samples are adjusted in time domain to maximize the consistency of the overall energy of the speech bank.The experimental results show that the proposed speech energy equalization method can effectively improve the quality of TTS speech corpus and has practical engineering significance.
【作者單位】: 電子科技大學通信抗干擾技術國家重點實驗室;
【分類號】:TN912.33

【參考文獻】

相關期刊論文 前3條

1 劉鳳山;呂釗;張超;吳小培;;改進小波閾值函數(shù)的語音增強算法研究[J];信號處理;2016年02期

2 WU Di;ZHAO Heming;HUANG Chengwei;XIAO Zhongzhe;ZHANG Xiaojun;XU Yishen;TAO Zhi;;Speech endpoint detection in low-SNRs environment based on perception spectrogram structure boundary parameter[J];Chinese Journal of Acoustics;2014年04期

3 張勇;劉軼;劉宏;;結合人耳聽覺感知的兩級語音增強算法[J];信號處理;2014年04期

【共引文獻】

相關期刊論文 前10條

1 劉偉;謝建志;;語音合成系統(tǒng)中語音庫樣本能量均衡方法研究[J];信號處理;2017年02期

2 韓偉;張雄偉;閔剛;張啟業(yè);;基于感知掩蔽深度神經網絡的單通道語音增強方法[J];自動化學報;2017年02期

3 唐鵬;郭寶平;;改進型閾值函數(shù)尋優(yōu)法的小波去噪分析[J];信號處理;2017年01期

4 魏瑩;王雙維;潘迪;張玲;許廷發(fā);梁士利;;寬窄帶語譜圖融合分帶投影的特定人漢語詞匯識別[J];計算機科學;2016年S2期

5 張芝旖;姚恩濤;石玉;;小波分析和MFCC融合的聲音信號端點檢測算法[J];電子測量技術;2016年07期

6 章小兵;李燕萍;王雙杰;;基于改進HHT的語音端點檢測[J];計算機工程;2016年06期

7 覃貴禮;羅云芳;潘澤鍇;;基于譜相減改進算法的語音增強系統(tǒng)的實現(xiàn)研究[J];河池學院學報;2016年02期

8 劉鳳山;呂釗;張超;吳小培;;改進小波閾值函數(shù)的語音增強算法研究[J];信號處理;2016年02期

9 史小龍;李曉玲;高虹霓;韓楓;;全息顯控界面中多通道人機交互技術研究[J];包裝工程;2016年04期

10 葉琪;陶亮;周健;王華彬;;基于噪聲譜約束的二值掩碼估計語音增強算法[J];信號處理;2016年01期

【二級參考文獻】

相關期刊論文 前10條

1 張勇;劉軼;劉宏;;結合人耳聽覺感知的兩級語音增強算法[J];信號處理;2014年04期

2 丁衛(wèi);王忠;;結合聽覺掩蔽效應的時頻自適應小波閾值增強[J];計算機工程與設計;2011年11期

3 章旭景;李輝;陸偉;;基于子帶卡爾曼濾波的語音增強方法[J];信號處理;2009年09期

4 陳琪;郭英;張群;王布宏;;基于聽覺感知的LSA-MMSE改進型語音增強方法[J];信號處理;2008年06期

5 趙曉群;黃小珊;;改進的基于人耳掩蔽效應譜減語音增強算法[J];通信學報;2008年09期

6 楊秋成;范煒瑋;;基于先驗信噪比估計的語音增強方法[J];信號處理;2008年02期

7 陶智,趙鶴鳴,龔呈卉;基于聽覺掩蔽效應和Bark子波變換的語音增強[J];聲學學報;2005年04期

8 卜凡亮,王為民,戴啟軍,陳硯圃;基于噪聲被掩蔽概率的優(yōu)化語音增強方法[J];電子與信息學報;2005年05期

9 陳振標,徐波;基于子帶能量特征的最優(yōu)化語音端點檢測算法研究[J];聲學學報;2005年02期

10 劉海濱,吳鎮(zhèn)揚,趙力,曾毓敏;非平穩(wěn)環(huán)境下基于人耳聽覺掩蔽特性的語音增強[J];信號處理;2003年04期

【相似文獻】

相關期刊論文 前10條

1 行人三;;利用離線語音庫無阻礙學習英文[J];電腦迷;2013年11期

2 張文軍,謝劍英,李 聰;語音庫輔助建立工具的開發(fā)[J];計算機工程;2002年04期

3 石志熹,張文全;一種建立語音庫的技術[J];山東電子;1996年04期

4 賈顯鋒;;氣象語音庫的制作及應用[J];廣西氣象;2005年S2期

5 朱玉璽;胡學駿;趙慧民;;基于數(shù)據(jù)驅動的語音庫的分析與構建[J];電聲技術;2006年05期

6 張巍;吳曉如;趙志偉;王仁華;;基于虛擬不定長的語音庫裁剪方法[J];軟件學報;2006年05期

7 張巍;吳曉如;劉江;王仁華;;語音庫裁剪的一種不定長遞階聚類方法[J];計算機學報;2007年11期

8 趙劍;王麗榮;;基于三維可視語音庫的發(fā)音康復方法[J];長春大學學報;2010年02期

9 呂強,吳嫻,楊季文;一個漢字語音庫的實現(xiàn)[J];蘇州大學學報(自然科學);2001年01期

10 張巍;吳曉如;王仁華;;數(shù)據(jù)驅動方法的語音庫裁剪研究[J];高技術通訊;2008年01期

相關會議論文 前7條

1 王俠;李明琴;肖熙;王作英;;電話語音庫的設計與實現(xiàn)[A];第七屆全國人機語音通訊學術會議(NCMMSC7)論文集[C];2003年

2 王俠;吳及;肖熙;王作英;;關于語音庫建庫若干問題的討論[A];第六屆全國人機語音通訊學術會議論文集[C];2001年

3 曲菲;黃泰翼;張希軍;;漢語綜合語音庫語料設計[A];第四屆全國人機語音通訊學術會議論文集[C];1996年

4 張巍;吳曉如;胡國平;王仁華;;語音庫裁剪中的不定長處理[A];第八屆全國人機語音通訊學術會議論文集[C];2005年

5 呂成國;周健;諸光;王承發(fā);徐近霈;;高噪聲有變異語音庫的建立[A];第五屆全國人機語音通訊學術會議論文集[C];1998年

6 李愛軍;王天慶;殷治綱;;863語音識別語音語料庫RASC863—四大方言普通話語音庫[A];第七屆全國人機語音通訊學術會議(NCMMSC7)論文集[C];2003年

7 張立華;楊瑩春;;情感語音變化規(guī)律的實驗分析研究初步[A];第九屆全國人機語音通訊學術會議論文集[C];2007年

相關重要報紙文章 前1條

1 山東 黃家貞;讓計算機開口說話[N];中國電腦教育報;2000年

相關碩士學位論文 前1條

1 龐敏輝;語音庫自動構建技術的研究[D];中國海洋大學;2010年



本文編號:1732528

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/xinxigongchenglunwen/1732528.html


Copyright(c)文論論文網All Rights Reserved | 網站地圖 |

版權申明:資料由用戶1bc8c***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com