語音合成系統(tǒng)中語音庫樣本能量均衡方法研究

發(fā)布時間：2018-04-10 19:10

本文選題：語音合成 + 能量均衡��；參考：《信號處理》2017年02期

【摘要】：語音合成(Text to Speech,TTS)技術(shù)是實現(xiàn)人機語音通信的一項關(guān)鍵技術(shù),語音庫的質(zhì)量是決定TTS效果的重要因素。本文針對TTS語音庫制作周期長,發(fā)音人錄音狀態(tài)(音色、能量)差異而導(dǎo)致的TTS語音數(shù)據(jù)庫錄制后能量不一致問題,提出了一種語音能量均衡方法,包括時域包絡(luò)波動檢測和幀能量平均兩個步驟。首先分析獲得標(biāo)準語音的相關(guān)能量參數(shù)和波動參數(shù)作為模板,利用時域包絡(luò)波動檢測算法對預(yù)調(diào)節(jié)語音樣本的合格性進行檢驗;最后,根據(jù)幀能量平均準則,對所有合格語音樣本進行時域幅值調(diào)整,以最大限度地保證語音庫整體能量的一致性。實驗結(jié)果表明,本文提出的語音能量均衡方法可以有效提升TTS語音庫質(zhì)量,具有實際工程意義。
[Abstract]:Speech synthesis (text to speech TTS) technology is a key technology in man-machine speech communication. The quality of speech base is an important factor to determine the effect of TTS.In this paper, a speech energy equalization method is proposed to solve the problem of energy inconsistency after recording in TTS speech database caused by long production period of TTS phonetic corpus and different phonetic recording states (timbre, energy).It includes two steps: time domain envelope wave detection and frame energy average.Firstly, the relevant energy parameters and fluctuation parameters of the standard speech are analyzed as templates, and the time-domain envelope wave detection algorithm is used to test the eligibility of the pre-adjusted speech samples. Finally, according to the frame energy average criterion,All the qualified speech samples are adjusted in time domain to maximize the consistency of the overall energy of the speech bank.The experimental results show that the proposed speech energy equalization method can effectively improve the quality of TTS speech corpus and has practical engineering significance.
【作者單位】：電子科技大學(xué)通信抗干擾技術(shù)國家重點實驗室;
【分類號】：TN912.33

【參考文獻】

相關(guān)期刊論文前3條

1 劉鳳山;呂釗;張超;吳小培;;改進小波閾值函數(shù)的語音增強算法研究[J];信號處理;2016年02期

2 WU Di;ZHAO Heming;HUANG Chengwei;XIAO Zhongzhe;ZHANG Xiaojun;XU Yishen;TAO Zhi;;Speech endpoint detection in low-SNRs environment based on perception spectrogram structure boundary parameter[J];Chinese Journal of Acoustics;2014年04期

3 張勇;劉軼;劉宏;;結(jié)合人耳聽覺感知的兩級語音增強算法[J];信號處理;2014年04期

【共引文獻】

相關(guān)期刊論文前10條

1 劉偉;謝建志;;語音合成系統(tǒng)中語音庫樣本能量均衡方法研究[J];信號處理;2017年02期

2 韓偉;張雄偉;閔剛;張啟業(yè);;基于感知掩蔽深度神經(jīng)網(wǎng)絡(luò)的單通道語音增強方法[J];自動化學(xué)報;2017年02期

3 唐鵬;郭寶平;;改進型閾值函數(shù)尋優(yōu)法的小波去噪分析[J];信號處理;2017年01期

4 魏瑩;王雙維;潘迪;張玲;許廷發(fā);梁士利;;寬窄帶語譜圖融合分帶投影的特定人漢語詞匯識別[J];計算機科學(xué);2016年S2期

5 張芝旖;姚恩濤;石玉;;小波分析和MFCC融合的聲音信號端點檢測算法[J];電子測量技術(shù);2016年07期

6 章小兵;李燕萍;王雙杰;;基于改進HHT的語音端點檢測[J];計算機工程;2016年06期

7 覃貴禮;羅云芳;潘澤鍇;;基于譜相減改進算法的語音增強系統(tǒng)的實現(xiàn)研究[J];河池學(xué)院學(xué)報;2016年02期

8 劉鳳山;呂釗;張超;吳小培;;改進小波閾值函數(shù)的語音增強算法研究[J];信號處理;2016年02期

9 史小龍;李曉玲;高虹霓;韓楓;;全息顯控界面中多通道人機交互技術(shù)研究[J];包裝工程;2016年04期

10 葉琪;陶亮;周健;王華彬;;基于噪聲譜約束的二值掩碼估計語音增強算法[J];信號處理;2016年01期

【二級參考文獻】

相關(guān)期刊論文前10條

1 張勇;劉軼;劉宏;;結(jié)合人耳聽覺感知的兩級語音增強算法[J];信號處理;2014年04期

2 丁衛(wèi);王忠;;結(jié)合聽覺掩蔽效應(yīng)的時頻自適應(yīng)小波閾值增強[J];計算機工程與設(shè)計;2011年11期

3 章旭景;李輝;陸偉;;基于子帶卡爾曼濾波的語音增強方法[J];信號處理;2009年09期

4 陳琪;郭英;張群;王布宏;;基于聽覺感知的LSA-MMSE改進型語音增強方法[J];信號處理;2008年06期

5 趙曉群;黃小珊;;改進的基于人耳掩蔽效應(yīng)譜減語音增強算法[J];通信學(xué)報;2008年09期

6 楊秋成;范煒瑋;;基于先驗信噪比估計的語音增強方法[J];信號處理;2008年02期

7 陶智,趙鶴鳴,龔呈卉;基于聽覺掩蔽效應(yīng)和Bark子波變換的語音增強[J];聲學(xué)學(xué)報;2005年04期

8 卜凡亮,王為民,戴啟軍,陳硯圃;基于噪聲被掩蔽概率的優(yōu)化語音增強方法[J];電子與信息學(xué)報;2005年05期

9 陳振標(biāo),徐波;基于子帶能量特征的最優(yōu)化語音端點檢測算法研究[J];聲學(xué)學(xué)報;2005年02期

10 劉海濱,吳鎮(zhèn)揚,趙力,曾毓敏;非平穩(wěn)環(huán)境下基于人耳聽覺掩蔽特性的語音增強[J];信號處理;2003年04期

【相似文獻】

相關(guān)期刊論文前10條

1 行人三;;利用離線語音庫無阻礙學(xué)習(xí)英文[J];電腦迷;2013年11期

2 張文軍,謝劍英,李聰;語音庫輔助建立工具的開發(fā)[J];計算機工程;2002年04期

3 石志熹，張文全;一種建立語音庫的技術(shù)[J];山東電子;1996年04期

4 賈顯鋒;;氣象語音庫的制作及應(yīng)用[J];廣西氣象;2005年S2期

5 朱玉璽;胡學(xué)駿;趙慧民;;基于數(shù)據(jù)驅(qū)動的語音庫的分析與構(gòu)建[J];電聲技術(shù);2006年05期

6 張巍;吳曉如;趙志偉;王仁華;;基于虛擬不定長的語音庫裁剪方法[J];軟件學(xué)報;2006年05期

7 張巍;吳曉如;劉江;王仁華;;語音庫裁剪的一種不定長遞階聚類方法[J];計算機學(xué)報;2007年11期

8 趙劍;王麗榮;;基于三維可視語音庫的發(fā)音康復(fù)方法[J];長春大學(xué)學(xué)報;2010年02期

9 呂強,吳嫻,楊季文;一個漢字語音庫的實現(xiàn)[J];蘇州大學(xué)學(xué)報(自然科學(xué));2001年01期

10 張巍;吳曉如;王仁華;;數(shù)據(jù)驅(qū)動方法的語音庫裁剪研究[J];高技術(shù)通訊;2008年01期

相關(guān)會議論文前7條

1 王俠;李明琴;肖熙;王作英;;電話語音庫的設(shè)計與實現(xiàn)[A];第七屆全國人機語音通訊學(xué)術(shù)會議（NCMMSC7）論文集[C];2003年

2 王俠;吳及;肖熙;王作英;;關(guān)于語音庫建庫若干問題的討論[A];第六屆全國人機語音通訊學(xué)術(shù)會議論文集[C];2001年

3 曲菲;黃泰翼;張希軍;;漢語綜合語音庫語料設(shè)計[A];第四屆全國人機語音通訊學(xué)術(shù)會議論文集[C];1996年

4 張巍;吳曉如;胡國平;王仁華;;語音庫裁剪中的不定長處理[A];第八屆全國人機語音通訊學(xué)術(shù)會議論文集[C];2005年

5 呂成國;周健;諸光;王承發(fā);徐近霈;;高噪聲有變異語音庫的建立[A];第五屆全國人機語音通訊學(xué)術(shù)會議論文集[C];1998年

6 李愛軍;王天慶;殷治綱;;863語音識別語音語料庫RASC863—四大方言普通話語音庫[A];第七屆全國人機語音通訊學(xué)術(shù)會議（NCMMSC7）論文集[C];2003年

7 張立華;楊瑩春;;情感語音變化規(guī)律的實驗分析研究初步[A];第九屆全國人機語音通訊學(xué)術(shù)會議論文集[C];2007年

相關(guān)重要報紙文章前1條

1 山東黃家貞;讓計算機開口說話[N];中國電腦教育報;2000年

相關(guān)碩士學(xué)位論文前1條

1 龐敏輝;語音庫自動構(gòu)建技術(shù)的研究[D];中國海洋大學(xué);2010年

，

本文編號：1732528

資料下載

論文發(fā)表

支付寶下載

Download by Alipay
微信下載

Download by Wechat
會員下載

Download by Member

本文鏈接：http://sikaile.net/kejilunwen/xinxigongchenglunwen/1732528.html

上一篇：一種信令網(wǎng)關(guān)系統(tǒng)的設(shè)計與實現(xiàn)方法
下一篇：供電企業(yè)無線局域網(wǎng)安全性研究

論文發(fā)表

·知網(wǎng)|萬方|維普|龍源|省級|國家級|科技核心|北大核心|南大核心CSSCI|EI|SCI|SSCI|

天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

語音合成系統(tǒng)中語音庫樣本能量均衡方法研究