語音時長規(guī)整與變調(diào)技術(shù)研究
本文關(guān)鍵詞: 語音時長規(guī)整 WSOLA算法 語音變調(diào) 同態(tài)處理 GUI處理平臺 出處:《蘭州交通大學(xué)》2015年碩士論文 論文類型:學(xué)位論文
【摘要】:語音信號處理技術(shù)與計算機科學(xué)、模式識別系統(tǒng)、人工智能等領(lǐng)域與技術(shù)密切相關(guān),融合了語言學(xué)研究與信號處理技術(shù),對語音信號處理技術(shù)的研究會推動相關(guān)技術(shù)的發(fā)展。例如,隨著人機交互的不斷發(fā)展,以語音為通道的人機交互環(huán)境將會成發(fā)展的熱點和主流,語音環(huán)境下的交互方式將極大地提高人機交互的自然性和高效性。因此,對語音信號處理技術(shù)的深入研究具有重要的理論與實踐意義。語音信號處理技術(shù)可以分語音的合成、編碼以及識別三大類,本文就其中的語音合成技術(shù)中語音更改部分的內(nèi)容:語音時長規(guī)整和語音變調(diào)技術(shù)做重點研究。語音時長規(guī)整即在不改變說話人基頻、音色等特征下實現(xiàn)對語音時長的改變;語音變調(diào)技術(shù)則是在不改變說人語音速度的情況下實現(xiàn)對說話人基頻的改變。在實踐中,語音時長規(guī)整和語音變調(diào)技術(shù)可廣泛應(yīng)用于語音壓縮、傳輸通信、外語教學(xué)、影視后期制作及文語轉(zhuǎn)換等眾多領(lǐng)域。文章首先概要地闡述了該論文所研究內(nèi)容的背景、意義,并對語音時長規(guī)整與變調(diào)技術(shù)的主要方法和國內(nèi)外研究進展做出介紹。其次,研究和闡述了語音信號產(chǎn)生的物理機制,基于其物理機制詳細(xì)分析了語音信號的經(jīng)典數(shù)字模型。在此基礎(chǔ)上,對于語音時長規(guī)整技術(shù),詳細(xì)介紹了典型算法OLA、SOLA、WSOLA以及基于模型的線性預(yù)測法等算法的原理及實現(xiàn)方法,并進行仿真對比實驗。針對WSOLA算法在進行規(guī)整時采用統(tǒng)一規(guī)整而沒有根據(jù)語音的感知特性做出相應(yīng)的區(qū)分,因而在采樣率偏低或者整體規(guī)整比例偏大的情況下規(guī)整效果將會變差的缺陷,分析了人耳的聽覺預(yù)測原理,提出基于人耳聽覺預(yù)測的改進WSOLA時長規(guī)整算法,對人耳感知敏感的轉(zhuǎn)折區(qū)語音進行了保留,提高了輸出語音的規(guī)整質(zhì)量。進一步針對改進算法帶來的規(guī)整比例誤差提出一種動態(tài)時間規(guī)整補償算法,有效地使改進算法在提高感知度的情況下,保證了規(guī)整時長的準(zhǔn)確性。對于語音變調(diào)技術(shù),分析推導(dǎo)了基于時域重采樣方法結(jié)合語音時長規(guī)整的算法、基于線性預(yù)測的方法等算法,并進行仿真對比實驗。應(yīng)用線性重采樣結(jié)合基于人耳聽覺預(yù)測的改進WSOLA時長規(guī)整算法獲得了很好變調(diào)效果的語音。另一方面,針對聲門激勵信號的模擬和聲道共振峰模型的準(zhǔn)確提取兩方面,提出基于同態(tài)濾波倒譜域處理的方法。用倒譜方法提取人聲元音信號進行周期拓展和重采樣,得到根據(jù)規(guī)整需求改變基音周期的聲門模擬激勵,用同態(tài)解卷方法提取聲道傳輸函數(shù)并用線型比例的重采樣方法得到改變共振峰頻率的聲道傳輸函數(shù),有效地實現(xiàn)了保證語音時長不變的情況下對語音的變調(diào)處理,提高了合成語音的自然度。最后構(gòu)建基于Matlab的GUI語音信號處理平臺,把對語音時長規(guī)整與變調(diào)技術(shù)的各研究算法集成起來,使處理結(jié)果直觀呈現(xiàn)。該平臺能完成對本地或現(xiàn)場錄制語音按用戶規(guī)整意愿進行語音變速不變調(diào)、語音變調(diào)不變速以及變速變調(diào)的調(diào)整,實時顯示出規(guī)整后語音的波形及頻譜。并通過快捷鍵的功能加入,可快捷實現(xiàn)男聲變女聲、女聲變男聲等變換,保存功能使用戶能對規(guī)整后的語音進行保存。
[Abstract]:In this paper , the theory and realization method of speech signal processing technology are discussed in detail . The speech signal processing technology can be widely used in speech compression , transmission communication , foreign language teaching , movie post - making and text conversion . the platform can complete the adjustment of voice transmission without modulation , voice modulation and variable speed adjustment on local or on - site recording voice according to the user ' s regular will , display the waveform and frequency spectrum of the regular voice in real time , and can quickly realize the transformation of the male voice , the female voice and the male voice through the function of the shortcut key , so that the user can save the regular voice .
【學(xué)位授予單位】:蘭州交通大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2015
【分類號】:TN912.3
【相似文獻】
相關(guān)期刊論文 前10條
1 楊立東;;“語音信號處理”課程的教學(xué)改革[J];科技資訊;2008年28期
2 趙力;;“語音信號處理”課程改革與實踐[J];電氣電子教學(xué)學(xué)報;2010年04期
3 呂丹桔;徐偉恒;;《語音信號處理》課程改革[J];電腦知識與技術(shù);2010年25期
4 許麗群;馬馳;王睿杰;;時頻分析在語音信號處理中的應(yīng)用[J];科學(xué)技術(shù)與工程;2011年21期
5 楊毅;鄧北星;馬曉紅;;《語音信號處理》實驗教學(xué)研究與實踐[J];實驗科學(xué)與技術(shù);2012年06期
6 程啟明,,張禮和;通用語音信號處理系統(tǒng)的實現(xiàn)[J];聲學(xué)技術(shù);1994年03期
7 趙力;;語音信號處理嵌入式教學(xué)實驗平臺的研究與開發(fā)[J];信息化研究;2014年01期
8 趙力;;對語音信號處理課程改革的探索[J];時代教育(教育教學(xué));2010年03期
9 趙力;;搞好語音信號處理課程教學(xué)的幾點體會[J];時代教育(教育教學(xué));2010年10期
10 ;2001年多媒體、視頻和語音信號處理國際會議征文通知[J];數(shù)據(jù)采集與處理;2000年03期
相關(guān)會議論文 前9條
1 梁瑞宇;奚吉;張學(xué)武;;壓縮感知理論在語音信號處理中的應(yīng)用[A];2010’中國西部聲學(xué)學(xué)術(shù)交流會論文集[C];2010年
2 盧化;岳東劍;柴佩琪;;語音信號處理技術(shù)用于評定口腔手術(shù)效果[A];第二屆全國人機語音通訊學(xué)術(shù)會議論文集[C];1992年
3 楊立志;蘇文忠;;語音信號處理工作平臺[A];第三屆全國人機語音通訊學(xué)術(shù)會議論文集[C];1994年
4 鄭能恒;王新龍;;非線性語音信號處理的初步研究[A];中國聲學(xué)學(xué)會2002年全國聲學(xué)學(xué)術(shù)會議論文集[C];2002年
5 王建波;林本浩;田春明;;軟計算方法在語音信號處理中的應(yīng)用[A];2009年中國智能自動化會議論文集(第一分冊)[C];2009年
6 陳文鋼;田嵐;姜曉慶;;基于語音卡的語音信號處理平臺的設(shè)計與實現(xiàn)[A];2006中國控制與決策學(xué)術(shù)年會論文集[C];2006年
7 王波;王炳錫;王杰鋒;;小波變換和希爾伯特變換在語音信號處理中的應(yīng)用[A];第九屆全國信號處理學(xué)術(shù)年會(CCSP-99)論文集[C];1999年
8 高文;閆寶杰;張晶;;一種開放型通用語音信號處理平臺——EOGI[A];第三屆全國人機語音通訊學(xué)術(shù)會議論文集[C];1994年
9 張延平;尹建琪;陳錫先;;通用語音信號處理系統(tǒng)——BYDSP-C30[A];第三屆全國人機語音通訊學(xué)術(shù)會議論文集[C];1994年
相關(guān)博士學(xué)位論文 前3條
1 何培宇;面向?qū)崟r處理的自適應(yīng)聲學(xué)語音信號處理[D];四川大學(xué);2005年
2 申麗然;Hilbert-Huang變換及其在含噪語音信號處理中的應(yīng)用研究[D];哈爾濱工程大學(xué);2006年
3 汪林;多通道語音信號處理中的關(guān)鍵技術(shù)研究[D];大連理工大學(xué);2010年
相關(guān)碩士學(xué)位論文 前10條
1 雷穎思;語音時長規(guī)整與變調(diào)技術(shù)研究[D];蘭州交通大學(xué);2015年
2 郭偉;基于聽覺神經(jīng)原理的語音信號處理[D];上海交通大學(xué);2009年
3 張海濤;車載通信控制系統(tǒng)的語音信號處理研究與實現(xiàn)[D];華中科技大學(xué);2005年
4 王光艷;語音信號處理中的數(shù)學(xué)形態(tài)學(xué)方法研究[D];河北工業(yè)大學(xué);2003年
5 付維勇;基于小波變換的語音信號處理的應(yīng)用研究[D];昆明理工大學(xué);2008年
6 張維強;小波分析及其在語音信號處理中的應(yīng)用[D];西安電子科技大學(xué);2000年
7 張力;基于DSP的語言信號采集與處理系統(tǒng)設(shè)計與實現(xiàn)[D];西南交通大學(xué);2004年
8 楊傳森;IP電話語音信號處理、傳送系統(tǒng)的研制[D];河海大學(xué);2003年
9 尹利民;基于DSP無線通信中的語音信號處理研究[D];武漢科技大學(xué);2008年
10 王潔麗;數(shù)學(xué)形態(tài)學(xué)在語音信號處理中的應(yīng)用[D];河北工業(yè)大學(xué);2006年
本文編號:1495503
本文鏈接:http://sikaile.net/kejilunwen/wltx/1495503.html