基于GMM和碼本映射相結(jié)合的語(yǔ)音轉(zhuǎn)換方法研究
發(fā)布時(shí)間:2017-05-19 11:03
本文關(guān)鍵詞:基于GMM和碼本映射相結(jié)合的語(yǔ)音轉(zhuǎn)換方法研究,由筆耕文化傳播整理發(fā)布。
【摘要】:人體發(fā)出的語(yǔ)音中包含有各種各樣的信息,如說(shuō)話人語(yǔ)義信息和說(shuō)話人個(gè)性特征的信息等。經(jīng)常需要用語(yǔ)音信號(hào)處理領(lǐng)域的相關(guān)知識(shí)來(lái)分析與處理其中包含的深層次信息。而語(yǔ)音轉(zhuǎn)換技術(shù)是近年來(lái)語(yǔ)音信號(hào)處理領(lǐng)域的一個(gè)新分支,也是目前語(yǔ)音信號(hào)處理領(lǐng)域的一個(gè)研究熱點(diǎn)。對(duì)語(yǔ)音轉(zhuǎn)換技術(shù)的研究主要是以語(yǔ)音的個(gè)性特征信息為切入點(diǎn)展開(kāi)的。語(yǔ)音轉(zhuǎn)換技術(shù)就是對(duì)一個(gè)說(shuō)話人的個(gè)性特征信息進(jìn)行轉(zhuǎn)變,并保持語(yǔ)義信息不變,使其變?yōu)榱硪粋(gè)特定目標(biāo)說(shuō)話人的個(gè)性特征信息。對(duì)語(yǔ)音轉(zhuǎn)換技術(shù)的研究有助于推動(dòng)語(yǔ)音信號(hào)處理其它領(lǐng)域不斷向前發(fā)展,甚至對(duì)目前比較熱門的智能家居及人工智能領(lǐng)域的研究起到促進(jìn)作用。其具有廣闊的應(yīng)用前景和巨大的理論研究?jī)r(jià)值。本文的主要工作如下:從語(yǔ)音產(chǎn)生模型入手,介紹了發(fā)音系統(tǒng)的數(shù)學(xué)模型及常用的語(yǔ)音特征參數(shù)。并對(duì)語(yǔ)音轉(zhuǎn)換技術(shù)中的分析合成模型等基本理論進(jìn)行了簡(jiǎn)要介紹。提出利用KLD將源和目標(biāo)特征參數(shù)進(jìn)行對(duì)齊的方法,該方法減少了查找源和目標(biāo)空間之間最近鄰域的搜索空間,也減少了計(jì)算量。重點(diǎn)研究了高斯混合模型以及矢量碼本映射兩種譜包絡(luò)轉(zhuǎn)換方法,分析了它們的優(yōu)缺點(diǎn)。針對(duì)用GMM轉(zhuǎn)換后語(yǔ)音的譜包絡(luò)過(guò)于平滑的現(xiàn)象,研究了利用碼本映射法對(duì)GMM轉(zhuǎn)換函數(shù)中的均值項(xiàng)和相關(guān)項(xiàng)進(jìn)行修正的方法,以此增大轉(zhuǎn)換特征的離散程度,進(jìn)而改善轉(zhuǎn)換語(yǔ)音的質(zhì)量。研究了基音頻率變換方法。目前對(duì)基音頻率的變換基本上都是對(duì)基音頻率和聲道譜參數(shù)分開(kāi)進(jìn)行建模的,這必然會(huì)影響轉(zhuǎn)換后語(yǔ)音的音質(zhì)。本文采用了基于徑向基函數(shù)網(wǎng)絡(luò)的基頻變換算法。該方法用徑向基函數(shù)網(wǎng)絡(luò)在基音頻率與聲道譜參數(shù)之間建立聯(lián)系。使得轉(zhuǎn)換出的基頻能夠跟隨目標(biāo)基頻起伏變化,并含有更多的目標(biāo)說(shuō)話人個(gè)性特征信息。對(duì)上述改進(jìn)方法進(jìn)行仿真測(cè)試,主觀和客觀測(cè)試結(jié)果都表明,改進(jìn)的語(yǔ)音轉(zhuǎn)換方法提高了轉(zhuǎn)換語(yǔ)音的質(zhì)量,得到了較好的轉(zhuǎn)換效果。
【關(guān)鍵詞】:語(yǔ)音轉(zhuǎn)換 基音頻率 高斯混合模型 譜包絡(luò)轉(zhuǎn)換
【學(xué)位授予單位】:西安建筑科技大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2015
【分類號(hào)】:TN912.3
【目錄】:
- 摘要3-5
- Abstract5-9
- 1 緒論9-15
- 1.1 語(yǔ)音轉(zhuǎn)換概述9
- 1.2 語(yǔ)音轉(zhuǎn)換的研究背景及意義9-10
- 1.3 國(guó)內(nèi)外研究進(jìn)展10-12
- 1.4 論文內(nèi)容安排12-15
- 2 語(yǔ)音轉(zhuǎn)換技術(shù)基礎(chǔ)15-27
- 2.1 語(yǔ)音發(fā)音系統(tǒng)模型15-17
- 2.1.1 語(yǔ)音的產(chǎn)生機(jī)理15-16
- 2.1.2 語(yǔ)音發(fā)生系統(tǒng)的數(shù)學(xué)模型16-17
- 2.2 語(yǔ)音轉(zhuǎn)換基礎(chǔ)技術(shù)17-25
- 2.2.1 語(yǔ)音預(yù)處理17-19
- 2.2.2 語(yǔ)音分析/合成模型19-22
- 2.2.3 語(yǔ)音個(gè)性特征參數(shù)22-24
- 2.2.4 語(yǔ)音信號(hào)的時(shí)間對(duì)齊24-25
- 2.3 語(yǔ)音轉(zhuǎn)換系統(tǒng)框架25
- 2.4 本章小結(jié)25-27
- 3 經(jīng)典語(yǔ)音轉(zhuǎn)換算法27-35
- 3.1 頻譜包絡(luò)的轉(zhuǎn)換方法27-32
- 3.1.1 矢量碼本映射法27-28
- 3.1.2 說(shuō)話人插值法28-29
- 3.1.3 線性多變量回歸法29
- 3.1.4 人工神經(jīng)網(wǎng)絡(luò)轉(zhuǎn)換方法29-30
- 3.1.5 隱馬爾可夫模型30-31
- 3.1.6 高斯混合模型法31-32
- 3.2 韻律特征的轉(zhuǎn)換方法32-34
- 3.2.1 基音頻率的轉(zhuǎn)換32-33
- 3.2.2 時(shí)長(zhǎng)的轉(zhuǎn)換33
- 3.2.3 能量的轉(zhuǎn)換33-34
- 3.3 語(yǔ)音合成與后處理34
- 3.4 本章小結(jié)34-35
- 4 基于GMM的語(yǔ)音轉(zhuǎn)換方法及其改進(jìn)35-45
- 4.1 高斯混合模型35-37
- 4.1.1 高斯混合模型的基本概念35
- 4.1.2 高斯混合模型(GMM)的參數(shù)估計(jì)35-36
- 4.1.3 高斯混合模型(GMM)轉(zhuǎn)換算法36-37
- 4.2 高斯混合模型過(guò)平滑問(wèn)題的分析37-39
- 4.3 改進(jìn)的高斯混合模型算法39-42
- 4.3.1 KLD散度39
- 4.3.2 基于KLD的語(yǔ)音幀對(duì)齊39-41
- 4.3.3 基于GMM和碼本映射相結(jié)合的語(yǔ)音轉(zhuǎn)換方法41-42
- 4.4 聯(lián)合譜包絡(luò)的基頻變換42-44
- 4.4.1 徑向基函數(shù)網(wǎng)絡(luò)43-44
- 4.4.2 基于RBF的聯(lián)合變換法44
- 4.5 本章小結(jié)44-45
- 5 實(shí)驗(yàn)結(jié)果及其性能分析45-53
- 5.1 實(shí)驗(yàn)的框架和任務(wù)45
- 5.2 客觀測(cè)試結(jié)果45-48
- 5.3 主觀測(cè)試結(jié)果48-53
- 5.3.1 ABX測(cè)試49-50
- 5.3.2 MOS測(cè)試50-53
- 6 總結(jié)與展望53-55
- 6.1 工作總結(jié)53-54
- 6.2 研究展望54-55
- 參考文獻(xiàn)55-59
- 攻讀碩士期間主要研究成果59-61
- 致謝61
【參考文獻(xiàn)】
中國(guó)重要會(huì)議論文全文數(shù)據(jù)庫(kù) 前1條
1 馬建春;劉文舉;;基于共振峰和高斯混合模型的聲音轉(zhuǎn)換系統(tǒng)[A];第八屆全國(guó)人機(jī)語(yǔ)音通訊學(xué)術(shù)會(huì)議論文集[C];2005年
中國(guó)碩士學(xué)位論文全文數(shù)據(jù)庫(kù) 前1條
1 馬瑞云;基于譜包絡(luò)和超音段韻律的語(yǔ)音轉(zhuǎn)換技術(shù)研究[D];南京郵電大學(xué);2011年
本文關(guān)鍵詞:基于GMM和碼本映射相結(jié)合的語(yǔ)音轉(zhuǎn)換方法研究,,由筆耕文化傳播整理發(fā)布。
本文編號(hào):378489
本文鏈接:http://sikaile.net/kejilunwen/wltx/378489.html
最近更新
教材專著