基于時長變化的GMM語音轉(zhuǎn)換系統(tǒng)
本文關(guān)鍵詞:基于時長變化的GMM語音轉(zhuǎn)換系統(tǒng),由筆耕文化傳播整理發(fā)布。
【摘要】:語音信號中除了包含語音內(nèi)容信息外,還包含說話人聲音特征形式信息。在保證發(fā)音者語音內(nèi)容訊息不發(fā)生變化的前提下,通過轉(zhuǎn)變源說話人的語音個人特性,使之具備目標說話人語音個人特征的技術(shù)稱為語音轉(zhuǎn)換。這項技術(shù)幾乎囊括了語音信號處理領(lǐng)域的各個方面,是當前比較熱門的技術(shù)之一。針對語音的韻律特征,它對轉(zhuǎn)換系統(tǒng)最終的合成語音的自然度、可懂度有很大影響。本課題在基于傳統(tǒng)高斯混合模型的語音轉(zhuǎn)換系統(tǒng)上提出對轉(zhuǎn)換后韻律特征中的時長進行改變的算法,填補了以往通過GMM模型轉(zhuǎn)換后語音自然度不高的弊端,提高轉(zhuǎn)換后語音的可懂度。本論文主要探究了基于高斯混合模型的語音轉(zhuǎn)換系統(tǒng)中所使用的重要技術(shù),再對轉(zhuǎn)換后的語音進行測評,分為客觀評價與主觀評價,以此判定所設(shè)計出的轉(zhuǎn)換系統(tǒng)的好壞程度。主要工作如下:1、基于時長變換的語音轉(zhuǎn)換系統(tǒng)除了完成基本的語音轉(zhuǎn)換要求外,還解決了經(jīng)系統(tǒng)轉(zhuǎn)換之后獲得的合成語音音質(zhì)不自然粗糙等問題;從語音的發(fā)聲機理開始研究適合于語音轉(zhuǎn)換系統(tǒng)的語音分析模型,與其相對應的語音參數(shù)以及用于語音轉(zhuǎn)換系統(tǒng)中的轉(zhuǎn)換算法。著重研究了基于高斯混合模型的語音轉(zhuǎn)換系統(tǒng)的主要算法,并對其進行了仿真實現(xiàn),給出了主客觀測試結(jié)果。2、針對傳統(tǒng)語音轉(zhuǎn)換系統(tǒng)普遍存在的語音自然度低的問題,提出并實現(xiàn)了一種基于時長變化的語音轉(zhuǎn)換系統(tǒng)的改進算法,通過對轉(zhuǎn)換后的參數(shù)插值變換來改變語音的時長。測評結(jié)果表明經(jīng)過改進后的轉(zhuǎn)換語音自然度和可懂度都有一定程度的提高。3、在采取上述改進算法的GMM語音轉(zhuǎn)換系統(tǒng)中,選取更利于人耳聲音感知的美爾倒譜參數(shù)MFCC進行變換操作:給出了轉(zhuǎn)換前后語音的MFCC三維圖以及語音波形圖,實驗結(jié)果表明采用改進算法后的轉(zhuǎn)換語音和目標語音較為接近,語音轉(zhuǎn)換系統(tǒng)的質(zhì)量得到了提高。
【關(guān)鍵詞】:語音轉(zhuǎn)換系統(tǒng) 時長改進 高斯混合模型 目標語音
【學位授予單位】:長江大學
【學位級別】:碩士
【學位授予年份】:2015
【分類號】:TN912.3
【目錄】:
- 摘要4-5
- 英文摘要5-8
- 第一章 緒論8-12
- 1.1 語音轉(zhuǎn)換的研究意義8-9
- 1.2 國內(nèi)外研究動態(tài)9-10
- 1.3 面臨的主要問題10
- 1.4 本文的研究內(nèi)容及章節(jié)安排10-12
- 第二章 語音轉(zhuǎn)換理論基礎(chǔ)12-25
- 2.1 語音信號基礎(chǔ)理論12-17
- 2.2 語音系統(tǒng)的數(shù)學模型17-21
- 2.3 語音轉(zhuǎn)換基本原理21-24
- 2.4 本章小結(jié)24-25
- 第三章 語音信號分析與特征參數(shù)的提取25-41
- 3.1 語音信號的預處理25-28
- 3.2 語音信號時域分析28-36
- 3.3 語音信號特征參數(shù)與提取方法36-39
- 3.4 本章小結(jié)39-41
- 第四章 語音轉(zhuǎn)換系統(tǒng)41-48
- 4.1 語音庫的設(shè)計41
- 4.2 語音的頻譜變換41-45
- 4.3 韻律的變換45-47
- 4.4 本章小結(jié)47-48
- 第五章 仿真實現(xiàn)48-65
- 5.1 GMM中模型參數(shù)估計48-50
- 5.2 高斯混合模型用于語音頻譜包絡(luò)的轉(zhuǎn)換50-51
- 5.3 語音轉(zhuǎn)換系統(tǒng)的性能評價標準51-54
- 5.4 基本GMM語音轉(zhuǎn)換系統(tǒng)的仿真結(jié)果與分析54-57
- 5.5 基于時長變化的GMM語音轉(zhuǎn)換系統(tǒng)的實現(xiàn)57-64
- 5.6 本章小結(jié)64-65
- 第六章 總結(jié)與展望65-67
- 致謝67-68
- 參考文獻68-71
- 個人簡介71-72
【參考文獻】
中國期刊全文數(shù)據(jù)庫 前9條
1 徐寧;楊震;;基于聲門波分離的預測型語音轉(zhuǎn)換系統(tǒng)[J];信號處理;2009年04期
2 徐寧;楊震;;高合成質(zhì)量的語音轉(zhuǎn)換系統(tǒng)[J];應用科學學報;2008年04期
3 朱維彬;呂士楠;;基于語義的語音合成——語音合成技術(shù)的現(xiàn)狀及展望[J];北京理工大學學報;2007年05期
4 康永國;雙志偉;陶建華;張維;;基于混合映射模型的語音轉(zhuǎn)換算法研究[J];聲學學報;2006年06期
5 左國玉,劉文舉,阮曉鋼;基于遺傳徑向基神經(jīng)網(wǎng)絡(luò)的聲音轉(zhuǎn)換[J];中文信息學報;2004年01期
6 王金明,張雄偉;話者識別系統(tǒng)中語音特征參數(shù)的研究與仿真[J];系統(tǒng)仿真學報;2003年09期
7 王強,余岳峰,張浩炯;利用人工神經(jīng)網(wǎng)絡(luò)實現(xiàn)函數(shù)逼近[J];計算機仿真;2002年05期
8 朱廷劭,高文;基于數(shù)據(jù)挖掘的普通話韻律規(guī)則學習[J];計算機學報;2000年11期
9 梁志強,李海洲;線性預測編碼在變音長語音合成中的應用[J];華南理工大學學報(自然科學版);1998年03期
中國博士學位論文全文數(shù)據(jù)庫 前2條
1 孫俊;基于激勵源及其韻律特征的源—目標說話人聲音轉(zhuǎn)換研究[D];中國科學技術(shù)大學;2006年
2 李波;語音轉(zhuǎn)換的關(guān)鍵技術(shù)研究[D];國防科學技術(shù)大學;2005年
中國碩士學位論文全文數(shù)據(jù)庫 前3條
1 周瑩;高質(zhì)量語音轉(zhuǎn)換系統(tǒng)中關(guān)鍵技術(shù)的研究[D];南京郵電大學;2012年
2 張炳;基于改進GMM和韻律聯(lián)合短時譜的說話人轉(zhuǎn)換[D];蘇州大學;2008年
3 陳迪;語音參數(shù)提取算法研究及系統(tǒng)實現(xiàn)[D];重慶大學;2007年
本文關(guān)鍵詞:基于時長變化的GMM語音轉(zhuǎn)換系統(tǒng),由筆耕文化傳播整理發(fā)布。
,本文編號:401153
本文鏈接:http://sikaile.net/kejilunwen/wltx/401153.html