基于時長變化的GMM語音轉換系統(tǒng)
本文關鍵詞:基于時長變化的GMM語音轉換系統(tǒng),由筆耕文化傳播整理發(fā)布。
【摘要】:語音信號中除了包含語音內容信息外,還包含說話人聲音特征形式信息。在保證發(fā)音者語音內容訊息不發(fā)生變化的前提下,通過轉變源說話人的語音個人特性,使之具備目標說話人語音個人特征的技術稱為語音轉換。這項技術幾乎囊括了語音信號處理領域的各個方面,是當前比較熱門的技術之一。針對語音的韻律特征,它對轉換系統(tǒng)最終的合成語音的自然度、可懂度有很大影響。本課題在基于傳統(tǒng)高斯混合模型的語音轉換系統(tǒng)上提出對轉換后韻律特征中的時長進行改變的算法,填補了以往通過GMM模型轉換后語音自然度不高的弊端,提高轉換后語音的可懂度。本論文主要探究了基于高斯混合模型的語音轉換系統(tǒng)中所使用的重要技術,再對轉換后的語音進行測評,分為客觀評價與主觀評價,以此判定所設計出的轉換系統(tǒng)的好壞程度。主要工作如下:1、基于時長變換的語音轉換系統(tǒng)除了完成基本的語音轉換要求外,還解決了經系統(tǒng)轉換之后獲得的合成語音音質不自然粗糙等問題;從語音的發(fā)聲機理開始研究適合于語音轉換系統(tǒng)的語音分析模型,與其相對應的語音參數(shù)以及用于語音轉換系統(tǒng)中的轉換算法。著重研究了基于高斯混合模型的語音轉換系統(tǒng)的主要算法,并對其進行了仿真實現(xiàn),給出了主客觀測試結果。2、針對傳統(tǒng)語音轉換系統(tǒng)普遍存在的語音自然度低的問題,提出并實現(xiàn)了一種基于時長變化的語音轉換系統(tǒng)的改進算法,通過對轉換后的參數(shù)插值變換來改變語音的時長。測評結果表明經過改進后的轉換語音自然度和可懂度都有一定程度的提高。3、在采取上述改進算法的GMM語音轉換系統(tǒng)中,選取更利于人耳聲音感知的美爾倒譜參數(shù)MFCC進行變換操作:給出了轉換前后語音的MFCC三維圖以及語音波形圖,實驗結果表明采用改進算法后的轉換語音和目標語音較為接近,語音轉換系統(tǒng)的質量得到了提高。
【關鍵詞】:語音轉換系統(tǒng) 時長改進 高斯混合模型 目標語音
【學位授予單位】:長江大學
【學位級別】:碩士
【學位授予年份】:2015
【分類號】:TN912.3
【目錄】:
- 摘要4-5
- 英文摘要5-8
- 第一章 緒論8-12
- 1.1 語音轉換的研究意義8-9
- 1.2 國內外研究動態(tài)9-10
- 1.3 面臨的主要問題10
- 1.4 本文的研究內容及章節(jié)安排10-12
- 第二章 語音轉換理論基礎12-25
- 2.1 語音信號基礎理論12-17
- 2.2 語音系統(tǒng)的數(shù)學模型17-21
- 2.3 語音轉換基本原理21-24
- 2.4 本章小結24-25
- 第三章 語音信號分析與特征參數(shù)的提取25-41
- 3.1 語音信號的預處理25-28
- 3.2 語音信號時域分析28-36
- 3.3 語音信號特征參數(shù)與提取方法36-39
- 3.4 本章小結39-41
- 第四章 語音轉換系統(tǒng)41-48
- 4.1 語音庫的設計41
- 4.2 語音的頻譜變換41-45
- 4.3 韻律的變換45-47
- 4.4 本章小結47-48
- 第五章 仿真實現(xiàn)48-65
- 5.1 GMM中模型參數(shù)估計48-50
- 5.2 高斯混合模型用于語音頻譜包絡的轉換50-51
- 5.3 語音轉換系統(tǒng)的性能評價標準51-54
- 5.4 基本GMM語音轉換系統(tǒng)的仿真結果與分析54-57
- 5.5 基于時長變化的GMM語音轉換系統(tǒng)的實現(xiàn)57-64
- 5.6 本章小結64-65
- 第六章 總結與展望65-67
- 致謝67-68
- 參考文獻68-71
- 個人簡介71-72
【參考文獻】
中國期刊全文數(shù)據庫 前9條
1 徐寧;楊震;;基于聲門波分離的預測型語音轉換系統(tǒng)[J];信號處理;2009年04期
2 徐寧;楊震;;高合成質量的語音轉換系統(tǒng)[J];應用科學學報;2008年04期
3 朱維彬;呂士楠;;基于語義的語音合成——語音合成技術的現(xiàn)狀及展望[J];北京理工大學學報;2007年05期
4 康永國;雙志偉;陶建華;張維;;基于混合映射模型的語音轉換算法研究[J];聲學學報;2006年06期
5 左國玉,劉文舉,阮曉鋼;基于遺傳徑向基神經網絡的聲音轉換[J];中文信息學報;2004年01期
6 王金明,張雄偉;話者識別系統(tǒng)中語音特征參數(shù)的研究與仿真[J];系統(tǒng)仿真學報;2003年09期
7 王強,余岳峰,張浩炯;利用人工神經網絡實現(xiàn)函數(shù)逼近[J];計算機仿真;2002年05期
8 朱廷劭,高文;基于數(shù)據挖掘的普通話韻律規(guī)則學習[J];計算機學報;2000年11期
9 梁志強,李海洲;線性預測編碼在變音長語音合成中的應用[J];華南理工大學學報(自然科學版);1998年03期
中國博士學位論文全文數(shù)據庫 前2條
1 孫俊;基于激勵源及其韻律特征的源—目標說話人聲音轉換研究[D];中國科學技術大學;2006年
2 李波;語音轉換的關鍵技術研究[D];國防科學技術大學;2005年
中國碩士學位論文全文數(shù)據庫 前3條
1 周瑩;高質量語音轉換系統(tǒng)中關鍵技術的研究[D];南京郵電大學;2012年
2 張炳;基于改進GMM和韻律聯(lián)合短時譜的說話人轉換[D];蘇州大學;2008年
3 陳迪;語音參數(shù)提取算法研究及系統(tǒng)實現(xiàn)[D];重慶大學;2007年
本文關鍵詞:基于時長變化的GMM語音轉換系統(tǒng),由筆耕文化傳播整理發(fā)布。
,本文編號:401153
本文鏈接:http://sikaile.net/kejilunwen/wltx/401153.html