基于時長變化的GMM語音轉(zhuǎn)換系統(tǒng)

發(fā)布時間：2017-05-27 21:01

本文關(guān)鍵詞：基于時長變化的GMM語音轉(zhuǎn)換系統(tǒng)，由筆耕文化傳播整理發(fā)布。

【摘要】：語音信號中除了包含語音內(nèi)容信息外,還包含說話人聲音特征形式信息。在保證發(fā)音者語音內(nèi)容訊息不發(fā)生變化的前提下,通過轉(zhuǎn)變源說話人的語音個人特性,使之具備目標說話人語音個人特征的技術(shù)稱為語音轉(zhuǎn)換。這項技術(shù)幾乎囊括了語音信號處理領(lǐng)域的各個方面,是當前比較熱門的技術(shù)之一。針對語音的韻律特征,它對轉(zhuǎn)換系統(tǒng)最終的合成語音的自然度、可懂度有很大影響。本課題在基于傳統(tǒng)高斯混合模型的語音轉(zhuǎn)換系統(tǒng)上提出對轉(zhuǎn)換后韻律特征中的時長進行改變的算法,填補了以往通過GMM模型轉(zhuǎn)換后語音自然度不高的弊端,提高轉(zhuǎn)換后語音的可懂度。本論文主要探究了基于高斯混合模型的語音轉(zhuǎn)換系統(tǒng)中所使用的重要技術(shù),再對轉(zhuǎn)換后的語音進行測評,分為客觀評價與主觀評價,以此判定所設(shè)計出的轉(zhuǎn)換系統(tǒng)的好壞程度。主要工作如下：1、基于時長變換的語音轉(zhuǎn)換系統(tǒng)除了完成基本的語音轉(zhuǎn)換要求外,還解決了經(jīng)系統(tǒng)轉(zhuǎn)換之后獲得的合成語音音質(zhì)不自然粗糙等問題；從語音的發(fā)聲機理開始研究適合于語音轉(zhuǎn)換系統(tǒng)的語音分析模型,與其相對應的語音參數(shù)以及用于語音轉(zhuǎn)換系統(tǒng)中的轉(zhuǎn)換算法。著重研究了基于高斯混合模型的語音轉(zhuǎn)換系統(tǒng)的主要算法,并對其進行了仿真實現(xiàn),給出了主客觀測試結(jié)果。2、針對傳統(tǒng)語音轉(zhuǎn)換系統(tǒng)普遍存在的語音自然度低的問題,提出并實現(xiàn)了一種基于時長變化的語音轉(zhuǎn)換系統(tǒng)的改進算法,通過對轉(zhuǎn)換后的參數(shù)插值變換來改變語音的時長。測評結(jié)果表明經(jīng)過改進后的轉(zhuǎn)換語音自然度和可懂度都有一定程度的提高。3、在采取上述改進算法的GMM語音轉(zhuǎn)換系統(tǒng)中,選取更利于人耳聲音感知的美爾倒譜參數(shù)MFCC進行變換操作：給出了轉(zhuǎn)換前后語音的MFCC三維圖以及語音波形圖,實驗結(jié)果表明采用改進算法后的轉(zhuǎn)換語音和目標語音較為接近,語音轉(zhuǎn)換系統(tǒng)的質(zhì)量得到了提高。
【關(guān)鍵詞】：語音轉(zhuǎn)換系統(tǒng) 時長改進 高斯混合模型 目標語音
【學位授予單位】：長江大學
【學位級別】：碩士
【學位授予年份】：2015
【分類號】：TN912.3
【目錄】：

摘要4-5
英文摘要5-8
第一章緒論8-12
1.1 語音轉(zhuǎn)換的研究意義8-9
1.2 國內(nèi)外研究動態(tài)9-10
1.3 面臨的主要問題10
1.4 本文的研究內(nèi)容及章節(jié)安排10-12
第二章語音轉(zhuǎn)換理論基礎(chǔ)12-25
2.1 語音信號基礎(chǔ)理論12-17
2.2 語音系統(tǒng)的數(shù)學模型17-21
2.3 語音轉(zhuǎn)換基本原理21-24
2.4 本章小結(jié)24-25
第三章語音信號分析與特征參數(shù)的提取25-41
3.1 語音信號的預處理25-28
3.2 語音信號時域分析28-36
3.3 語音信號特征參數(shù)與提取方法36-39
3.4 本章小結(jié)39-41
第四章語音轉(zhuǎn)換系統(tǒng)41-48
4.1 語音庫的設(shè)計41
4.2 語音的頻譜變換41-45
4.3 韻律的變換45-47
4.4 本章小結(jié)47-48
第五章仿真實現(xiàn)48-65
5.1 GMM中模型參數(shù)估計48-50
5.2 高斯混合模型用于語音頻譜包絡(luò)的轉(zhuǎn)換50-51
5.3 語音轉(zhuǎn)換系統(tǒng)的性能評價標準51-54
5.4 基本GMM語音轉(zhuǎn)換系統(tǒng)的仿真結(jié)果與分析54-57
5.5 基于時長變化的GMM語音轉(zhuǎn)換系統(tǒng)的實現(xiàn)57-64
5.6 本章小結(jié)64-65
第六章總結(jié)與展望65-67
致謝67-68
參考文獻68-71
個人簡介71-72

【參考文獻】

中國期刊全文數(shù)據(jù)庫前9條

1 徐寧;楊震;;基于聲門波分離的預測型語音轉(zhuǎn)換系統(tǒng)[J];信號處理;2009年04期

2 徐寧;楊震;;高合成質(zhì)量的語音轉(zhuǎn)換系統(tǒng)[J];應用科學學報;2008年04期

3 朱維彬;呂士楠;;基于語義的語音合成——語音合成技術(shù)的現(xiàn)狀及展望[J];北京理工大學學報;2007年05期

4 康永國;雙志偉;陶建華;張維;;基于混合映射模型的語音轉(zhuǎn)換算法研究[J];聲學學報;2006年06期

5 左國玉,劉文舉,阮曉鋼;基于遺傳徑向基神經(jīng)網(wǎng)絡(luò)的聲音轉(zhuǎn)換[J];中文信息學報;2004年01期

6 王金明,張雄偉;話者識別系統(tǒng)中語音特征參數(shù)的研究與仿真[J];系統(tǒng)仿真學報;2003年09期

7 王強,余岳峰,張浩炯;利用人工神經(jīng)網(wǎng)絡(luò)實現(xiàn)函數(shù)逼近[J];計算機仿真;2002年05期

8 朱廷劭,高文;基于數(shù)據(jù)挖掘的普通話韻律規(guī)則學習[J];計算機學報;2000年11期

9 梁志強,李海洲;線性預測編碼在變音長語音合成中的應用[J];華南理工大學學報(自然科學版);1998年03期

中國博士學位論文全文數(shù)據(jù)庫前2條

1 孫俊;基于激勵源及其韻律特征的源—目標說話人聲音轉(zhuǎn)換研究[D];中國科學技術(shù)大學;2006年

2 李波;語音轉(zhuǎn)換的關(guān)鍵技術(shù)研究[D];國防科學技術(shù)大學;2005年

中國碩士學位論文全文數(shù)據(jù)庫前3條

1 周瑩;高質(zhì)量語音轉(zhuǎn)換系統(tǒng)中關(guān)鍵技術(shù)的研究[D];南京郵電大學;2012年

2 張炳;基于改進GMM和韻律聯(lián)合短時譜的說話人轉(zhuǎn)換[D];蘇州大學;2008年

3 陳迪;語音參數(shù)提取算法研究及系統(tǒng)實現(xiàn)[D];重慶大學;2007年

本文關(guān)鍵詞：基于時長變化的GMM語音轉(zhuǎn)換系統(tǒng)，由筆耕文化傳播整理發(fā)布。

，

本文編號：401153

資料下載

論文發(fā)表

支付寶下載

Download by Alipay
微信下載

Download by Wechat
會員下載

Download by Member

本文鏈接：http://sikaile.net/kejilunwen/wltx/401153.html

上一篇：基于云計算的視頻監(jiān)控系統(tǒng)設(shè)計
下一篇：基于物聯(lián)網(wǎng)的樓宇電磁檢測系統(tǒng)設(shè)計

論文發(fā)表

·知網(wǎng)|萬方|維普|龍源|省級|國家級|科技核心|北大核心|南大核心CSSCI|EI|SCI|SSCI|

天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

基于時長變化的GMM語音轉(zhuǎn)換系統(tǒng)