基于聲道譜參數(shù)的語音轉(zhuǎn)換算法研究
本文關(guān)鍵詞:基于聲道譜參數(shù)的語音轉(zhuǎn)換算法研究
更多相關(guān)文章: 語音轉(zhuǎn)換 聲道譜轉(zhuǎn)換 高斯混合模型 人工神經(jīng)網(wǎng)絡(luò) 模糊K均值聚類 小波變換 自適應(yīng)粒子群
【摘要】:語音轉(zhuǎn)換技術(shù)是在保留源說話人語義信息不變的前提下,將源說話人的個性特征進(jìn)行轉(zhuǎn)換,使之聽起來像目標(biāo)說話人的聲音。本文主要研究基于聲道譜特征參數(shù)的語音轉(zhuǎn)換技術(shù),主要內(nèi)容包括:(1)針對傳統(tǒng)的高斯混合模型沒有描述說話人間的非線性關(guān)系以及易出現(xiàn)過平滑導(dǎo)致轉(zhuǎn)換語音質(zhì)量不理想的現(xiàn)象,提出基于高斯混合模型與人工神經(jīng)網(wǎng)絡(luò)的混合模型語音轉(zhuǎn)換算法,采用徑向基函數(shù)神經(jīng)網(wǎng)絡(luò)對高斯混合模型的均值參數(shù)進(jìn)行轉(zhuǎn)換,建立新的轉(zhuǎn)換規(guī)則。主觀和客觀測試表明,該方法提高了經(jīng)典語音轉(zhuǎn)換系統(tǒng)的性能,改進(jìn)了轉(zhuǎn)換語音的音質(zhì)。(2)針對運(yùn)用高斯混合模型進(jìn)行語音轉(zhuǎn)換時容易出現(xiàn)的過平滑現(xiàn)象,本文將多分辨率小波分析用于語音轉(zhuǎn)換中,并在對特征參數(shù)進(jìn)行多分辨率小波分析前,先進(jìn)行模糊K均值聚類,以提高轉(zhuǎn)換精度與轉(zhuǎn)換速度。仿真實驗表明:該算法在提高轉(zhuǎn)換速度的前提下,提高了轉(zhuǎn)換語音的清晰度與可懂度。(3)針對運(yùn)用傳統(tǒng)方法訓(xùn)練徑向基函數(shù)神經(jīng)網(wǎng)絡(luò)出現(xiàn)的收斂速度慢、易陷入局部最優(yōu)、泛化性能不佳的問題,提出用自適應(yīng)粒子群優(yōu)化算法訓(xùn)練徑向基函數(shù)神經(jīng)網(wǎng)絡(luò)進(jìn)行語音特征建模,獲取說話人譜包絡(luò)的映射關(guān)系。主觀和客觀實驗表明:該算法能夠降低轉(zhuǎn)換語音的頻譜失真,提高轉(zhuǎn)換語音與目標(biāo)語音的相似性。
【關(guān)鍵詞】:語音轉(zhuǎn)換 聲道譜轉(zhuǎn)換 高斯混合模型 人工神經(jīng)網(wǎng)絡(luò) 模糊K均值聚類 小波變換 自適應(yīng)粒子群
【學(xué)位授予單位】:南京郵電大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2015
【分類號】:TN912.3
【目錄】:
- 摘要4-5
- Abstract5-8
- 專用術(shù)語注釋表8-9
- 第一章 緒論9-14
- 1.1 語音轉(zhuǎn)換的研究背景9
- 1.2 語音轉(zhuǎn)換的研究意義9-10
- 1.3 語音轉(zhuǎn)換的發(fā)展歷程10-12
- 1.4 語音轉(zhuǎn)換的主要研究內(nèi)容12
- 1.5 論文的結(jié)構(gòu)安排12-14
- 第二章 語音轉(zhuǎn)換技術(shù)的相關(guān)原理概述14-24
- 2.1 語音信號的產(chǎn)生原理14-15
- 2.2 語音信號的分析與合成模型15-16
- 2.2.1 線性預(yù)測編碼模型15-16
- 2.2.2 諧波加噪聲模型16
- 2.2.3 STRAIGHT模型16
- 2.3 常用的特征參數(shù)及其提取16-17
- 2.3.1 線性預(yù)測系數(shù)17
- 2.3.2 線譜頻率參數(shù)17
- 2.4 特征參數(shù)的對齊17-19
- 2.4.1 平行特征參數(shù)的對齊18
- 2.4.2 非平行特征參數(shù)的對齊18-19
- 2.4.3 無特征參數(shù)的對齊19
- 2.5 說話人特征參數(shù)的轉(zhuǎn)換算法19-22
- 2.5.1 譜特征參數(shù)的轉(zhuǎn)換19-21
- 2.5.2 韻律特征參數(shù)的轉(zhuǎn)換21-22
- 2.6 語音轉(zhuǎn)換的評價指標(biāo)22-23
- 2.6.1 主觀評價22
- 2.6.2 客觀評價22-23
- 2.7 本章小結(jié)23-24
- 第三章 基于GMM與ANN的混合語音轉(zhuǎn)換算法研究24-30
- 3.1 引言24
- 3.2 高斯混合模型24-25
- 3.3 人工神經(jīng)網(wǎng)絡(luò)模型25-26
- 3.4 基于GMM與ANN的混合語音轉(zhuǎn)換26
- 3.5 實驗與仿真26-29
- 3.5.1 實驗條件27
- 3.5.2 主觀評價27-28
- 3.5.3 客觀評價28-29
- 3.6 本章小結(jié)29-30
- 第四章 基于聚類與小波分析的頻譜轉(zhuǎn)換系統(tǒng)30-39
- 4.1 引言30
- 4.2 模糊K均值聚類算法30-32
- 4.3 小波分析32-34
- 4.4 基于模糊K均值聚類與小波分析的頻譜轉(zhuǎn)換34-35
- 4.5 實驗與仿真35-38
- 4.5.1 數(shù)據(jù)庫36
- 4.5.2 主觀評價36-37
- 4.5.3 客觀評價37-38
- 4.6 本章小結(jié)38-39
- 第五章 基于自適應(yīng)粒子群優(yōu)化RBF神經(jīng)網(wǎng)絡(luò)的語音轉(zhuǎn)換39-47
- 5.1 引言39
- 5.2 算法描述39-43
- 5.2.1 徑向基函數(shù)神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu)及其參數(shù)分析40-41
- 5.2.2 自適應(yīng)粒子群算法41-42
- 5.2.3 基于自適應(yīng)粒子群優(yōu)化的徑向基函數(shù)神經(jīng)網(wǎng)絡(luò)42-43
- 5.3 實驗與仿真43-45
- 5.3.1 數(shù)據(jù)庫43
- 5.3.2 主觀評價43-44
- 5.3.3 客觀評價44-45
- 5.4 本章小結(jié)45-47
- 第六章 總結(jié)與展望47-49
- 6.1 總結(jié)47-48
- 6.2 展望48-49
- 參考文獻(xiàn)49-52
- 附錄1 攻讀碩士學(xué)位期間撰寫的論文52-53
- 附錄2 攻讀碩士學(xué)位期間參加的科研項目53-54
- 致謝54
【相似文獻(xiàn)】
中國期刊全文數(shù)據(jù)庫 前10條
1 張敏,趙猛,賈云得,王俊;基于自適應(yīng)高斯混合模型的圖像穩(wěn)定方法[J];北京理工大學(xué)學(xué)報;2004年10期
2 趙征鵬,楊鑒;基于高斯混合模型的非母語說話人口音識別[J];計算機(jī)工程;2005年06期
3 侯建華;熊承義;田金文;柳健;;圖像小波系數(shù)的高斯混合模型研究[J];計算機(jī)應(yīng)用;2006年03期
4 顧明亮;馬勇;;基于高斯混合模型的漢語方言辨識系統(tǒng)[J];計算機(jī)工程與應(yīng)用;2007年03期
5 袁禮海;李釗;宋建社;;利用高斯混合模型實現(xiàn)概率密度函數(shù)逼近[J];無線電通信技術(shù);2007年02期
6 張超瓊;苗奪謙;岳曉冬;;基于高斯混合模型的語音性別識別[J];計算機(jī)應(yīng)用;2008年S2期
7 許曉東;熊衛(wèi)斌;朱士瑞;;基于高斯混合模型的流量矩陣估算研究[J];計算機(jī)工程;2009年14期
8 王岐學(xué);錢盛友;趙新民;;基于差分特征和高斯混合模型的湖南方言識別[J];計算機(jī)工程與應(yīng)用;2009年35期
9 韓曉峰;;基于自回歸的高斯混合模型[J];科技風(fēng);2009年23期
10 馬超;張政石;;基于二維高斯混合模型的駕駛行為分析[J];硅谷;2011年05期
中國重要會議論文全文數(shù)據(jù)庫 前10條
1 駱俊;馬盡文;;高斯混合模型的遺傳分基融合算法[A];第十二屆全國信號處理學(xué)術(shù)年會(CCSP-2005)論文集[C];2005年
2 廖頻;沈理;;基于高斯混合模型的人臉圖象識別研究[A];2001年中國智能自動化會議論文集(上冊)[C];2001年
3 馬盡文;何學(xué)鋒;;高斯混合模型的數(shù)據(jù)尺度可壓縮參數(shù)學(xué)習(xí)算法[A];第十四屆全國信號處理學(xué)術(shù)年會(CCSP-2009)論文集[C];2009年
4 瞿俊;姜青山;董槐林;;基于高斯混合模型的層次聚類算法[A];第二十三屆中國數(shù)據(jù)庫學(xué)術(shù)會議論文集(研究報告篇)[C];2006年
5 蔡念;郭文婷;陳世文;潘晴;;融合高斯混合模型和小波變換的運(yùn)動目標(biāo)檢測[A];第十五屆全國圖象圖形學(xué)學(xué)術(shù)會議論文集[C];2010年
6 龍艷花;郭武;戴禮榮;;一種應(yīng)用于SVM說話者確認(rèn)系統(tǒng)的新型序列核[A];第九屆全國人機(jī)語音通訊學(xué)術(shù)會議論文集[C];2007年
7 劉李漫;陶文兵;田金文;;融合多高斯混合模型與Graph Cuts優(yōu)化技術(shù)的目標(biāo)自動檢測方法[A];第十五屆全國圖象圖形學(xué)學(xué)術(shù)會議論文集[C];2010年
8 康永國;雙志偉;陶建華;張維;徐波;;高斯混合模型和碼本映射相結(jié)合的語音轉(zhuǎn)換算法[A];第八屆全國人機(jī)語音通訊學(xué)術(shù)會議論文集[C];2005年
9 應(yīng)冬文;顏永紅;付強(qiáng);國雁萌;;基于約束高斯混合模型的噪聲功率譜估計[A];2010年通信理論與信號處理學(xué)術(shù)年會論文集[C];2010年
10 唐英干;劉東;關(guān)新平;;基于高斯混合模型的多分辨率圖像分割[A];第十二屆全國圖象圖形學(xué)學(xué)術(shù)會議論文集[C];2005年
中國博士學(xué)位論文全文數(shù)據(jù)庫 前5條
1 王益文;復(fù)雜網(wǎng)絡(luò)節(jié)點影響力模型及其應(yīng)用[D];浙江大學(xué);2015年
2 陳雪峰;圖像高斯混合模型的判別學(xué)習(xí)方法[D];北京理工大學(xué);2009年
3 賴裕平;非高斯混合模型的變分學(xué)習(xí)算法研究[D];北京郵電大學(xué);2014年
4 劉輝;miRNA靶標(biāo)預(yù)測的系統(tǒng)生物學(xué)方法研究[D];中國礦業(yè)大學(xué);2009年
5 陶建斌;貝葉斯網(wǎng)絡(luò)模型在遙感影像分類中的應(yīng)用方法研究[D];武漢大學(xué);2010年
中國碩士學(xué)位論文全文數(shù)據(jù)庫 前10條
1 范苗;基于高斯混合模型的時變過程軟測量建模[D];浙江大學(xué);2015年
2 許莉薇;基于高斯混合模型林業(yè)信息文本分類的技術(shù)研究[D];東北林業(yè)大學(xué);2015年
3 車瀅霞;約束條件下的結(jié)構(gòu)化統(tǒng)計聲學(xué)模型及非平行語料語音轉(zhuǎn)換[D];蘇州大學(xué);2015年
4 張曉紅;基于候選生成的貓臉檢測[D];哈爾濱工業(yè)大學(xué);2015年
5 付娜;基于視頻的運(yùn)動人體行為捕捉算法研究[D];北京理工大學(xué);2015年
6 王炳輝;基于層次貝葉斯自適應(yīng)稀疏的高斯混合模型[D];大連理工大學(xué);2015年
7 邱藤;基于高斯混合模型的EM算法及其應(yīng)用研究[D];電子科技大學(xué);2015年
8 張小林;基于高斯混合模型和非負(fù)矩陣分解的復(fù)雜網(wǎng)絡(luò)社區(qū)檢測[D];西安電子科技大學(xué);2014年
9 姚紹芹;基于聲道譜參數(shù)的語音轉(zhuǎn)換算法研究[D];南京郵電大學(xué);2015年
10 韓曉峰;高斯混合模型及在探測網(wǎng)絡(luò)社區(qū)結(jié)構(gòu)中的應(yīng)用[D];山東科技大學(xué);2010年
,本文編號:794866
本文鏈接:http://sikaile.net/kejilunwen/wltx/794866.html