基于GMM和ANN混合模型的語音轉(zhuǎn)換方法
[Abstract]:In order to overcome the phenomenon of over-smoothing in the process of speech conversion using Gao Si mixed model (Gaussian mixture model,GMM), considering that the mean value of the parameters of GMM model can represent the spectrum envelope shape of the conversion feature. A speech conversion method based on GMM and artificial neural network (Artificial neural network,ANN) hybrid model is proposed. In this method, ANN is used to convert the mean value of GMM model parameters, and in order to obtain the continuous conversion spectrum, the static and dynamic spectrum features are combined to approximate the converted spectrum sequence. In view of the importance of fundamental frequency to speech conversion, the fundamental frequency is analyzed and converted on the basis of spectrum conversion. Finally, the performance of the proposed speech conversion method is tested by subjective and objective experiments. The experimental results show that the proposed method can achieve better speech conversion than the traditional speech conversion method based on GMM model.
【作者單位】: 南京郵電大學(xué)通信與信息工程學(xué)院;
【基金】:江蘇省高校自然科學(xué)研究(13KJA510003)重大資助項(xiàng)目 江蘇高校優(yōu)勢學(xué)科建設(shè)工程(PAPD)資助項(xiàng)目 江蘇省普通高校研究生科研創(chuàng)新計(jì)劃(CXLX12_0478,CXZZ13_0488)資助項(xiàng)目
【分類號】:TN912.3
【參考文獻(xiàn)】
相關(guān)期刊論文 前2條
1 岳振軍;鄒翔;王浩;;基于隱馬爾可夫模型和高斯混合模型結(jié)合的聲音轉(zhuǎn)換方法[J];數(shù)據(jù)采集與處理;2009年03期
2 孫健;張雄偉;曹鐵勇;楊吉斌;孫新建;;基于卷積非負(fù)矩陣分解的語音轉(zhuǎn)換方法[J];數(shù)據(jù)采集與處理;2013年02期
【共引文獻(xiàn)】
相關(guān)期刊論文 前10條
1 馬振;張雄偉;楊吉斌;徐玉龍;;基于稀疏卷積非負(fù)矩陣分解的語音轉(zhuǎn)換方法研究[J];軍事通信技術(shù);2013年02期
2 宮朝輝;刁麓弘;;改進(jìn)共振峰提取的語音端點(diǎn)檢測[J];計(jì)算機(jī)輔助設(shè)計(jì)與圖形學(xué)學(xué)報(bào);2013年08期
3 XU Ning;BAO JingYi;LIU XiaoFeng;JIANG AiMing;TANG YiBing;;Voice conversion towards modeling dynamic characteristics using switching state space model[J];Science China(Information Sciences);2013年12期
4 趙建東;高光來;飛龍;;基于HMM的蒙古語語音合成技術(shù)研究[J];計(jì)算機(jī)科學(xué);2014年01期
5 孫健;張雄偉;曹鐵勇;楊吉斌;孫新建;;基于卷積非負(fù)矩陣分解的語音轉(zhuǎn)換方法[J];數(shù)據(jù)采集與處理;2013年02期
6 孟凡博;吳志勇;蒙美玲;賈珈;蔡蓮紅;;基于決策樹的英語焦點(diǎn)語音轉(zhuǎn)換[J];清華大學(xué)學(xué)報(bào)(自然科學(xué)版);2013年07期
7 高新波;王笛;王秀美;;一種潛在信息約束的非負(fù)矩陣分解方法[J];數(shù)據(jù)采集與處理;2014年01期
8 張立偉;賈沖;張雄偉;閔剛;曾理;;稀疏卷積非負(fù)矩陣分解的語音增強(qiáng)算法[J];數(shù)據(jù)采集與處理;2014年02期
9 趙yN;張盛;林孝康;;一種改進(jìn)的基音周期提取算法[J];數(shù)據(jù)采集與處理;2014年02期
10 馬振;張雄偉;楊吉斌;;基于語音個(gè)人特征信息分離的語音轉(zhuǎn)換方法研究[J];信號處理;2013年04期
相關(guān)會議論文 前2條
1 王海燕;楊鴻武;甘振業(yè);裴東;;基于說話人自適應(yīng)訓(xùn)練的漢藏雙語語音合成[A];第十二屆全國人機(jī)語音通訊學(xué)術(shù)會議(NCMMSC'2013)論文集[C];2013年
2 王朝民;謝湘;匡鏡明;;一種嵌入式中文語音合成系統(tǒng)非周期成分音節(jié)層建模方法[A];第十二屆全國人機(jī)語音通訊學(xué)術(shù)會議(NCMMSC'2013)論文集[C];2013年
相關(guān)博士學(xué)位論文 前1條
1 陳凌輝;說話人轉(zhuǎn)換建模方法研究[D];中國科學(xué)技術(shù)大學(xué);2013年
相關(guān)碩士學(xué)位論文 前7條
1 楊靜;基于RTFI的鋼琴音樂多基頻估計(jì)[D];西南交通大學(xué);2013年
2 楊曼;基于GMM和BP網(wǎng)絡(luò)的語音轉(zhuǎn)換系統(tǒng)設(shè)計(jì)[D];武漢理工大學(xué);2013年
3 何彬;基于語音識別和語音合成的漢語語音轉(zhuǎn)換技術(shù)研究[D];云南大學(xué);2013年
4 任鵬輝;情感語音合成系統(tǒng)的研究與實(shí)現(xiàn)[D];太原理工大學(xué);2013年
5 李冰潔;采用譜—韻律雙變換的語音情感轉(zhuǎn)換[D];蘇州大學(xué);2013年
6 孫廣武;音素關(guān)聯(lián)的多文種語音融合[D];湘潭大學(xué);2013年
7 王紅麗;基于FDA的語音基頻建模的研究[D];西北師范大學(xué);2013年
【二級參考文獻(xiàn)】
相關(guān)期刊論文 前5條
1 左國玉,劉文舉,阮曉鋼;聲音轉(zhuǎn)換技術(shù)的研究與進(jìn)展[J];電子學(xué)報(bào);2004年07期
2 徐寧;楊震;張玲華;;基于狀態(tài)空間模型的子頻帶語音轉(zhuǎn)換算法[J];電子學(xué)報(bào);2010年03期
3 雙志偉;張世磊;秦勇;;語音轉(zhuǎn)換分析及相似度改進(jìn)[J];清華大學(xué)學(xué)報(bào)(自然科學(xué)版);2009年S1期
4 岳振軍;鄒翔;王浩;;基于隱馬爾可夫模型和高斯混合模型結(jié)合的聲音轉(zhuǎn)換方法[J];數(shù)據(jù)采集與處理;2009年03期
5 李波,王成友,蔡宣平,張爾揚(yáng);LPC與LSF轉(zhuǎn)換算法的比較研究[J];信號處理;2004年05期
【相似文獻(xiàn)】
相關(guān)期刊論文 前10條
1 劉大鵬;尾關(guān)和彥;朱慶生;;添加音素持續(xù)時(shí)間信息到頻譜模型的說話人辨認(rèn)研究[J];計(jì)算機(jī)技術(shù)與發(fā)展;2007年05期
2 牛濱;孔令志;羅森林;潘麗敏;郭亮;;基于MFCC和GMM的個(gè)性音樂推薦模型[J];北京理工大學(xué)學(xué)報(bào);2009年04期
3 陳俊;盛利元;;基于LSP線譜對參數(shù)的GMM說話人識別系統(tǒng)[J];微計(jì)算機(jī)信息;2010年04期
4 趙義正;;改進(jìn)GMM譜包絡(luò)轉(zhuǎn)換性能的語音轉(zhuǎn)換算法研究[J];科學(xué)技術(shù)與工程;2010年17期
5 曾秀花;楊鑒;徐永華;;語種辨識的多特征信息應(yīng)用[J];計(jì)算機(jī)工程與應(yīng)用;2010年25期
6 趙義正;;一種新的分維高斯混合模型語音轉(zhuǎn)換方法[J];計(jì)算機(jī)與現(xiàn)代化;2010年09期
7 馮琦,周德云,侯明善;基于徑向基函數(shù)神經(jīng)網(wǎng)絡(luò)的機(jī)載數(shù)字地圖壓縮方法[J];西北工業(yè)大學(xué)學(xué)報(bào);2003年03期
8 呂聲,尹俊勛;同語種說話人轉(zhuǎn)換的實(shí)現(xiàn)[J];移動(dòng)通信;2004年S3期
9 胡海清;張歆奕;;應(yīng)用于說話人識別的AdaBoost GMM算法[J];五邑大學(xué)學(xué)報(bào)(自然科學(xué)版);2006年03期
10 楊輝;彭良玉;陸世專;;基于小波域高斯混合模型與中值濾波的圖像去噪研究[J];電子技術(shù)應(yīng)用;2007年05期
相關(guān)會議論文 前10條
1 應(yīng)冬文;顏永紅;付強(qiáng);國雁萌;;基于約束高斯混合模型的噪聲功率譜估計(jì)[A];2010年通信理論與信號處理學(xué)術(shù)年會論文集[C];2010年
2 卓群;歐貴文;;基于模糊高斯混合模型的說話人識別算法的一些改進(jìn)[A];第六屆全國人機(jī)語音通訊學(xué)術(shù)會議論文集[C];2001年
3 王瑩;景新幸;楊海燕;;改進(jìn)EM算法的高斯混合模型在說話人識別中的應(yīng)用[A];2008年全國聲學(xué)學(xué)術(shù)會議論文集[C];2008年
4 周潔;;基于高斯混合模型的情感語音轉(zhuǎn)換[A];2011'中國西部聲學(xué)學(xué)術(shù)交流會論文集[C];2011年
5 鮑福良;方志剛;徐潔;;基于MFCC和GMM的說話人確認(rèn)研究[A];第六屆全國信息獲取與處理學(xué)術(shù)會議論文集(2)[C];2008年
6 洪青陽;陳毅東;;一種用于說話人確認(rèn)的區(qū)別性訓(xùn)練方法[A];第八屆全國人機(jī)語音通訊學(xué)術(shù)會議論文集[C];2005年
7 馬建春;劉文舉;;基于共振峰和高斯混合模型的聲音轉(zhuǎn)換系統(tǒng)[A];第八屆全國人機(jī)語音通訊學(xué)術(shù)會議論文集[C];2005年
8 李葦營;湯笑梅;易克初;胡征;;有限狀態(tài)徑向基函數(shù)網(wǎng)絡(luò)結(jié)構(gòu)在語音識別中的應(yīng)用[A];第三屆全國人機(jī)語音通訊學(xué)術(shù)會議論文集[C];1994年
9 康永國;雙志偉;陶建華;張維;徐波;;高斯混合模型和碼本映射相結(jié)合的語音轉(zhuǎn)換算法[A];第八屆全國人機(jī)語音通訊學(xué)術(shù)會議論文集[C];2005年
10 石如亮;李弼程;王波;;語音編碼對說話人識別系統(tǒng)的影響(英文)[A];第二屆和諧人機(jī)環(huán)境聯(lián)合學(xué)術(shù)會議(HHME2006)——第15屆中國多媒體學(xué)術(shù)會議(NCMT'06)論文集[C];2006年
相關(guān)博士學(xué)位論文 前10條
1 呂聲;說話人轉(zhuǎn)換方法的研究[D];華南理工大學(xué);2004年
2 張?jiān)?基于高斯混合模型的無線傳感器網(wǎng)絡(luò)節(jié)點(diǎn)定位算法的研究[D];吉林大學(xué);2010年
3 唐李軍;Cubature卡爾曼濾波及其在導(dǎo)航中的應(yīng)用研究[D];哈爾濱工程大學(xué);2012年
4 林琳;基于模糊聚類與遺傳算法的說話人識別理論研究及應(yīng)用[D];吉林大學(xué);2007年
5 鄢田云;神經(jīng)網(wǎng)絡(luò)在語音質(zhì)量客觀評價(jià)應(yīng)用中的研究[D];西南交通大學(xué);2007年
6 陳淼;基于信號強(qiáng)度的WLAN室內(nèi)定位跟蹤系統(tǒng)研究[D];武漢大學(xué);2012年
7 李強(qiáng);分布源目標(biāo)方位估計(jì)研究[D];西北工業(yè)大學(xué);2007年
8 孫佳音;音樂要素自動(dòng)分析關(guān)鍵技術(shù)研究[D];哈爾濱工業(yè)大學(xué);2011年
9 錢博;基于漢語元音映射的說話人識別技術(shù)研究[D];南京理工大學(xué);2007年
10 李新欣;船舶及鯨類聲信號特征提取和分類識別研究[D];哈爾濱工程大學(xué);2012年
相關(guān)碩士學(xué)位論文 前10條
1 丁愛明;基于MFCC和GMM的說話人識別系統(tǒng)研究[D];河海大學(xué);2006年
2 叢菡菡;基于支持相量機(jī)的穩(wěn)鍵說話人識別[D];電子科技大學(xué);2008年
3 姜可梅;檢測代替分類的腦機(jī)接口研究[D];燕山大學(xué);2011年
4 吳杰;基于高斯混合模型的話者識別系統(tǒng)的研究[D];吉林大學(xué);2008年
5 吳華玉;抗噪聲說話人識別技術(shù)研究[D];南京師范大學(xué);2008年
6 丁國梁;耳語音說話人識別的研究[D];蘇州大學(xué);2009年
7 夏妍妍;基于RBF神經(jīng)網(wǎng)絡(luò)的語音識別方法的應(yīng)用研究[D];大連海事大學(xué);2008年
8 薛峰;說話人識別及其在噪聲環(huán)境下的魯棒性研究[D];蘇州大學(xué);2009年
9 辛全超;基于GMM的說話人語音識別研究與實(shí)踐[D];華東師范大學(xué);2010年
10 徐剛;基于泛布爾代數(shù)的說話人識別算法的研究[D];武漢理工大學(xué);2006年
,本文編號:2390261
本文鏈接:http://sikaile.net/kejilunwen/wltx/2390261.html