當(dāng)前位置：主頁 > 科技論文 > 網(wǎng)絡(luò)通信論文 >

基于GMM和ANN混合模型的語音轉(zhuǎn)換方法

發(fā)布時(shí)間：2018-12-23 21:07

【摘要】：為了克服利用高斯混合模型(Gaussian mixture model,GMM)進(jìn)行語音轉(zhuǎn)換的過程中出現(xiàn)的過平滑現(xiàn)象,考慮到GMM模型參數(shù)的均值能夠表征轉(zhuǎn)換特征的頻譜包絡(luò)形狀,提出一種基于GMM與人工神經(jīng)網(wǎng)絡(luò)(Artificial neural network,ANN)混合模型的語音轉(zhuǎn)換。該方法利用ANN對(duì)GMM模型參數(shù)的均值進(jìn)行轉(zhuǎn)換;為了獲取連續(xù)的轉(zhuǎn)換頻譜,采用靜態(tài)和動(dòng)態(tài)頻譜特征相結(jié)合來逼近轉(zhuǎn)換頻譜序列;鑒于基頻對(duì)語音轉(zhuǎn)換的重要性,在頻譜轉(zhuǎn)換的基礎(chǔ)上,對(duì)基頻也進(jìn)行了分析和轉(zhuǎn)換。最后,通過主觀和客觀實(shí)驗(yàn)對(duì)提出的混合模型的語音轉(zhuǎn)換方法的性能進(jìn)行測(cè)試。實(shí)驗(yàn)結(jié)果表明,與傳統(tǒng)的基于GMM模型的語音轉(zhuǎn)換方法相比,本文提出的方法能夠獲得更好的轉(zhuǎn)換語音。
[Abstract]:In order to overcome the phenomenon of over-smoothing in the process of speech conversion using Gao Si mixed model (Gaussian mixture model,GMM), considering that the mean value of the parameters of GMM model can represent the spectrum envelope shape of the conversion feature. A speech conversion method based on GMM and artificial neural network (Artificial neural network,ANN) hybrid model is proposed. In this method, ANN is used to convert the mean value of GMM model parameters, and in order to obtain the continuous conversion spectrum, the static and dynamic spectrum features are combined to approximate the converted spectrum sequence. In view of the importance of fundamental frequency to speech conversion, the fundamental frequency is analyzed and converted on the basis of spectrum conversion. Finally, the performance of the proposed speech conversion method is tested by subjective and objective experiments. The experimental results show that the proposed method can achieve better speech conversion than the traditional speech conversion method based on GMM model.
【作者單位】：南京郵電大學(xué)通信與信息工程學(xué)院;
【基金】：江蘇省高校自然科學(xué)研究(13KJA510003)重大資助項(xiàng)目江蘇高校優(yōu)勢(shì)學(xué)科建設(shè)工程(PAPD)資助項(xiàng)目江蘇省普通高校研究生科研創(chuàng)新計(jì)劃(CXLX12_0478,CXZZ13_0488)資助項(xiàng)目
【分類號(hào)】：TN912.3

【參考文獻(xiàn)】

相關(guān)期刊論文前2條

1 岳振軍;鄒翔;王浩;;基于隱馬爾可夫模型和高斯混合模型結(jié)合的聲音轉(zhuǎn)換方法[J];數(shù)據(jù)采集與處理;2009年03期

2 孫健;張雄偉;曹鐵勇;楊吉斌;孫新建;;基于卷積非負(fù)矩陣分解的語音轉(zhuǎn)換方法[J];數(shù)據(jù)采集與處理;2013年02期

【共引文獻(xiàn)】

相關(guān)期刊論文前10條

1 馬振;張雄偉;楊吉斌;徐玉龍;;基于稀疏卷積非負(fù)矩陣分解的語音轉(zhuǎn)換方法研究[J];軍事通信技術(shù);2013年02期

2 宮朝輝;刁麓弘;;改進(jìn)共振峰提取的語音端點(diǎn)檢測(cè)[J];計(jì)算機(jī)輔助設(shè)計(jì)與圖形學(xué)學(xué)報(bào);2013年08期

3 XU Ning;BAO JingYi;LIU XiaoFeng;JIANG AiMing;TANG YiBing;;Voice conversion towards modeling dynamic characteristics using switching state space model[J];Science China(Information Sciences);2013年12期

4 趙建東;高光來;飛龍;;基于HMM的蒙古語語音合成技術(shù)研究[J];計(jì)算機(jī)科學(xué);2014年01期

5 孫健;張雄偉;曹鐵勇;楊吉斌;孫新建;;基于卷積非負(fù)矩陣分解的語音轉(zhuǎn)換方法[J];數(shù)據(jù)采集與處理;2013年02期

6 孟凡博;吳志勇;蒙美玲;賈珈;蔡蓮紅;;基于決策樹的英語焦點(diǎn)語音轉(zhuǎn)換[J];清華大學(xué)學(xué)報(bào)(自然科學(xué)版);2013年07期

7 高新波;王笛;王秀美;;一種潛在信息約束的非負(fù)矩陣分解方法[J];數(shù)據(jù)采集與處理;2014年01期

8 張立偉;賈沖;張雄偉;閔剛;曾理;;稀疏卷積非負(fù)矩陣分解的語音增強(qiáng)算法[J];數(shù)據(jù)采集與處理;2014年02期

9 趙yN;張盛;林孝康;;一種改進(jìn)的基音周期提取算法[J];數(shù)據(jù)采集與處理;2014年02期

10 馬振;張雄偉;楊吉斌;;基于語音個(gè)人特征信息分離的語音轉(zhuǎn)換方法研究[J];信號(hào)處理;2013年04期

相關(guān)會(huì)議論文前2條

1 王海燕;楊鴻武;甘振業(yè);裴東;;基于說話人自適應(yīng)訓(xùn)練的漢藏雙語語音合成[A];第十二屆全國(guó)人機(jī)語音通訊學(xué)術(shù)會(huì)議（NCMMSC'2013）論文集[C];2013年

2 王朝民;謝湘;匡鏡明;;一種嵌入式中文語音合成系統(tǒng)非周期成分音節(jié)層建模方法[A];第十二屆全國(guó)人機(jī)語音通訊學(xué)術(shù)會(huì)議（NCMMSC'2013）論文集[C];2013年

相關(guān)博士學(xué)位論文前1條

1 陳凌輝;說話人轉(zhuǎn)換建模方法研究[D];中國(guó)科學(xué)技術(shù)大學(xué);2013年

相關(guān)碩士學(xué)位論文前7條

1 楊靜;基于RTFI的鋼琴音樂多基頻估計(jì)[D];西南交通大學(xué);2013年

2 楊曼;基于GMM和BP網(wǎng)絡(luò)的語音轉(zhuǎn)換系統(tǒng)設(shè)計(jì)[D];武漢理工大學(xué);2013年

3 何彬;基于語音識(shí)別和語音合成的漢語語音轉(zhuǎn)換技術(shù)研究[D];云南大學(xué);2013年

4 任鵬輝;情感語音合成系統(tǒng)的研究與實(shí)現(xiàn)[D];太原理工大學(xué);2013年

5 李冰潔;采用譜—韻律雙變換的語音情感轉(zhuǎn)換[D];蘇州大學(xué);2013年

6 孫廣武;音素關(guān)聯(lián)的多文種語音融合[D];湘潭大學(xué);2013年

7 王紅麗;基于FDA的語音基頻建模的研究[D];西北師范大學(xué);2013年

【二級(jí)參考文獻(xiàn)】

相關(guān)期刊論文前5條

1 左國(guó)玉,劉文舉,阮曉鋼;聲音轉(zhuǎn)換技術(shù)的研究與進(jìn)展[J];電子學(xué)報(bào);2004年07期

2 徐寧;楊震;張玲華;;基于狀態(tài)空間模型的子頻帶語音轉(zhuǎn)換算法[J];電子學(xué)報(bào);2010年03期

3 雙志偉;張世磊;秦勇;;語音轉(zhuǎn)換分析及相似度改進(jìn)[J];清華大學(xué)學(xué)報(bào)(自然科學(xué)版);2009年S1期

4 岳振軍;鄒翔;王浩;;基于隱馬爾可夫模型和高斯混合模型結(jié)合的聲音轉(zhuǎn)換方法[J];數(shù)據(jù)采集與處理;2009年03期

5 李波,王成友,蔡宣平,張爾揚(yáng);LPC與LSF轉(zhuǎn)換算法的比較研究[J];信號(hào)處理;2004年05期

【相似文獻(xiàn)】

相關(guān)期刊論文前10條

1 劉大鵬;尾關(guān)和彥;朱慶生;;添加音素持續(xù)時(shí)間信息到頻譜模型的說話人辨認(rèn)研究[J];計(jì)算機(jī)技術(shù)與發(fā)展;2007年05期

2 牛濱;孔令志;羅森林;潘麗敏;郭亮;;基于MFCC和GMM的個(gè)性音樂推薦模型[J];北京理工大學(xué)學(xué)報(bào);2009年04期

3 陳俊;盛利元;;基于LSP線譜對(duì)參數(shù)的GMM說話人識(shí)別系統(tǒng)[J];微計(jì)算機(jī)信息;2010年04期

4 趙義正;;改進(jìn)GMM譜包絡(luò)轉(zhuǎn)換性能的語音轉(zhuǎn)換算法研究[J];科學(xué)技術(shù)與工程;2010年17期

5 曾秀花;楊鑒;徐永華;;語種辨識(shí)的多特征信息應(yīng)用[J];計(jì)算機(jī)工程與應(yīng)用;2010年25期

6 趙義正;;一種新的分維高斯混合模型語音轉(zhuǎn)換方法[J];計(jì)算機(jī)與現(xiàn)代化;2010年09期

7 馮琦,周德云,侯明善;基于徑向基函數(shù)神經(jīng)網(wǎng)絡(luò)的機(jī)載數(shù)字地圖壓縮方法[J];西北工業(yè)大學(xué)學(xué)報(bào);2003年03期

8 呂聲,尹俊勛;同語種說話人轉(zhuǎn)換的實(shí)現(xiàn)[J];移動(dòng)通信;2004年S3期

9 胡海清;張歆奕;;應(yīng)用于說話人識(shí)別的AdaBoost GMM算法[J];五邑大學(xué)學(xué)報(bào)(自然科學(xué)版);2006年03期

10 楊輝;彭良玉;陸世專;;基于小波域高斯混合模型與中值濾波的圖像去噪研究[J];電子技術(shù)應(yīng)用;2007年05期

相關(guān)會(huì)議論文前10條

1 應(yīng)冬文;顏永紅;付強(qiáng);國(guó)雁萌;;基于約束高斯混合模型的噪聲功率譜估計(jì)[A];2010年通信理論與信號(hào)處理學(xué)術(shù)年會(huì)論文集[C];2010年

2 卓群;歐貴文;;基于模糊高斯混合模型的說話人識(shí)別算法的一些改進(jìn)[A];第六屆全國(guó)人機(jī)語音通訊學(xué)術(shù)會(huì)議論文集[C];2001年

3 王瑩;景新幸;楊海燕;;改進(jìn)EM算法的高斯混合模型在說話人識(shí)別中的應(yīng)用[A];2008年全國(guó)聲學(xué)學(xué)術(shù)會(huì)議論文集[C];2008年

4 周潔;;基于高斯混合模型的情感語音轉(zhuǎn)換[A];2011'中國(guó)西部聲學(xué)學(xué)術(shù)交流會(huì)論文集[C];2011年

5 鮑福良;方志剛;徐潔;;基于MFCC和GMM的說話人確認(rèn)研究[A];第六屆全國(guó)信息獲取與處理學(xué)術(shù)會(huì)議論文集（2）[C];2008年

6 洪青陽;陳毅東;;一種用于說話人確認(rèn)的區(qū)別性訓(xùn)練方法[A];第八屆全國(guó)人機(jī)語音通訊學(xué)術(shù)會(huì)議論文集[C];2005年

7 馬建春;劉文舉;;基于共振峰和高斯混合模型的聲音轉(zhuǎn)換系統(tǒng)[A];第八屆全國(guó)人機(jī)語音通訊學(xué)術(shù)會(huì)議論文集[C];2005年

8 李葦營(yíng);湯笑梅;易克初;胡征;;有限狀態(tài)徑向基函數(shù)網(wǎng)絡(luò)結(jié)構(gòu)在語音識(shí)別中的應(yīng)用[A];第三屆全國(guó)人機(jī)語音通訊學(xué)術(shù)會(huì)議論文集[C];1994年

9 康永國(guó);雙志偉;陶建華;張維;徐波;;高斯混合模型和碼本映射相結(jié)合的語音轉(zhuǎn)換算法[A];第八屆全國(guó)人機(jī)語音通訊學(xué)術(shù)會(huì)議論文集[C];2005年

10 石如亮;李弼程;王波;;語音編碼對(duì)說話人識(shí)別系統(tǒng)的影響(英文)[A];第二屆和諧人機(jī)環(huán)境聯(lián)合學(xué)術(shù)會(huì)議(HHME2006)——第15屆中國(guó)多媒體學(xué)術(shù)會(huì)議(NCMT'06)論文集[C];2006年

相關(guān)博士學(xué)位論文前10條

1 呂聲;說話人轉(zhuǎn)換方法的研究[D];華南理工大學(xué);2004年

2 張?jiān)?基于高斯混合模型的無線傳感器網(wǎng)絡(luò)節(jié)點(diǎn)定位算法的研究[D];吉林大學(xué);2010年

3 唐李軍;Cubature卡爾曼濾波及其在導(dǎo)航中的應(yīng)用研究[D];哈爾濱工程大學(xué);2012年

4 林琳;基于模糊聚類與遺傳算法的說話人識(shí)別理論研究及應(yīng)用[D];吉林大學(xué);2007年

5 鄢田云;神經(jīng)網(wǎng)絡(luò)在語音質(zhì)量客觀評(píng)價(jià)應(yīng)用中的研究[D];西南交通大學(xué);2007年

6 陳淼;基于信號(hào)強(qiáng)度的WLAN室內(nèi)定位跟蹤系統(tǒng)研究[D];武漢大學(xué);2012年

7 李強(qiáng);分布源目標(biāo)方位估計(jì)研究[D];西北工業(yè)大學(xué);2007年

8 孫佳音;音樂要素自動(dòng)分析關(guān)鍵技術(shù)研究[D];哈爾濱工業(yè)大學(xué);2011年

9 錢博;基于漢語元音映射的說話人識(shí)別技術(shù)研究[D];南京理工大學(xué);2007年

10 李新欣;船舶及鯨類聲信號(hào)特征提取和分類識(shí)別研究[D];哈爾濱工程大學(xué);2012年

相關(guān)碩士學(xué)位論文前10條

1 丁愛明;基于MFCC和GMM的說話人識(shí)別系統(tǒng)研究[D];河海大學(xué);2006年

2 叢菡菡;基于支持相量機(jī)的穩(wěn)鍵說話人識(shí)別[D];電子科技大學(xué);2008年

3 姜可梅;檢測(cè)代替分類的腦機(jī)接口研究[D];燕山大學(xué);2011年

4 吳杰;基于高斯混合模型的話者識(shí)別系統(tǒng)的研究[D];吉林大學(xué);2008年

5 吳華玉;抗噪聲說話人識(shí)別技術(shù)研究[D];南京師范大學(xué);2008年

6 丁國(guó)梁;耳語音說話人識(shí)別的研究[D];蘇州大學(xué);2009年

7 夏妍妍;基于RBF神經(jīng)網(wǎng)絡(luò)的語音識(shí)別方法的應(yīng)用研究[D];大連海事大學(xué);2008年

8 薛峰;說話人識(shí)別及其在噪聲環(huán)境下的魯棒性研究[D];蘇州大學(xué);2009年

9 辛全超;基于GMM的說話人語音識(shí)別研究與實(shí)踐[D];華東師范大學(xué);2010年

10 徐剛;基于泛布爾代數(shù)的說話人識(shí)別算法的研究[D];武漢理工大學(xué);2006年

，

本文編號(hào)：2390261

資料下載

論文發(fā)表

支付寶下載

Download by Alipay
微信下載

Download by Wechat
會(huì)員下載

Download by Member

本文鏈接：http://sikaile.net/kejilunwen/wltx/2390261.html

上一篇：超快相干太赫茲波產(chǎn)生與探測(cè)關(guān)鍵技術(shù)研究
下一篇：認(rèn)知無線電可變檢測(cè)間隔與基于USRP的數(shù)據(jù)傳輸系統(tǒng)設(shè)計(jì)

論文發(fā)表

·知網(wǎng)|萬方|維普|龍?jiān)磡省級(jí)|國(guó)家級(jí)|科技核心|北大核心|南大核心CSSCI|EI|SCI|SSCI|

天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

基于GMM和ANN混合模型的語音轉(zhuǎn)換方法