當(dāng)前位置：主頁 > 科技論文 > 網(wǎng)絡(luò)通信論文 >

倒譜本征空間結(jié)構(gòu)化高斯混合模型語音轉(zhuǎn)換方法

發(fā)布時(shí)間：2019-01-24 22:14

【摘要】：針對(duì)非平行語料非聯(lián)合訓(xùn)練條件下的語音轉(zhuǎn)換,提出一種基于倒譜本征空間結(jié)構(gòu)化高斯混合模型的方法。提取說話人語音倒譜特征參數(shù)之后,根據(jù)其散布矩陣計(jì)算本征向量構(gòu)造倒譜本征空間并訓(xùn)練結(jié)構(gòu)化高斯混合模型SGMM-ES(Structured Gaussian Mixture Model in Eigen Space)。源和目標(biāo)說話人各自獨(dú)立訓(xùn)練的SGMM-ES根據(jù)全局聲學(xué)結(jié)構(gòu)AUS(Acoustical Universal Structure)原理進(jìn)行匹配對(duì)準(zhǔn),最終得到基于倒譜本征空間的短時(shí)譜轉(zhuǎn)換函數(shù)。實(shí)驗(yàn)結(jié)果表明,轉(zhuǎn)換語音的目標(biāo)說話人平均識(shí)別率達(dá)到95.25%,平均譜失真度為1.25,相對(duì)基于原始倒譜特征空間的SGMM方法分別提高了0.8%和7.3%,而ABX和MOS測評(píng)表明轉(zhuǎn)換性能非常接近于傳統(tǒng)平行語料方法。這一結(jié)果說明采用倒譜本征空間結(jié)構(gòu)化高斯混合模型進(jìn)行非平行語料條件下的語音轉(zhuǎn)換是有效的。
[Abstract]:In this paper, a hybrid model of Gao Si based on cepstrum eigenspace is proposed for speech conversion under the condition of non-parallel corpus non-joint training. After extracting the speech Cepstrum characteristic parameters of the speaker, the eigenvector is calculated according to its scatter matrix to construct the cepstrum eigenspace and train the structured Gao Si mixed model SGMM-ES (Structured Gaussian Mixture Model in Eigen Space). The SGMM-ES trained independently by the source and the target speaker is matched and aligned according to the AUS (Acoustical Universal Structure) principle of the global acoustic structure. Finally, the short-time spectral transformation function based on the cepstrum eigenspace is obtained. The experimental results show that the average recognition rate of target speaker is 95.25 and the average spectral distortion is 1.25. Compared with the SGMM method based on original cepstrum feature space, the average recognition rate of target speaker is increased by 0.8% and 7.3%, respectively. ABX and MOS evaluation show that the conversion performance is very close to the traditional parallel corpus method. The results show that the use of cepstrum eigenspace structured Gao Si mixed model for speech conversion under the condition of non-parallel corpus is effective.
【作者單位】：蘇州大學(xué)電子信息學(xué)院;
【基金】：國家自然科學(xué)基金(61271360) 蘇州市應(yīng)用基礎(chǔ)研究計(jì)劃(SYG201230)資助
【分類號(hào)】：TN912.3

【參考文獻(xiàn)】

相關(guān)期刊論文前3條

1 康永國;雙志偉;陶建華;張維;;基于混合映射模型的語音轉(zhuǎn)換算法研究[J];聲學(xué)學(xué)報(bào);2006年06期

2 陳雪勤;趙鶴鳴;;有效高斯分量通用背景模型下耳語音聲道系統(tǒng)轉(zhuǎn)換研究[J];聲學(xué)學(xué)報(bào);2013年02期

3 俞一彪;曾道建;姜瑩;;采用獨(dú)立說話人模型的語音轉(zhuǎn)換[J];聲學(xué)學(xué)報(bào);2012年03期

【共引文獻(xiàn)】

相關(guān)期刊論文前9條

1 趙義正;;一種新的分維高斯混合模型語音轉(zhuǎn)換方法[J];計(jì)算機(jī)與現(xiàn)代化;2010年09期

2 趙義正;;改進(jìn)GMM譜包絡(luò)轉(zhuǎn)換性能的語音轉(zhuǎn)換算法研究[J];科學(xué)技術(shù)與工程;2010年17期

3 李燕萍;張玲華;丁輝;;基于音素分類的漢語語聲轉(zhuǎn)換算法[J];南京郵電大學(xué)學(xué)報(bào)(自然科學(xué)版);2011年01期

4 CHEN Xueqin;ZHAO Heming;;Research of whispered speech vocal tract system conversion based on universal background model and effective Gaussian components[J];Chinese Journal of Acoustics;2013年04期

5 JIAN Zhihua;WANG Xiangwen;;A modified voice conversion algorithm using compressed sensing[J];Chinese Journal of Acoustics;2014年03期

6 趙義正;;一種改進(jìn)高斯混合模型均值項(xiàng)的語音轉(zhuǎn)換方法[J];微型機(jī)與應(yīng)用;2012年19期

7 陳雪勤;趙鶴鳴;;有效高斯分量通用背景模型下耳語音聲道系統(tǒng)轉(zhuǎn)換研究[J];聲學(xué)學(xué)報(bào);2013年02期

8 解偉超;張玲華;;基于自組織聚類和改進(jìn)粒子群算法的語音轉(zhuǎn)換方法[J];聲學(xué)學(xué)報(bào);2014年01期

9 簡志華;王向文;;采用壓縮感知的改進(jìn)的語音轉(zhuǎn)換算法[J];聲學(xué)學(xué)報(bào);2014年03期

相關(guān)碩士學(xué)位論文前8條

1 張林林;漢語語文轉(zhuǎn)換中NHMM算法和音庫詞庫設(shè)計(jì)的研究[D];西南交通大學(xué);2011年

2 楊陽;漢語語音轉(zhuǎn)換系統(tǒng)的研究[D];北京交通大學(xué);2008年

3 袁曉勇;基于LPAC-PSOLA合成算法語音轉(zhuǎn)換系統(tǒng)[D];哈爾濱工程大學(xué);2009年

4 童波;特定對(duì)象漢語語音轉(zhuǎn)換系統(tǒng)的研究[D];華北電力大學(xué)（北京）;2010年

5 李力;采用超音段韻律特征聯(lián)合短時(shí)頻譜的語音轉(zhuǎn)換[D];蘇州大學(xué);2012年

6 解偉超;語音轉(zhuǎn)換中聲道譜參數(shù)和基頻變換算法的研究[D];南京郵電大學(xué);2013年

7 朱春雷;優(yōu)化自適應(yīng)非平行訓(xùn)練語音轉(zhuǎn)換算法研究[D];蘇州大學(xué);2013年

8 李陽春;倒譜本征空間結(jié)構(gòu)化高斯混合模型及語音轉(zhuǎn)換研究[D];蘇州大學(xué);2014年

【二級(jí)參考文獻(xiàn)】

相關(guān)期刊論文前5條

1 左國玉,劉文舉,阮曉鋼;聲音轉(zhuǎn)換技術(shù)的研究與進(jìn)展[J];電子學(xué)報(bào);2004年07期

2 張焱,姜惠春,黃志同;隱馬爾可夫模型和動(dòng)態(tài)時(shí)間現(xiàn)正統(tǒng)一框架下的漢語全音節(jié)語音識(shí)別研究[J];聲學(xué)學(xué)報(bào);1998年06期

3 李淑紅,桑恩方;基于小波變換和矢量量化的語音壓縮編碼方案[J];聲學(xué)學(xué)報(bào);2000年01期

4 康永國;雙志偉;陶建華;張維;;基于混合映射模型的語音轉(zhuǎn)換算法研究[J];聲學(xué)學(xué)報(bào);2006年06期

5 王敏;趙鶴鳴;;基于多帶解調(diào)分析和瞬時(shí)頻率估計(jì)的耳語音話者識(shí)別[J];聲學(xué)學(xué)報(bào);2010年04期

【相似文獻(xiàn)】

相關(guān)期刊論文前10條

1 李全彬;黃昶;;基于本征空間的多姿態(tài)人臉識(shí)別方法[J];現(xiàn)代電子技術(shù);2009年01期

2 ;[J];;年期

3 ;[J];;年期

4 ;[J];;年期

5 ;[J];;年期

6 ;[J];;年期

7 ;[J];;年期

8 ;[J];;年期

9 ;[J];;年期

10 ;[J];;年期

相關(guān)碩士學(xué)位論文前1條

1 李陽春;倒譜本征空間結(jié)構(gòu)化高斯混合模型及語音轉(zhuǎn)換研究[D];蘇州大學(xué);2014年

，

本文編號(hào)：2414912

資料下載

論文發(fā)表

支付寶下載

Download by Alipay
微信下載

Download by Wechat
會(huì)員下載

Download by Member

本文鏈接：http://sikaile.net/kejilunwen/wltx/2414912.html

上一篇：射頻仿真系統(tǒng)饋電網(wǎng)絡(luò)設(shè)計(jì)與分析
下一篇：無線傳感器網(wǎng)絡(luò)分簇式路由算法研究與改進(jìn)

論文發(fā)表

·知網(wǎng)|萬方|維普|龍?jiān)磡省級(jí)|國家級(jí)|科技核心|北大核心|南大核心CSSCI|EI|SCI|SSCI|

天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

倒譜本征空間結(jié)構(gòu)化高斯混合模型語音轉(zhuǎn)換方法