倒譜本征空間結(jié)構(gòu)化高斯混合模型語音轉(zhuǎn)換方法
[Abstract]:In this paper, a hybrid model of Gao Si based on cepstrum eigenspace is proposed for speech conversion under the condition of non-parallel corpus non-joint training. After extracting the speech Cepstrum characteristic parameters of the speaker, the eigenvector is calculated according to its scatter matrix to construct the cepstrum eigenspace and train the structured Gao Si mixed model SGMM-ES (Structured Gaussian Mixture Model in Eigen Space). The SGMM-ES trained independently by the source and the target speaker is matched and aligned according to the AUS (Acoustical Universal Structure) principle of the global acoustic structure. Finally, the short-time spectral transformation function based on the cepstrum eigenspace is obtained. The experimental results show that the average recognition rate of target speaker is 95.25 and the average spectral distortion is 1.25. Compared with the SGMM method based on original cepstrum feature space, the average recognition rate of target speaker is increased by 0.8% and 7.3%, respectively. ABX and MOS evaluation show that the conversion performance is very close to the traditional parallel corpus method. The results show that the use of cepstrum eigenspace structured Gao Si mixed model for speech conversion under the condition of non-parallel corpus is effective.
【作者單位】: 蘇州大學(xué)電子信息學(xué)院;
【基金】:國家自然科學(xué)基金(61271360) 蘇州市應(yīng)用基礎(chǔ)研究計(jì)劃(SYG201230)資助
【分類號(hào)】:TN912.3
【參考文獻(xiàn)】
相關(guān)期刊論文 前3條
1 康永國;雙志偉;陶建華;張維;;基于混合映射模型的語音轉(zhuǎn)換算法研究[J];聲學(xué)學(xué)報(bào);2006年06期
2 陳雪勤;趙鶴鳴;;有效高斯分量通用背景模型下耳語音聲道系統(tǒng)轉(zhuǎn)換研究[J];聲學(xué)學(xué)報(bào);2013年02期
3 俞一彪;曾道建;姜瑩;;采用獨(dú)立說話人模型的語音轉(zhuǎn)換[J];聲學(xué)學(xué)報(bào);2012年03期
【共引文獻(xiàn)】
相關(guān)期刊論文 前9條
1 趙義正;;一種新的分維高斯混合模型語音轉(zhuǎn)換方法[J];計(jì)算機(jī)與現(xiàn)代化;2010年09期
2 趙義正;;改進(jìn)GMM譜包絡(luò)轉(zhuǎn)換性能的語音轉(zhuǎn)換算法研究[J];科學(xué)技術(shù)與工程;2010年17期
3 李燕萍;張玲華;丁輝;;基于音素分類的漢語語聲轉(zhuǎn)換算法[J];南京郵電大學(xué)學(xué)報(bào)(自然科學(xué)版);2011年01期
4 CHEN Xueqin;ZHAO Heming;;Research of whispered speech vocal tract system conversion based on universal background model and effective Gaussian components[J];Chinese Journal of Acoustics;2013年04期
5 JIAN Zhihua;WANG Xiangwen;;A modified voice conversion algorithm using compressed sensing[J];Chinese Journal of Acoustics;2014年03期
6 趙義正;;一種改進(jìn)高斯混合模型均值項(xiàng)的語音轉(zhuǎn)換方法[J];微型機(jī)與應(yīng)用;2012年19期
7 陳雪勤;趙鶴鳴;;有效高斯分量通用背景模型下耳語音聲道系統(tǒng)轉(zhuǎn)換研究[J];聲學(xué)學(xué)報(bào);2013年02期
8 解偉超;張玲華;;基于自組織聚類和改進(jìn)粒子群算法的語音轉(zhuǎn)換方法[J];聲學(xué)學(xué)報(bào);2014年01期
9 簡志華;王向文;;采用壓縮感知的改進(jìn)的語音轉(zhuǎn)換算法[J];聲學(xué)學(xué)報(bào);2014年03期
相關(guān)碩士學(xué)位論文 前8條
1 張林林;漢語語文轉(zhuǎn)換中NHMM算法和音庫詞庫設(shè)計(jì)的研究[D];西南交通大學(xué);2011年
2 楊陽;漢語語音轉(zhuǎn)換系統(tǒng)的研究[D];北京交通大學(xué);2008年
3 袁曉勇;基于LPAC-PSOLA合成算法語音轉(zhuǎn)換系統(tǒng)[D];哈爾濱工程大學(xué);2009年
4 童波;特定對象漢語語音轉(zhuǎn)換系統(tǒng)的研究[D];華北電力大學(xué)(北京);2010年
5 李力;采用超音段韻律特征聯(lián)合短時(shí)頻譜的語音轉(zhuǎn)換[D];蘇州大學(xué);2012年
6 解偉超;語音轉(zhuǎn)換中聲道譜參數(shù)和基頻變換算法的研究[D];南京郵電大學(xué);2013年
7 朱春雷;優(yōu)化自適應(yīng)非平行訓(xùn)練語音轉(zhuǎn)換算法研究[D];蘇州大學(xué);2013年
8 李陽春;倒譜本征空間結(jié)構(gòu)化高斯混合模型及語音轉(zhuǎn)換研究[D];蘇州大學(xué);2014年
【二級(jí)參考文獻(xiàn)】
相關(guān)期刊論文 前5條
1 左國玉,劉文舉,阮曉鋼;聲音轉(zhuǎn)換技術(shù)的研究與進(jìn)展[J];電子學(xué)報(bào);2004年07期
2 張焱,姜惠春,黃志同;隱馬爾可夫模型和動(dòng)態(tài)時(shí)間現(xiàn)正統(tǒng)一框架下的漢語全音節(jié)語音識(shí)別研究[J];聲學(xué)學(xué)報(bào);1998年06期
3 李淑紅,桑恩方;基于小波變換和矢量量化的語音壓縮編碼方案[J];聲學(xué)學(xué)報(bào);2000年01期
4 康永國;雙志偉;陶建華;張維;;基于混合映射模型的語音轉(zhuǎn)換算法研究[J];聲學(xué)學(xué)報(bào);2006年06期
5 王敏;趙鶴鳴;;基于多帶解調(diào)分析和瞬時(shí)頻率估計(jì)的耳語音話者識(shí)別[J];聲學(xué)學(xué)報(bào);2010年04期
【相似文獻(xiàn)】
相關(guān)期刊論文 前10條
1 李全彬;黃昶;;基于本征空間的多姿態(tài)人臉識(shí)別方法[J];現(xiàn)代電子技術(shù);2009年01期
2 ;[J];;年期
3 ;[J];;年期
4 ;[J];;年期
5 ;[J];;年期
6 ;[J];;年期
7 ;[J];;年期
8 ;[J];;年期
9 ;[J];;年期
10 ;[J];;年期
相關(guān)碩士學(xué)位論文 前1條
1 李陽春;倒譜本征空間結(jié)構(gòu)化高斯混合模型及語音轉(zhuǎn)換研究[D];蘇州大學(xué);2014年
,本文編號(hào):2414912
本文鏈接:http://sikaile.net/kejilunwen/wltx/2414912.html