基于自組織聚類和改進(jìn)粒子群算法的語音轉(zhuǎn)換方法
[Abstract]:A speech conversion method based on self-organizing clustering and using improved particle swarm optimization (PSO) to determine the parameters of transformation model is proposed. In this method, the feature parameters are clustered based on the self-organizing feature mapping network, then the transformation rules are established for each cluster, and the model parameters of each transformation rule are determined by the particle swarm optimization algorithm of Cauchy mutation. Compared with the traditional single transformation rule, the multi-transformation rule established after clustering and using improved particle swarm optimization algorithm to determine the parameters can improve the accuracy of the mapping relationship and avoid the parameter falling into the local optimal point. Taking the female voice to male voice as an example, the subjective test shows that the similarity between the converted speech and the target is increased by 27.6%, and the average subjective opinion score (Mean Opinion Score,MOS) is increased by 0.6. The objective test also shows that the spectral distortion of this method is the least. Closer to the envelope of the target.
【作者單位】: 南京郵電大學(xué)通信與信息工程學(xué)院;
【基金】:國家自然科學(xué)基金(60872105) 江蘇省“青藍(lán)工程”中青年學(xué)術(shù)帶頭人課題 江蘇高校優(yōu)勢學(xué)科建設(shè)工程項(xiàng)目(PAPD)資助
【分類號】:TN912.3
【參考文獻(xiàn)】
相關(guān)期刊論文 前6條
1 左國玉,劉文舉,阮曉鋼;聲音轉(zhuǎn)換技術(shù)的研究與進(jìn)展[J];電子學(xué)報;2004年07期
2 吳艷;劉重陽;廖桂生;;一種新的像素級多聚焦圖像融合算法[J];電子與信息學(xué)報;2007年12期
3 朱泉同;張建偉;陳允杰;;基于高斯混合模型的人腦MR圖像分割新算法研究[J];計(jì)算機(jī)應(yīng)用與軟件;2009年03期
4 李波,王成友,蔡宣平,唐朝京,張爾揚(yáng);語音轉(zhuǎn)換及相關(guān)技術(shù)綜述[J];通信學(xué)報;2004年05期
5 張焱,姜惠春,黃志同;隱馬爾可夫模型和動態(tài)時間現(xiàn)正統(tǒng)一框架下的漢語全音節(jié)語音識別研究[J];聲學(xué)學(xué)報;1998年06期
6 康永國;雙志偉;陶建華;張維;;基于混合映射模型的語音轉(zhuǎn)換算法研究[J];聲學(xué)學(xué)報;2006年06期
【共引文獻(xiàn)】
相關(guān)期刊論文 前10條
1 李仁和;;一種新的多傳感器彩色圖像融合方法[J];傳感器與微系統(tǒng);2010年05期
2 楊栩;尤學(xué)一;季民;潘留明;王秀朵;趙樂軍;;城市綠地土壤入滲模型及參數(shù)確定[J];城市環(huán)境與城市生態(tài);2011年06期
3 李燕楠;包廣清;;基于小波包和支持向量機(jī)的電能質(zhì)量擾動識別[J];電力科學(xué)與工程;2012年03期
4 張劍;戴蓓劏;孫俊;陸偉;李輝;;基于分類線性加權(quán)的源-目標(biāo)話者聲音轉(zhuǎn)換算法的研究[J];電路與系統(tǒng)學(xué)報;2008年03期
5 張照坤;;語音轉(zhuǎn)換關(guān)鍵技術(shù)研究[J];電腦知識與技術(shù);2008年07期
6 錢開華;;基于音素HMM模型語音轉(zhuǎn)換[J];電腦知識與技術(shù);2008年10期
7 夏菁,尹俊勛,黃建成,黃鋒;基于正弦加噪聲模型的說話人轉(zhuǎn)換方法[J];電聲技術(shù);2005年02期
8 符敏;程德福;;支持向量回歸在聲音轉(zhuǎn)換中的應(yīng)用[J];電聲技術(shù);2006年03期
9 何峰;于東武;林嘉宇;;一種語音更改技術(shù)的研究與實(shí)現(xiàn)[J];電聲技術(shù);2007年02期
10 孫卓;岳振軍;;一種漢語語音變換技術(shù)[J];電聲技術(shù);2007年06期
相關(guān)會議論文 前10條
1 ;Particle Swarm Optimization of Periodic Deep Brain Stimulation Waveforms[A];中國自動化學(xué)會控制理論專業(yè)委員會A卷[C];2011年
2 岳振軍;王浩;張雄偉;;基于正弦諧波模型和BP神經(jīng)網(wǎng)絡(luò)的語音變換算法及實(shí)現(xiàn)[A];第十二屆全國信號處理學(xué)術(shù)年會(CCSP-2005)論文集[C];2005年
3 王薇;楊震;;基于GMM的語音轉(zhuǎn)換系統(tǒng)性能研究[A];第十四屆全國信號處理學(xué)術(shù)年會(CCSP-2009)論文集[C];2009年
4 ;Hybrid particle swarm optimization-simplex algorithm for inverse problem[A];Proceedings of 2010 Chinese Control and Decision Conference[C];2010年
5 ;A Modified Glowworm Swarm Optimization for Multimodal Functions[A];Proceedings of the 2011 Chinese Control and Decision Conference(CCDC)[C];2011年
6 王薇;楊震;;利用動態(tài)特征的語音轉(zhuǎn)換系統(tǒng)性能研究[A];全國第三屆信號和智能信息處理與應(yīng)用學(xué)術(shù)交流會?痆C];2009年
7 劉金鳳;符敏;程德福;;聲音轉(zhuǎn)換實(shí)驗(yàn)系統(tǒng)的研究與實(shí)現(xiàn)[A];2005全國自動化新技術(shù)學(xué)術(shù)交流會論文集(三)[C];2005年
8 康永國;雙志偉;陶建華;張維;徐波;;高斯混合模型和碼本映射相結(jié)合的語音轉(zhuǎn)換算法[A];第八屆全國人機(jī)語音通訊學(xué)術(shù)會議論文集[C];2005年
9 馬建春;劉文舉;;基于共振峰和高斯混合模型的聲音轉(zhuǎn)換系統(tǒng)[A];第八屆全國人機(jī)語音通訊學(xué)術(shù)會議論文集[C];2005年
10 符敏;程德福;張廣峰;;基于支持向量回歸的聲音轉(zhuǎn)換[A];第八屆全國人機(jī)語音通訊學(xué)術(shù)會議論文集[C];2005年
相關(guān)博士學(xué)位論文 前10條
1 夏益民;基于傳感器信息融合的移動機(jī)器人定位與地圖創(chuàng)建研究[D];廣東工業(yè)大學(xué);2011年
2 賀偉凇;骨干網(wǎng)絡(luò)流量異常行為感知方法研究[D];電子科技大學(xué);2011年
3 張萍;基于群智能優(yōu)化的運(yùn)動估計(jì)算法研究[D];電子科技大學(xué);2011年
4 李奇;質(zhì)子交換膜燃料電池系統(tǒng)建模及其控制方法研究[D];西南交通大學(xué);2011年
5 張晴;基于樣本的數(shù)字圖像修復(fù)技術(shù)研究[D];華東理工大學(xué);2012年
6 孫俊;基于激勵源及其韻律特征的源—目標(biāo)說話人聲音轉(zhuǎn)換研究[D];中國科學(xué)技術(shù)大學(xué);2006年
7 林琳;基于模糊聚類與遺傳算法的說話人識別理論研究及應(yīng)用[D];吉林大學(xué);2007年
8 鄭向偉;求解優(yōu)化問題的微粒群算法及其應(yīng)用研究[D];山東師范大學(xué);2008年
9 楊鳳芹;基于粒子群的優(yōu)化方法研究[D];吉林大學(xué);2009年
10 趙亮;基于協(xié)同PSO算法的模糊辨識與神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)[D];上海交通大學(xué);2009年
相關(guān)碩士學(xué)位論文 前10條
1 梁毅;粒子群算法搜索模式研究與應(yīng)用[D];華東理工大學(xué);2011年
2 楊維;微粒群優(yōu)化算法及其在風(fēng)資源評估中的應(yīng)用[D];華東理工大學(xué);2011年
3 毛婧敏;基于離散量子微粒群優(yōu)化算法的車間生產(chǎn)調(diào)度研究[D];浙江大學(xué);2011年
4 裴璐乾;SAR、紅外、可見光圖像配準(zhǔn)及融合算法研究[D];西安電子科技大學(xué);2011年
5 魏麗;群體動畫中運(yùn)動生成模塊的模型研究[D];山東師范大學(xué);2011年
6 梁宵;地下礦床開拓系統(tǒng)空間優(yōu)化的粒子群方法[D];武漢理工大學(xué);2011年
7 汪華;粒子群算法的研究及其在供水優(yōu)化調(diào)度中的應(yīng)用[D];合肥工業(yè)大學(xué);2011年
8 李傳健;計(jì)及負(fù)荷和風(fēng)力發(fā)電隨機(jī)變化的配電網(wǎng)重構(gòu)研究[D];華南理工大學(xué);2011年
9 陳燕潘;密集環(huán)境下RFID讀寫器組網(wǎng)關(guān)鍵技術(shù)研究[D];電子科技大學(xué);2011年
10 王娜;基于語音識別的機(jī)器人控制技術(shù)的研究[D];東北石油大學(xué);2011年
【二級參考文獻(xiàn)】
相關(guān)期刊論文 前7條
1 左國玉,劉文舉,阮曉鋼;聲音轉(zhuǎn)換技術(shù)的研究與進(jìn)展[J];電子學(xué)報;2004年07期
2 張建偉;夏德深;;高斯混合模型改進(jìn)的活動輪廓模型MRI分割[J];計(jì)算機(jī)輔助設(shè)計(jì)與圖形學(xué)學(xué)報;2005年12期
3 高尚,楊靜宇,吳小俊,劉同明;基于模擬退火算法思想的粒子群優(yōu)化算法[J];計(jì)算機(jī)應(yīng)用與軟件;2005年01期
4 馬明,張杰,王建宇,黃志同;語音識別中隱馬爾可夫模型初值的估計(jì)[J];數(shù)據(jù)采集與處理;1997年02期
5 朱周華;期望最大(EM)算法及其在混合高斯模型中的應(yīng)用[J];現(xiàn)代電子技術(shù);2003年24期
6 張焱,姜惠春,黃志同;隱馬爾可夫模型和動態(tài)時間現(xiàn)正統(tǒng)一框架下的漢語全音節(jié)語音識別研究[J];聲學(xué)學(xué)報;1998年06期
7 李淑紅,桑恩方;基于小波變換和矢量量化的語音壓縮編碼方案[J];聲學(xué)學(xué)報;2000年01期
相關(guān)會議論文 前1條
1 初敏;;韻律研究與合成語音的自然度[A];新世紀(jì)的現(xiàn)代語音學(xué)——第五屆全國現(xiàn)代語音學(xué)學(xué)術(shù)會議論文集[C];2001年
【相似文獻(xiàn)】
相關(guān)期刊論文 前10條
1 孫俊;戴蓓劏;張劍;;基于基元段特征和GMM的源-目標(biāo)說話人F_0~t轉(zhuǎn)換[J];信號處理;2007年02期
2 ;DutchView新轉(zhuǎn)播車配備艾崧的“神經(jīng)元”[J];現(xiàn)代電視技術(shù);2011年09期
3 王海祥;;基于RBF神經(jīng)網(wǎng)絡(luò)的源——目標(biāo)話音轉(zhuǎn)換[J];電子測量技術(shù);2006年06期
4 王麗;;改進(jìn)神經(jīng)網(wǎng)絡(luò)模型對通信網(wǎng)可靠性的預(yù)測[J];計(jì)算機(jī)工程與應(yīng)用;2010年22期
5 李靜芳;張江偉;崔霞霞;;CPSN在信道均衡中的應(yīng)用[J];無線電工程;2006年05期
6 張愛云;盧興亞;;淺談數(shù)字音頻文件格式及其轉(zhuǎn)換應(yīng)用[J];電腦知識與技術(shù);2009年26期
7 周德全,張富良,劉國歲;基于ASOM神經(jīng)網(wǎng)絡(luò)的高分辨雷達(dá)目標(biāo)識別[J];現(xiàn)代雷達(dá);1999年03期
8 楊云升;劉萬洪;王勝濤;;線性神經(jīng)網(wǎng)絡(luò)在語音干擾效果評估中的應(yīng)用[J];電聲技術(shù);2008年11期
9 王東斌;孫海波;;基于人工神經(jīng)網(wǎng)絡(luò)的信號分析處理[J];科技信息;2009年33期
10 馬昕,袁信;基于神經(jīng)元的容錯組合導(dǎo)航系統(tǒng)設(shè)計(jì)[J];宇航學(xué)報;1999年02期
相關(guān)會議論文 前10條
1 姚艷軍;景新幸;;一種基于STRAIGHT模型的語音轉(zhuǎn)換方法[A];中國聲學(xué)學(xué)會2009年青年學(xué)術(shù)會議[CYCA’09]論文集[C];2009年
2 王薇;楊震;;基于GMM的語音轉(zhuǎn)換系統(tǒng)性能研究[A];第十四屆全國信號處理學(xué)術(shù)年會(CCSP-2009)論文集[C];2009年
3 江源富;黃泰翼;;一種基于詞的統(tǒng)計(jì)屬性模型的語音-文本轉(zhuǎn)換方法[A];第二屆全國人機(jī)語音通訊學(xué)術(shù)會議論文集[C];1992年
4 李丹;畢經(jīng)平;;一種用于NAT-PT的SIP ALG的設(shè)計(jì)和實(shí)現(xiàn)[A];2008通信理論與技術(shù)新發(fā)展——第十三屆全國青年通信學(xué)術(shù)會議論文集(下)[C];2008年
5 李飛;董小亮;趙生妹;鄭寶玉;;基于量子神經(jīng)網(wǎng)絡(luò)的CDMA多用戶檢測方案[A];通信理論與信號處理新進(jìn)展——2005年通信理論與信號處理年會論文集[C];2005年
6 邵蘭;;VOIP在MSAN中實(shí)現(xiàn)的NAT技術(shù)[A];武漢市第二屆學(xué)術(shù)年會、通信學(xué)會2006年學(xué)術(shù)年會論文集[C];2006年
7 徐小峰;俞一彪;;基于說話人獨(dú)立建模的語音轉(zhuǎn)換系統(tǒng)研究[A];第十四屆全國信號處理學(xué)術(shù)年會(CCSP-2009)論文集[C];2009年
8 楊明;劉澤民;;一種基于NN的ATM網(wǎng)絡(luò)雙重路由選擇算法[A];1999年中國神經(jīng)網(wǎng)絡(luò)與信號處理學(xué)術(shù)會議論文集[C];1999年
9 曹文明;葉虹;徐春燕;王守覺;;基于雙權(quán)值神經(jīng)網(wǎng)絡(luò)的數(shù)字語音識別研究[A];2005中國控制與決策學(xué)術(shù)年會論文集(下)[C];2005年
10 沈小馬;;東北天坐標(biāo)系下的時差體制被動雷達(dá)精度分析[A];四川省電子學(xué)會雷達(dá)與火控、電子線路與系統(tǒng)專業(yè)委員會學(xué)術(shù)交流會10周年優(yōu)秀論文集[C];2006年
相關(guān)重要報紙文章 前1條
1 劉杰;綜合結(jié)算 在IA64平臺上進(jìn)行[N];中國計(jì)算機(jī)報;2004年
相關(guān)博士學(xué)位論文 前10條
1 呂聲;說話人轉(zhuǎn)換方法的研究[D];華南理工大學(xué);2004年
2 孫俊;基于激勵源及其韻律特征的源—目標(biāo)說話人聲音轉(zhuǎn)換研究[D];中國科學(xué)技術(shù)大學(xué);2006年
3 張力寧;點(diǎn)云數(shù)據(jù)抗噪處理方法及其在葉片重建中的應(yīng)用研究[D];西北工業(yè)大學(xué);2006年
4 尚麗;稀疏編碼算法及其應(yīng)用研究[D];中國科學(xué)技術(shù)大學(xué);2006年
5 王q,
本文編號:2448776
本文鏈接:http://sikaile.net/kejilunwen/wltx/2448776.html