語音轉(zhuǎn)換中特征參數(shù)及其轉(zhuǎn)換方法的研究
[Abstract]:Speech conversion technology realizes the transformation between two different speakers' voice personality characteristics, that is, the target speaker's voice characteristics are oriented, and the source speaker's personality characteristics are changed to make it have the target speaker's characteristics. Thus, the auditory effect of the source speaker's voice is changed. In this paper, the conversion method of speech personality parameters is studied to realize the effective use of speech parameters and the enhancement of the conversion effects. The main work is as follows: (1) the adjustment of pitch frequency, speech speed and other prosodic characteristics is studied. In this paper, while realizing pitch frequency conversion, Gao Si method is proposed as the mapping rule of source and target speech time, and the target speech duration adjustment is realized by interpolation method according to the obtained timespan ratio. Thus, the synthesized speech time is closer to the target speech, and the similarity of speech speed is improved. (2) the conversion rules of vocal channel feature parameters are studied. The generalization attribute of artificial neural network is helpful to realize the transformation of speaker's feature, but the training of the network usually has the problem that there are many hidden layer nodes and the network structure is more complicated. Therefore, this paper presents a method of acoustic channel characteristic parameter conversion based on improved radial basis function neural network. In this method, K-means algorithm is used as the center value algorithm of neural network, and particle swarm optimization algorithm is used to optimize the number of nodes in the hidden layer of the network, which effectively improves the efficiency of fitting and converting the multi-dimensional nonlinear characteristic parameters of the radial basis function network. In order to improve the similarity between speech and target speech. (3) improve the speech conversion system. Because the extracted feature parameters usually have the characteristics of large amount of data, and for the same test speech to be converted, the conversion rules obtained by different data segment training have different conversion effects. In order to make full use of the extracted parameters, this paper proposes to preprocess a large number of feature parameters by Gao Si mixed model, and obtain the training parameters with small amount of data and strong characteristics. Therefore, on the basis of the improved neural network conversion algorithm, the feature parameter preprocessing module and the time length adjustment module are added to improve the speech conversion system and improve the quality of the converted speech.
【學(xué)位授予單位】:南京郵電大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2015
【分類號】:TN912.3
【相似文獻(xiàn)】
相關(guān)期刊論文 前10條
1 黃仁;吳國章;程平;;基于特征參數(shù)在歌唱比賽評分方法中的研究[J];硅谷;2010年24期
2 黃明輝,虞仲龍,張志勇;一種在時級(頻)域自動再生最佳特征參數(shù)的方法[J];振動.測試與診斷;1999年04期
3 馮曉亮;孟子厚;;面向普通話輔音檢測的區(qū)別特征參數(shù)測量[J];聲學(xué)技術(shù);2010年03期
4 劉前軍,常穎,李圭白;絮凝檢測曲線特征參數(shù)的分析[J];傳感器技術(shù);2005年10期
5 肖威;馬小愚;姜明;;稻米粒群特征參數(shù)的提取[J];農(nóng)機(jī)化研究;2009年02期
6 楊軍,,于云峰;使用捷聯(lián)慣導(dǎo)的導(dǎo)彈自適應(yīng)自動駕駛儀特征參數(shù)的選取方法[J];西北工業(yè)大學(xué)學(xué)報;1995年03期
7 張敏;張陽;;一種可撤除生物特征參數(shù)管理方案[J];西南民族大學(xué)學(xué)報(自然科學(xué)版);2013年04期
8 唐煒;王玉明;;復(fù)雜系統(tǒng)關(guān)鍵特征參數(shù)確定方法[J];信息與電子工程;2011年01期
9 陳愛軍;李金宗;;一種基于幾何特征參數(shù)的圓檢測方法[J];計算機(jī)工程;2007年05期
10 孟祥豪;羅景青;;基于合成特征參數(shù)的雷達(dá)信號聚類分析[J];航天電子對抗;2011年06期
相關(guān)會議論文 前10條
1 楊大利;徐明星;吳文虎;;正交設(shè)計因子順序?qū)μ卣鲄?shù)選擇結(jié)果的影響[A];第六屆全國人機(jī)語音通訊學(xué)術(shù)會議論文集[C];2001年
2 趙海天;向東;;城市燈光景觀設(shè)計[A];全面建設(shè)小康社會:中國科技工作者的歷史責(zé)任——中國科協(xié)2003年學(xué)術(shù)年會論文集(下)[C];2003年
3 徐慧;章斯宇;孟子厚;;普通話鼻韻母的分段參數(shù)化區(qū)分[A];第九屆中國語音學(xué)學(xué)術(shù)會議論文集[C];2010年
4 祝明華;謝亦豐;熊連松;李琛;卓放;張海龍;;擾動條件下直流微型電網(wǎng)特征參數(shù)的實時在線計算方法[A];分布式發(fā)電、智能微電網(wǎng)與電能質(zhì)量——第三屆全國電能質(zhì)量學(xué)術(shù)會議暨電能質(zhì)量行業(yè)發(fā)展論壇論文集[C];2013年
5 涂群章;左洪福;;基于實時圖像的固體污染物特征參數(shù)測量研究[A];首屆信息獲取與處理學(xué)術(shù)會議論文集[C];2003年
6 趙偉;黃永芳;葉序彬;胡本潤;劉建中;陳立杰;;腐蝕坑特征參數(shù)與應(yīng)力集中的相關(guān)性研究[A];第16屆全國疲勞與斷裂學(xué)術(shù)會議會議程序冊[C];2012年
7 陳娜;樊瑾;王維;秦昊;文瑾;施心陵;;基于視頻方式的頸椎康復(fù)功能監(jiān)測[A];第二十七屆中國控制會議論文集[C];2008年
8 鄭冬紅;孟子厚;;普通話平翹輔音區(qū)別特征參數(shù)的測量[A];中國聲學(xué)學(xué)會2007年青年學(xué)術(shù)會議論文集(下)[C];2007年
9 王薇;楊震;;利用動態(tài)特征的語音轉(zhuǎn)換系統(tǒng)性能研究[A];全國第三屆信號和智能信息處理與應(yīng)用學(xué)術(shù)交流會?痆C];2009年
10 劉健剛;董靜;;從符號學(xué)看標(biāo)點在語音文本中的技術(shù)實現(xiàn)[A];2011'中國西部聲學(xué)學(xué)術(shù)交流會論文集[C];2011年
相關(guān)重要報紙文章 前2條
1 任效良;科大科研成果填補(bǔ)國際空白[N];北方經(jīng)濟(jì)時報;2007年
2 燕海霞;王憶勤;李福鳳;脈象信號研究日漸深入[N];中國醫(yī)藥報;2005年
相關(guān)碩士學(xué)位論文 前10條
1 張繼光;脈搏特征參數(shù)與血壓相關(guān)性研究[D];蘭州理工大學(xué);2009年
2 隋占菊;散射信道特征參數(shù)測量技術(shù)[D];西安電子科技大學(xué);2009年
3 王岐學(xué);基于統(tǒng)計特性的漢語方言辨識方法研究[D];湖南師范大學(xué);2010年
4 于山山;基于心電信號的白天短時睡眠的分期研究[D];華東理工大學(xué);2012年
5 劉建;特征參數(shù)模式比對在語音評分中的應(yīng)用研究[D];中南大學(xué);2009年
6 嚴(yán)曉燕;纖維的包埋切片技術(shù)與異形纖維特征參數(shù)研究[D];東華大學(xué);2006年
7 陳先同;語音轉(zhuǎn)換中特征參數(shù)及其轉(zhuǎn)換方法的研究[D];南京郵電大學(xué);2015年
8 吳國章;基于特征參數(shù)的歌唱評分方法研究[D];重慶大學(xué);2011年
9 王厚英;病態(tài)嗓音特征參數(shù)的優(yōu)化研究[D];廣西師范大學(xué);2015年
10 王海;多缸柴油機(jī)各缸一致性特征參數(shù)研究[D];西華大學(xué);2014年
本文編號:2284624
本文鏈接:http://sikaile.net/kejilunwen/wltx/2284624.html