天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

語音轉(zhuǎn)換中特征參數(shù)及其轉(zhuǎn)換方法的研究

發(fā)布時(shí)間:2018-10-21 08:59
【摘要】:語音轉(zhuǎn)換技術(shù)實(shí)現(xiàn)的是兩個(gè)不同說話人聲音個(gè)性特征之間的轉(zhuǎn)變,即以目標(biāo)說話人的聲音特征為導(dǎo)向,通過改變?cè)凑f話人的個(gè)性特征使之具有目標(biāo)說話人的特征,從而改變?cè)凑f話人話音的聽覺效果。本文主要研究語音個(gè)性特征參數(shù)的轉(zhuǎn)換方法,實(shí)現(xiàn)語音參數(shù)的有效利用以及轉(zhuǎn)換效果的增強(qiáng)。主要工作如下:(1)對(duì)基音頻率、語速等韻律特征的調(diào)整進(jìn)行研究。本文在實(shí)現(xiàn)基音頻率轉(zhuǎn)換的同時(shí),提出用高斯法作為源和目標(biāo)語音時(shí)長的映射規(guī)則,并利用按照獲得的時(shí)長比例來進(jìn)行內(nèi)插的方法實(shí)現(xiàn)目標(biāo)語音時(shí)長的調(diào)整,從而使合成的語音時(shí)長更接近目標(biāo)語音,提高語速的相似度。(2)對(duì)聲道特征參數(shù)的轉(zhuǎn)換規(guī)則進(jìn)行研究。人工神經(jīng)網(wǎng)絡(luò)的泛化屬性有助于實(shí)現(xiàn)說話人特征的轉(zhuǎn)換,但網(wǎng)絡(luò)的訓(xùn)練通常存在隱含層節(jié)點(diǎn)較多導(dǎo)致網(wǎng)絡(luò)結(jié)構(gòu)較復(fù)雜的問題。因此,本文提出基于改進(jìn)的徑向基函數(shù)神經(jīng)網(wǎng)絡(luò)的聲道特征參數(shù)轉(zhuǎn)換方法。該方法用K均值算法作為神經(jīng)網(wǎng)絡(luò)中心值算法,并利用粒子群優(yōu)化算法對(duì)網(wǎng)絡(luò)隱含層的節(jié)點(diǎn)數(shù)進(jìn)行優(yōu)化,有效地提高了徑向基函數(shù)網(wǎng)絡(luò)對(duì)多維非線性特征參數(shù)擬合與轉(zhuǎn)換效率,從而提高轉(zhuǎn)換語音與目標(biāo)語音的相似度。(3)對(duì)語音轉(zhuǎn)換系統(tǒng)進(jìn)行完善。由于提取的聲道特征參數(shù)通常具有數(shù)據(jù)量較大的特點(diǎn),而且對(duì)于同一條將要轉(zhuǎn)換的測(cè)試語音,不同數(shù)據(jù)段訓(xùn)練得到的轉(zhuǎn)換規(guī)則其轉(zhuǎn)換效果有所不同。為了充分利用提取的參數(shù),本文提出用高斯混合模型對(duì)提取的大量特征參數(shù)進(jìn)行預(yù)處理,得到數(shù)據(jù)量較小并且特征性較強(qiáng)的訓(xùn)練參數(shù)。因此,在改進(jìn)神經(jīng)網(wǎng)絡(luò)轉(zhuǎn)換算法的基礎(chǔ)上,加入特征參數(shù)預(yù)處理模塊以及時(shí)長調(diào)整模塊,完善語音轉(zhuǎn)換系統(tǒng)的同時(shí)提高轉(zhuǎn)換語音的質(zhì)量。
[Abstract]:Speech conversion technology realizes the transformation between two different speakers' voice personality characteristics, that is, the target speaker's voice characteristics are oriented, and the source speaker's personality characteristics are changed to make it have the target speaker's characteristics. Thus, the auditory effect of the source speaker's voice is changed. In this paper, the conversion method of speech personality parameters is studied to realize the effective use of speech parameters and the enhancement of the conversion effects. The main work is as follows: (1) the adjustment of pitch frequency, speech speed and other prosodic characteristics is studied. In this paper, while realizing pitch frequency conversion, Gao Si method is proposed as the mapping rule of source and target speech time, and the target speech duration adjustment is realized by interpolation method according to the obtained timespan ratio. Thus, the synthesized speech time is closer to the target speech, and the similarity of speech speed is improved. (2) the conversion rules of vocal channel feature parameters are studied. The generalization attribute of artificial neural network is helpful to realize the transformation of speaker's feature, but the training of the network usually has the problem that there are many hidden layer nodes and the network structure is more complicated. Therefore, this paper presents a method of acoustic channel characteristic parameter conversion based on improved radial basis function neural network. In this method, K-means algorithm is used as the center value algorithm of neural network, and particle swarm optimization algorithm is used to optimize the number of nodes in the hidden layer of the network, which effectively improves the efficiency of fitting and converting the multi-dimensional nonlinear characteristic parameters of the radial basis function network. In order to improve the similarity between speech and target speech. (3) improve the speech conversion system. Because the extracted feature parameters usually have the characteristics of large amount of data, and for the same test speech to be converted, the conversion rules obtained by different data segment training have different conversion effects. In order to make full use of the extracted parameters, this paper proposes to preprocess a large number of feature parameters by Gao Si mixed model, and obtain the training parameters with small amount of data and strong characteristics. Therefore, on the basis of the improved neural network conversion algorithm, the feature parameter preprocessing module and the time length adjustment module are added to improve the speech conversion system and improve the quality of the converted speech.
【學(xué)位授予單位】:南京郵電大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2015
【分類號(hào)】:TN912.3

【相似文獻(xiàn)】

相關(guān)期刊論文 前10條

1 黃仁;吳國章;程平;;基于特征參數(shù)在歌唱比賽評(píng)分方法中的研究[J];硅谷;2010年24期

2 黃明輝,虞仲龍,張志勇;一種在時(shí)級(jí)(頻)域自動(dòng)再生最佳特征參數(shù)的方法[J];振動(dòng).測(cè)試與診斷;1999年04期

3 馮曉亮;孟子厚;;面向普通話輔音檢測(cè)的區(qū)別特征參數(shù)測(cè)量[J];聲學(xué)技術(shù);2010年03期

4 劉前軍,常穎,李圭白;絮凝檢測(cè)曲線特征參數(shù)的分析[J];傳感器技術(shù);2005年10期

5 肖威;馬小愚;姜明;;稻米粒群特征參數(shù)的提取[J];農(nóng)機(jī)化研究;2009年02期

6 楊軍,,于云峰;使用捷聯(lián)慣導(dǎo)的導(dǎo)彈自適應(yīng)自動(dòng)駕駛儀特征參數(shù)的選取方法[J];西北工業(yè)大學(xué)學(xué)報(bào);1995年03期

7 張敏;張陽;;一種可撤除生物特征參數(shù)管理方案[J];西南民族大學(xué)學(xué)報(bào)(自然科學(xué)版);2013年04期

8 唐煒;王玉明;;復(fù)雜系統(tǒng)關(guān)鍵特征參數(shù)確定方法[J];信息與電子工程;2011年01期

9 陳愛軍;李金宗;;一種基于幾何特征參數(shù)的圓檢測(cè)方法[J];計(jì)算機(jī)工程;2007年05期

10 孟祥豪;羅景青;;基于合成特征參數(shù)的雷達(dá)信號(hào)聚類分析[J];航天電子對(duì)抗;2011年06期

相關(guān)會(huì)議論文 前10條

1 楊大利;徐明星;吳文虎;;正交設(shè)計(jì)因子順序?qū)μ卣鲄?shù)選擇結(jié)果的影響[A];第六屆全國人機(jī)語音通訊學(xué)術(shù)會(huì)議論文集[C];2001年

2 趙海天;向東;;城市燈光景觀設(shè)計(jì)[A];全面建設(shè)小康社會(huì):中國科技工作者的歷史責(zé)任——中國科協(xié)2003年學(xué)術(shù)年會(huì)論文集(下)[C];2003年

3 徐慧;章斯宇;孟子厚;;普通話鼻韻母的分段參數(shù)化區(qū)分[A];第九屆中國語音學(xué)學(xué)術(shù)會(huì)議論文集[C];2010年

4 祝明華;謝亦豐;熊連松;李琛;卓放;張海龍;;擾動(dòng)條件下直流微型電網(wǎng)特征參數(shù)的實(shí)時(shí)在線計(jì)算方法[A];分布式發(fā)電、智能微電網(wǎng)與電能質(zhì)量——第三屆全國電能質(zhì)量學(xué)術(shù)會(huì)議暨電能質(zhì)量行業(yè)發(fā)展論壇論文集[C];2013年

5 涂群章;左洪福;;基于實(shí)時(shí)圖像的固體污染物特征參數(shù)測(cè)量研究[A];首屆信息獲取與處理學(xué)術(shù)會(huì)議論文集[C];2003年

6 趙偉;黃永芳;葉序彬;胡本潤;劉建中;陳立杰;;腐蝕坑特征參數(shù)與應(yīng)力集中的相關(guān)性研究[A];第16屆全國疲勞與斷裂學(xué)術(shù)會(huì)議會(huì)議程序冊(cè)[C];2012年

7 陳娜;樊瑾;王維;秦昊;文瑾;施心陵;;基于視頻方式的頸椎康復(fù)功能監(jiān)測(cè)[A];第二十七屆中國控制會(huì)議論文集[C];2008年

8 鄭冬紅;孟子厚;;普通話平翹輔音區(qū)別特征參數(shù)的測(cè)量[A];中國聲學(xué)學(xué)會(huì)2007年青年學(xué)術(shù)會(huì)議論文集(下)[C];2007年

9 王薇;楊震;;利用動(dòng)態(tài)特征的語音轉(zhuǎn)換系統(tǒng)性能研究[A];全國第三屆信號(hào)和智能信息處理與應(yīng)用學(xué)術(shù)交流會(huì)?痆C];2009年

10 劉健剛;董靜;;從符號(hào)學(xué)看標(biāo)點(diǎn)在語音文本中的技術(shù)實(shí)現(xiàn)[A];2011'中國西部聲學(xué)學(xué)術(shù)交流會(huì)論文集[C];2011年

相關(guān)重要報(bào)紙文章 前2條

1 任效良;科大科研成果填補(bǔ)國際空白[N];北方經(jīng)濟(jì)時(shí)報(bào);2007年

2 燕海霞;王憶勤;李福鳳;脈象信號(hào)研究日漸深入[N];中國醫(yī)藥報(bào);2005年

相關(guān)碩士學(xué)位論文 前10條

1 張繼光;脈搏特征參數(shù)與血壓相關(guān)性研究[D];蘭州理工大學(xué);2009年

2 隋占菊;散射信道特征參數(shù)測(cè)量技術(shù)[D];西安電子科技大學(xué);2009年

3 王岐學(xué);基于統(tǒng)計(jì)特性的漢語方言辨識(shí)方法研究[D];湖南師范大學(xué);2010年

4 于山山;基于心電信號(hào)的白天短時(shí)睡眠的分期研究[D];華東理工大學(xué);2012年

5 劉建;特征參數(shù)模式比對(duì)在語音評(píng)分中的應(yīng)用研究[D];中南大學(xué);2009年

6 嚴(yán)曉燕;纖維的包埋切片技術(shù)與異形纖維特征參數(shù)研究[D];東華大學(xué);2006年

7 陳先同;語音轉(zhuǎn)換中特征參數(shù)及其轉(zhuǎn)換方法的研究[D];南京郵電大學(xué);2015年

8 吳國章;基于特征參數(shù)的歌唱評(píng)分方法研究[D];重慶大學(xué);2011年

9 王厚英;病態(tài)嗓音特征參數(shù)的優(yōu)化研究[D];廣西師范大學(xué);2015年

10 王海;多缸柴油機(jī)各缸一致性特征參數(shù)研究[D];西華大學(xué);2014年



本文編號(hào):2284624

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/wltx/2284624.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶473cb***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com