天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

語音轉(zhuǎn)換中特征參數(shù)及其轉(zhuǎn)換方法的研究

發(fā)布時間:2018-10-21 08:59
【摘要】:語音轉(zhuǎn)換技術(shù)實現(xiàn)的是兩個不同說話人聲音個性特征之間的轉(zhuǎn)變,即以目標(biāo)說話人的聲音特征為導(dǎo)向,通過改變源說話人的個性特征使之具有目標(biāo)說話人的特征,從而改變源說話人話音的聽覺效果。本文主要研究語音個性特征參數(shù)的轉(zhuǎn)換方法,實現(xiàn)語音參數(shù)的有效利用以及轉(zhuǎn)換效果的增強(qiáng)。主要工作如下:(1)對基音頻率、語速等韻律特征的調(diào)整進(jìn)行研究。本文在實現(xiàn)基音頻率轉(zhuǎn)換的同時,提出用高斯法作為源和目標(biāo)語音時長的映射規(guī)則,并利用按照獲得的時長比例來進(jìn)行內(nèi)插的方法實現(xiàn)目標(biāo)語音時長的調(diào)整,從而使合成的語音時長更接近目標(biāo)語音,提高語速的相似度。(2)對聲道特征參數(shù)的轉(zhuǎn)換規(guī)則進(jìn)行研究。人工神經(jīng)網(wǎng)絡(luò)的泛化屬性有助于實現(xiàn)說話人特征的轉(zhuǎn)換,但網(wǎng)絡(luò)的訓(xùn)練通常存在隱含層節(jié)點較多導(dǎo)致網(wǎng)絡(luò)結(jié)構(gòu)較復(fù)雜的問題。因此,本文提出基于改進(jìn)的徑向基函數(shù)神經(jīng)網(wǎng)絡(luò)的聲道特征參數(shù)轉(zhuǎn)換方法。該方法用K均值算法作為神經(jīng)網(wǎng)絡(luò)中心值算法,并利用粒子群優(yōu)化算法對網(wǎng)絡(luò)隱含層的節(jié)點數(shù)進(jìn)行優(yōu)化,有效地提高了徑向基函數(shù)網(wǎng)絡(luò)對多維非線性特征參數(shù)擬合與轉(zhuǎn)換效率,從而提高轉(zhuǎn)換語音與目標(biāo)語音的相似度。(3)對語音轉(zhuǎn)換系統(tǒng)進(jìn)行完善。由于提取的聲道特征參數(shù)通常具有數(shù)據(jù)量較大的特點,而且對于同一條將要轉(zhuǎn)換的測試語音,不同數(shù)據(jù)段訓(xùn)練得到的轉(zhuǎn)換規(guī)則其轉(zhuǎn)換效果有所不同。為了充分利用提取的參數(shù),本文提出用高斯混合模型對提取的大量特征參數(shù)進(jìn)行預(yù)處理,得到數(shù)據(jù)量較小并且特征性較強(qiáng)的訓(xùn)練參數(shù)。因此,在改進(jìn)神經(jīng)網(wǎng)絡(luò)轉(zhuǎn)換算法的基礎(chǔ)上,加入特征參數(shù)預(yù)處理模塊以及時長調(diào)整模塊,完善語音轉(zhuǎn)換系統(tǒng)的同時提高轉(zhuǎn)換語音的質(zhì)量。
[Abstract]:Speech conversion technology realizes the transformation between two different speakers' voice personality characteristics, that is, the target speaker's voice characteristics are oriented, and the source speaker's personality characteristics are changed to make it have the target speaker's characteristics. Thus, the auditory effect of the source speaker's voice is changed. In this paper, the conversion method of speech personality parameters is studied to realize the effective use of speech parameters and the enhancement of the conversion effects. The main work is as follows: (1) the adjustment of pitch frequency, speech speed and other prosodic characteristics is studied. In this paper, while realizing pitch frequency conversion, Gao Si method is proposed as the mapping rule of source and target speech time, and the target speech duration adjustment is realized by interpolation method according to the obtained timespan ratio. Thus, the synthesized speech time is closer to the target speech, and the similarity of speech speed is improved. (2) the conversion rules of vocal channel feature parameters are studied. The generalization attribute of artificial neural network is helpful to realize the transformation of speaker's feature, but the training of the network usually has the problem that there are many hidden layer nodes and the network structure is more complicated. Therefore, this paper presents a method of acoustic channel characteristic parameter conversion based on improved radial basis function neural network. In this method, K-means algorithm is used as the center value algorithm of neural network, and particle swarm optimization algorithm is used to optimize the number of nodes in the hidden layer of the network, which effectively improves the efficiency of fitting and converting the multi-dimensional nonlinear characteristic parameters of the radial basis function network. In order to improve the similarity between speech and target speech. (3) improve the speech conversion system. Because the extracted feature parameters usually have the characteristics of large amount of data, and for the same test speech to be converted, the conversion rules obtained by different data segment training have different conversion effects. In order to make full use of the extracted parameters, this paper proposes to preprocess a large number of feature parameters by Gao Si mixed model, and obtain the training parameters with small amount of data and strong characteristics. Therefore, on the basis of the improved neural network conversion algorithm, the feature parameter preprocessing module and the time length adjustment module are added to improve the speech conversion system and improve the quality of the converted speech.
【學(xué)位授予單位】:南京郵電大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2015
【分類號】:TN912.3

【相似文獻(xiàn)】

相關(guān)期刊論文 前10條

1 黃仁;吳國章;程平;;基于特征參數(shù)在歌唱比賽評分方法中的研究[J];硅谷;2010年24期

2 黃明輝,虞仲龍,張志勇;一種在時級(頻)域自動再生最佳特征參數(shù)的方法[J];振動.測試與診斷;1999年04期

3 馮曉亮;孟子厚;;面向普通話輔音檢測的區(qū)別特征參數(shù)測量[J];聲學(xué)技術(shù);2010年03期

4 劉前軍,常穎,李圭白;絮凝檢測曲線特征參數(shù)的分析[J];傳感器技術(shù);2005年10期

5 肖威;馬小愚;姜明;;稻米粒群特征參數(shù)的提取[J];農(nóng)機(jī)化研究;2009年02期

6 楊軍,,于云峰;使用捷聯(lián)慣導(dǎo)的導(dǎo)彈自適應(yīng)自動駕駛儀特征參數(shù)的選取方法[J];西北工業(yè)大學(xué)學(xué)報;1995年03期

7 張敏;張陽;;一種可撤除生物特征參數(shù)管理方案[J];西南民族大學(xué)學(xué)報(自然科學(xué)版);2013年04期

8 唐煒;王玉明;;復(fù)雜系統(tǒng)關(guān)鍵特征參數(shù)確定方法[J];信息與電子工程;2011年01期

9 陳愛軍;李金宗;;一種基于幾何特征參數(shù)的圓檢測方法[J];計算機(jī)工程;2007年05期

10 孟祥豪;羅景青;;基于合成特征參數(shù)的雷達(dá)信號聚類分析[J];航天電子對抗;2011年06期

相關(guān)會議論文 前10條

1 楊大利;徐明星;吳文虎;;正交設(shè)計因子順序?qū)μ卣鲄?shù)選擇結(jié)果的影響[A];第六屆全國人機(jī)語音通訊學(xué)術(shù)會議論文集[C];2001年

2 趙海天;向東;;城市燈光景觀設(shè)計[A];全面建設(shè)小康社會:中國科技工作者的歷史責(zé)任——中國科協(xié)2003年學(xué)術(shù)年會論文集(下)[C];2003年

3 徐慧;章斯宇;孟子厚;;普通話鼻韻母的分段參數(shù)化區(qū)分[A];第九屆中國語音學(xué)學(xué)術(shù)會議論文集[C];2010年

4 祝明華;謝亦豐;熊連松;李琛;卓放;張海龍;;擾動條件下直流微型電網(wǎng)特征參數(shù)的實時在線計算方法[A];分布式發(fā)電、智能微電網(wǎng)與電能質(zhì)量——第三屆全國電能質(zhì)量學(xué)術(shù)會議暨電能質(zhì)量行業(yè)發(fā)展論壇論文集[C];2013年

5 涂群章;左洪福;;基于實時圖像的固體污染物特征參數(shù)測量研究[A];首屆信息獲取與處理學(xué)術(shù)會議論文集[C];2003年

6 趙偉;黃永芳;葉序彬;胡本潤;劉建中;陳立杰;;腐蝕坑特征參數(shù)與應(yīng)力集中的相關(guān)性研究[A];第16屆全國疲勞與斷裂學(xué)術(shù)會議會議程序冊[C];2012年

7 陳娜;樊瑾;王維;秦昊;文瑾;施心陵;;基于視頻方式的頸椎康復(fù)功能監(jiān)測[A];第二十七屆中國控制會議論文集[C];2008年

8 鄭冬紅;孟子厚;;普通話平翹輔音區(qū)別特征參數(shù)的測量[A];中國聲學(xué)學(xué)會2007年青年學(xué)術(shù)會議論文集(下)[C];2007年

9 王薇;楊震;;利用動態(tài)特征的語音轉(zhuǎn)換系統(tǒng)性能研究[A];全國第三屆信號和智能信息處理與應(yīng)用學(xué)術(shù)交流會?痆C];2009年

10 劉健剛;董靜;;從符號學(xué)看標(biāo)點在語音文本中的技術(shù)實現(xiàn)[A];2011'中國西部聲學(xué)學(xué)術(shù)交流會論文集[C];2011年

相關(guān)重要報紙文章 前2條

1 任效良;科大科研成果填補(bǔ)國際空白[N];北方經(jīng)濟(jì)時報;2007年

2 燕海霞;王憶勤;李福鳳;脈象信號研究日漸深入[N];中國醫(yī)藥報;2005年

相關(guān)碩士學(xué)位論文 前10條

1 張繼光;脈搏特征參數(shù)與血壓相關(guān)性研究[D];蘭州理工大學(xué);2009年

2 隋占菊;散射信道特征參數(shù)測量技術(shù)[D];西安電子科技大學(xué);2009年

3 王岐學(xué);基于統(tǒng)計特性的漢語方言辨識方法研究[D];湖南師范大學(xué);2010年

4 于山山;基于心電信號的白天短時睡眠的分期研究[D];華東理工大學(xué);2012年

5 劉建;特征參數(shù)模式比對在語音評分中的應(yīng)用研究[D];中南大學(xué);2009年

6 嚴(yán)曉燕;纖維的包埋切片技術(shù)與異形纖維特征參數(shù)研究[D];東華大學(xué);2006年

7 陳先同;語音轉(zhuǎn)換中特征參數(shù)及其轉(zhuǎn)換方法的研究[D];南京郵電大學(xué);2015年

8 吳國章;基于特征參數(shù)的歌唱評分方法研究[D];重慶大學(xué);2011年

9 王厚英;病態(tài)嗓音特征參數(shù)的優(yōu)化研究[D];廣西師范大學(xué);2015年

10 王海;多缸柴油機(jī)各缸一致性特征參數(shù)研究[D];西華大學(xué);2014年



本文編號:2284624

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/wltx/2284624.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶473cb***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com
夫妻性生活黄色录像视频| 亚洲国产精品久久综合网| 99久热只有精品视频最新| 中字幕一区二区三区久久蜜桃 | 真实国产乱子伦对白视频不卡| av在线免费观看在线免费观看| 国产精品一区二区视频大全| 高清一区二区三区四区五区| 91欧美一区二区三区成人| 日韩国产亚洲欧美激情| 国产欧洲亚洲日产一区二区| 97人妻人人揉人人躁人人| 91欧美日韩中在线视频| 国产情侣激情在线对白| 福利视频一区二区三区| 国产精品久久精品国产| 日韩1区二区三区麻豆| 精品日韩视频在线观看| 国产成人精品综合久久久看| 亚洲中文字幕综合网在线| 风间中文字幕亚洲一区| 精品日韩欧美一区久久| 国产成人一区二区三区久久| 欧美精品中文字幕亚洲| 精品少妇一区二区三区四区| 久久99一本色道亚洲精品| 国产亚洲欧美日韩精品一区| 国自产拍偷拍福利精品图片| 麻豆一区二区三区在线免费| 亚洲欧洲在线一区二区三区| 四季精品人妻av一区二区三区 | 国产a天堂一区二区专区| 少妇淫真视频一区二区| 久久综合九色综合欧美| 国产91人妻精品一区二区三区| 综合久综合久综合久久| 亚洲欧美日本国产不卡| 东京不热免费观看日本| 国产成人av在线免播放观看av| 中文字幕熟女人妻视频| 色哟哟哟在线观看视频|