天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁(yè) > 科技論文 > 信息工程論文 >

基于神經(jīng)網(wǎng)絡(luò)的語音頻帶擴(kuò)展方法研究

發(fā)布時(shí)間:2018-01-10 21:05

  本文關(guān)鍵詞:基于神經(jīng)網(wǎng)絡(luò)的語音頻帶擴(kuò)展方法研究 出處:《中國(guó)科學(xué)技術(shù)大學(xué)》2017年碩士論文 論文類型:學(xué)位論文


  更多相關(guān)文章: 語音頻帶擴(kuò)展 深度神經(jīng)網(wǎng)絡(luò) 循環(huán)神經(jīng)網(wǎng)絡(luò) 擴(kuò)張卷積神經(jīng)網(wǎng)絡(luò) 統(tǒng)計(jì)參數(shù)語音合成


【摘要】:語音頻帶擴(kuò)展旨在從頻帶受限的窄帶語音信號(hào)中恢復(fù)寬帶語音信號(hào)。在當(dāng)前的語音通信系統(tǒng)中,由于受到語音采集設(shè)備以及信道條件的限制,傳輸?shù)恼Z音信號(hào)的帶寬往往小于4kHz。高頻部分的缺失會(huì)導(dǎo)致語音音質(zhì)下降、自然度受損等問題。因此語音頻帶擴(kuò)展技術(shù)的研究具有重要的應(yīng)用價(jià)值。傳統(tǒng)基于統(tǒng)計(jì)聲學(xué)模型的語音頻帶擴(kuò)展方法采用高斯混合模型來描述低頻聲學(xué)特征到高頻聲學(xué)特征的映射關(guān)系,存在建模精度不足、重建高頻頻譜過平滑等問題。近年來,具有深層結(jié)構(gòu)的神經(jīng)網(wǎng)絡(luò)模型在語音合成、說話人轉(zhuǎn)換、語音增強(qiáng)等語音信號(hào)生成任務(wù)中得到了成功應(yīng)用。神經(jīng)網(wǎng)絡(luò)相對(duì)傳統(tǒng)高斯混合模型,對(duì)于特征間的非線性關(guān)系有著更好的建模能力。因此本文圍繞基于神經(jīng)網(wǎng)絡(luò)的語音頻帶擴(kuò)展方法開展研究工作,具體包括:首先,本文研究了基于深度神經(jīng)網(wǎng)絡(luò)的語音頻帶擴(kuò)展方法。設(shè)計(jì)實(shí)現(xiàn)了多種面向頻帶擴(kuò)展任務(wù)的深度神經(jīng)網(wǎng)絡(luò)預(yù)訓(xùn)練和訓(xùn)練策略,取得了相對(duì)傳統(tǒng)高斯混合模型的主客觀性能提升;進(jìn)一步研究了頻帶擴(kuò)展深度神經(jīng)網(wǎng)絡(luò)的多任務(wù)學(xué)習(xí)方法,將窄帶語音的音素分類作為次要分類引入模型訓(xùn)練準(zhǔn)則,增強(qiáng)了模型對(duì)于文本相關(guān)信息的提取與處理能力,提升了高頻頻譜特征的預(yù)測(cè)精度。其次,本文研究了基于循環(huán)神經(jīng)網(wǎng)絡(luò)的語音頻帶擴(kuò)展方法。針對(duì)深度神經(jīng)網(wǎng)絡(luò)在時(shí)序建模能力上的不足,使用深層循環(huán)神經(jīng)網(wǎng)絡(luò)與長(zhǎng)短時(shí)記憶單元對(duì)高低頻聲學(xué)特征序列間的相關(guān)性進(jìn)行建模,取得了優(yōu)于高斯混合模型和深度神經(jīng)網(wǎng)絡(luò)模型的頻帶擴(kuò)展性能;進(jìn)一步提出了結(jié)合深瓶頸特征的語音頻帶擴(kuò)展方法,針對(duì)傳統(tǒng)方法中僅針對(duì)聲學(xué)信息進(jìn)行建模而忽略文本信息的問題,在模型輸入中加入了從窄帶語音狀態(tài)分類網(wǎng)絡(luò)中提取的深瓶頸特征,進(jìn)一步提升了頻帶擴(kuò)展的性能。再次,本文提出了基于深層擴(kuò)張卷積神經(jīng)網(wǎng)絡(luò)與波形建模的語音頻帶擴(kuò)展方法。該方法融合了聲學(xué)特征提取與轉(zhuǎn)換步驟,采用深層擴(kuò)張卷積神經(jīng)網(wǎng)絡(luò)直接在波形與采樣點(diǎn)層面進(jìn)行語音信號(hào)的建模與預(yù)測(cè),相對(duì)使用幀級(jí)特征、參數(shù)合成器與循環(huán)神經(jīng)網(wǎng)絡(luò)建模的頻帶擴(kuò)展方法,取得了更好的生成語音主觀質(zhì)量;在基于深層擴(kuò)張卷積神經(jīng)網(wǎng)絡(luò)的波形建模框架下,進(jìn)一步研究了深瓶頸特征等輔助信息的使用方法,以及模型存儲(chǔ)量的優(yōu)化方法。最后,本文研究了結(jié)合頻帶擴(kuò)展的統(tǒng)計(jì)參數(shù)語音合成方法。針對(duì)語音合成系統(tǒng)輸出語音質(zhì)量受限于訓(xùn)練音庫(kù)采樣率的問題,提出了利用頻帶擴(kuò)展技術(shù)和低采樣率音庫(kù)進(jìn)行高采樣率語音合成系統(tǒng)的構(gòu)建;實(shí)驗(yàn)結(jié)果表明該方法可以取得與直接使用高采樣率音庫(kù)構(gòu)建合成系統(tǒng)相當(dāng)?shù)暮铣烧Z音質(zhì)量。
[Abstract]:Speech band expansion aims to recover wideband speech signals from narrowband speech signals that are limited in frequency band.; in current voice communication systems, due to limitations of voice acquisition devices and channel conditions. The bandwidth of the transmitted speech signal is usually less than 4 kHz. The loss of the high frequency part will lead to the decline of the speech quality. Therefore, the research of speech frequency band expansion technology has important application value. The traditional speech frequency band expansion method based on statistical acoustic model uses Gaussian mixture model to describe the low frequency acoustic characteristics to high. Mapping relation of frequency acoustic features. In recent years, the neural network model with deep structure in speech synthesis, speaker conversion. Speech enhancement and other speech signal generation tasks have been successfully applied. The neural network compared with the traditional Gao Si hybrid model. The nonlinear relationship between features has a better modeling capability. Therefore, this paper focuses on the neural network-based speech frequency band expansion method research, including: first of all. In this paper, the method of speech frequency band expansion based on depth neural network is studied, and a variety of pre-training and training strategies for deep neural network are designed and implemented. Compared with the traditional Gaussian mixture model, the subjective and objective performance of the model is improved. The multitasking learning method of the extended depth neural network is further studied, and the phoneme classification of narrowband speech is introduced into the model training criterion as the secondary classification. Enhanced the model for text related information extraction and processing capabilities, improve the prediction accuracy of high-frequency spectrum features. Secondly. In this paper, the method of speech frequency band expansion based on cyclic neural network is studied. The correlation between high and low frequency acoustic characteristic sequences is modeled by deep cyclic neural network and long and short time memory unit, and the band expansion performance is better than that of Gao Si mixed model and depth neural network model. Furthermore, a speech band expansion method based on deep bottleneck features is proposed to solve the problem of modeling only acoustic information and ignoring text information in traditional methods. The deep bottleneck feature extracted from the narrowband speech state classification network is added to the model input, which further improves the performance of band expansion. In this paper, a speech band expansion method based on deep expanded convolution neural network and waveform modeling is proposed, which combines the steps of acoustic feature extraction and conversion. The deep expanded convolution neural network is used to model and predict the speech signal directly at the waveform and sample level, and the band expansion method is used to model the speech signal by using the frame level feature, the parameter synthesizer and the cyclic neural network. A better subjective quality of generated speech is obtained. In the framework of waveform modeling based on deep extended convolution neural network, the use of auxiliary information, such as deep bottleneck features, and the optimization method of model storage are further studied. Finally. In this paper, the statistical parameter speech synthesis method combined with band expansion is studied, aiming at the problem that the output speech quality of the speech synthesis system is limited by the sampling rate of the training sound library. A high sampling rate speech synthesis system based on band expansion and low sampling rate sound database is proposed. The experimental results show that the proposed method can achieve the same quality of speech synthesis as the direct use of a high sampling rate sound library to construct a synthesis system.
【學(xué)位授予單位】:中國(guó)科學(xué)技術(shù)大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2017
【分類號(hào)】:TN912.3;TP183

【相似文獻(xiàn)】

相關(guān)期刊論文 前10條

1 楊曉帥 ,付玫;神經(jīng)網(wǎng)絡(luò)技術(shù)讓管理更輕松[J];軟件世界;2000年11期

2 云中客;新的神經(jīng)網(wǎng)絡(luò)來自于仿生學(xué)[J];物理;2001年10期

3 唐春明,高協(xié)平;進(jìn)化神經(jīng)網(wǎng)絡(luò)的研究進(jìn)展[J];系統(tǒng)工程與電子技術(shù);2001年10期

4 李智;一種基于神經(jīng)網(wǎng)絡(luò)的煤炭調(diào)運(yùn)優(yōu)化方法[J];長(zhǎng)沙鐵道學(xué)院學(xué)報(bào);2003年02期

5 程科,王士同,楊靜宇;新型模糊形態(tài)神經(jīng)網(wǎng)絡(luò)及其應(yīng)用研究[J];計(jì)算機(jī)工程與應(yīng)用;2004年21期

6 王凡,孟立凡;關(guān)于使用神經(jīng)網(wǎng)絡(luò)推定操作者疲勞的研究[J];人類工效學(xué);2004年03期

7 周麗暉;從統(tǒng)計(jì)角度看神經(jīng)網(wǎng)絡(luò)[J];統(tǒng)計(jì)教育;2005年06期

8 趙奇 ,劉開第 ,龐彥軍;灰色補(bǔ)償神經(jīng)網(wǎng)絡(luò)及其應(yīng)用研究[J];微計(jì)算機(jī)信息;2005年14期

9 袁婷;;神經(jīng)網(wǎng)絡(luò)在股票市場(chǎng)預(yù)測(cè)中的應(yīng)用[J];軟件導(dǎo)刊;2006年05期

10 尚晉;楊有;;從神經(jīng)網(wǎng)絡(luò)的過去談科學(xué)發(fā)展觀[J];重慶三峽學(xué)院學(xué)報(bào);2006年03期

相關(guān)會(huì)議論文 前10條

1 徐春玉;;基于泛集的神經(jīng)網(wǎng)絡(luò)的混沌性[A];1996中國(guó)控制與決策學(xué)術(shù)年會(huì)論文集[C];1996年

2 周樹德;王巖;孫增圻;孫富春;;量子神經(jīng)網(wǎng)絡(luò)[A];2003年中國(guó)智能自動(dòng)化會(huì)議論文集(上冊(cè))[C];2003年

3 羅山;張琳;范文新;;基于神經(jīng)網(wǎng)絡(luò)和簡(jiǎn)單規(guī)劃的識(shí)別融合算法[A];2009系統(tǒng)仿真技術(shù)及其應(yīng)用學(xué)術(shù)會(huì)議論文集[C];2009年

4 郭愛克;馬盡文;丁康;;序言(二)[A];1999年中國(guó)神經(jīng)網(wǎng)絡(luò)與信號(hào)處理學(xué)術(shù)會(huì)議論文集[C];1999年

5 鐘義信;;知識(shí)論:神經(jīng)網(wǎng)絡(luò)的新機(jī)遇——紀(jì)念中國(guó)神經(jīng)網(wǎng)絡(luò)10周年[A];1999年中國(guó)神經(jīng)網(wǎng)絡(luò)與信號(hào)處理學(xué)術(shù)會(huì)議論文集[C];1999年

6 許進(jìn);保錚;;神經(jīng)網(wǎng)絡(luò)與圖論[A];1999年中國(guó)神經(jīng)網(wǎng)絡(luò)與信號(hào)處理學(xué)術(shù)會(huì)議論文集[C];1999年

7 金龍;朱詩(shī)武;趙成志;陳寧;;數(shù)值預(yù)報(bào)產(chǎn)品的神經(jīng)網(wǎng)絡(luò)釋用預(yù)報(bào)應(yīng)用[A];1999年中國(guó)神經(jīng)網(wǎng)絡(luò)與信號(hào)處理學(xué)術(shù)會(huì)議論文集[C];1999年

8 田金亭;;神經(jīng)網(wǎng)絡(luò)在中學(xué)生創(chuàng)造力評(píng)估中的應(yīng)用[A];第十二屆全國(guó)心理學(xué)學(xué)術(shù)大會(huì)論文摘要集[C];2009年

9 唐墨;王科俊;;自發(fā)展神經(jīng)網(wǎng)絡(luò)的混沌特性研究[A];2009年中國(guó)智能自動(dòng)化會(huì)議論文集(第七分冊(cè))[南京理工大學(xué)學(xué)報(bào)(增刊)][C];2009年

10 張廣遠(yuǎn);萬強(qiáng);曹海源;田方濤;;基于遺傳算法優(yōu)化神經(jīng)網(wǎng)絡(luò)的故障診斷方法研究[A];第十二屆全國(guó)設(shè)備故障診斷學(xué)術(shù)會(huì)議論文集[C];2010年

相關(guān)重要報(bào)紙文章 前10條

1 美國(guó)明尼蘇達(dá)大學(xué)社會(huì)學(xué)博士 密西西比州立大學(xué)國(guó)家戰(zhàn)略規(guī)劃與分析研究中心資深助理研究員 陳心想;維護(hù)好創(chuàng)新的“神經(jīng)網(wǎng)絡(luò)硬件”[N];中國(guó)教師報(bào);2014年

2 盧業(yè)忠;腦控電腦 驚世駭俗[N];計(jì)算機(jī)世界;2001年

3 葛一鳴 路邊文;人工神經(jīng)網(wǎng)絡(luò)將大顯身手[N];中國(guó)紡織報(bào);2003年

4 中國(guó)科技大學(xué)計(jì)算機(jī)系 邢方亮;神經(jīng)網(wǎng)絡(luò)挑戰(zhàn)人類大腦[N];計(jì)算機(jī)世界;2003年

5 記者 孫剛;“神經(jīng)網(wǎng)絡(luò)”:打開復(fù)雜工藝“黑箱”[N];解放日?qǐng)?bào);2007年

6 本報(bào)記者 劉霞;美用DNA制造出首個(gè)人造神經(jīng)網(wǎng)絡(luò)[N];科技日?qǐng)?bào);2011年

7 健康時(shí)報(bào)特約記者  張獻(xiàn)懷;干細(xì)胞移植:修復(fù)受損的神經(jīng)網(wǎng)絡(luò)[N];健康時(shí)報(bào);2006年

8 劉力;我半導(dǎo)體神經(jīng)網(wǎng)絡(luò)技術(shù)及應(yīng)用研究達(dá)國(guó)際先進(jìn)水平[N];中國(guó)電子報(bào);2001年

9 ;神經(jīng)網(wǎng)絡(luò)和模糊邏輯[N];世界金屬導(dǎo)報(bào);2002年

10 鄒麗梅 陳耀群;江蘇科大神經(jīng)網(wǎng)絡(luò)應(yīng)用研究通過鑒定[N];中國(guó)船舶報(bào);2006年

相關(guān)博士學(xué)位論文 前10條

1 楊旭華;神經(jīng)網(wǎng)絡(luò)及其在控制中的應(yīng)用研究[D];浙江大學(xué);2004年

2 李素芳;基于神經(jīng)網(wǎng)絡(luò)的無線通信算法研究[D];山東大學(xué);2015年

3 石艷超;憶阻神經(jīng)網(wǎng)絡(luò)的混沌性及幾類時(shí)滯神經(jīng)網(wǎng)絡(luò)的同步研究[D];電子科技大學(xué);2014年

4 王新迎;基于隨機(jī)映射神經(jīng)網(wǎng)絡(luò)的多元時(shí)間序列預(yù)測(cè)方法研究[D];大連理工大學(xué);2015年

5 付愛民;極速學(xué)習(xí)機(jī)的訓(xùn)練殘差、穩(wěn)定性及泛化能力研究[D];中國(guó)農(nóng)業(yè)大學(xué);2015年

6 李輝;基于粒計(jì)算的神經(jīng)網(wǎng)絡(luò)及集成方法研究[D];中國(guó)礦業(yè)大學(xué);2015年

7 王衛(wèi)蘋;復(fù)雜網(wǎng)絡(luò)幾類同步控制策略研究及穩(wěn)定性分析[D];北京郵電大學(xué);2015年

8 張海軍;基于云計(jì)算的神經(jīng)網(wǎng)絡(luò)并行實(shí)現(xiàn)及其學(xué)習(xí)方法研究[D];華南理工大學(xué);2015年

9 李艷晴;風(fēng)速時(shí)間序列預(yù)測(cè)算法研究[D];北京科技大學(xué);2016年

10 陳輝;多維超精密定位系統(tǒng)建模與控制關(guān)鍵技術(shù)研究[D];東南大學(xué);2015年

相關(guān)碩士學(xué)位論文 前10條

1 章穎;混合不確定性模塊化神經(jīng)網(wǎng)絡(luò)與高校效益預(yù)測(cè)的研究[D];華南理工大學(xué);2015年

2 賈文靜;基于改進(jìn)型神經(jīng)網(wǎng)絡(luò)的風(fēng)力發(fā)電系統(tǒng)預(yù)測(cè)及控制研究[D];燕山大學(xué);2015年

3 李慧芳;基于憶阻器的渦卷混沌系統(tǒng)及其電路仿真[D];西南大學(xué);2015年

4 陳彥至;神經(jīng)網(wǎng)絡(luò)降維算法研究與應(yīng)用[D];華南理工大學(xué);2015年

5 董哲康;基于憶阻器的組合電路及神經(jīng)網(wǎng)絡(luò)研究[D];西南大學(xué);2015年

6 武創(chuàng)舉;基于神經(jīng)網(wǎng)絡(luò)的遙感圖像分類研究[D];昆明理工大學(xué);2015年

7 李志杰;基于神經(jīng)網(wǎng)絡(luò)的上證指數(shù)預(yù)測(cè)研究[D];華南理工大學(xué);2015年

8 陳少吉;基于神經(jīng)網(wǎng)絡(luò)血壓預(yù)測(cè)研究與系統(tǒng)實(shí)現(xiàn)[D];華南理工大學(xué);2015年

9 張韜;幾類時(shí)滯神經(jīng)網(wǎng)絡(luò)穩(wěn)定性分析[D];渤海大學(xué);2015年

10 邵雪瑩;幾類時(shí)滯不確定神經(jīng)網(wǎng)絡(luò)的穩(wěn)定性分析[D];渤海大學(xué);2015年

,

本文編號(hào):1406777

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/xinxigongchenglunwen/1406777.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶816f2***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com
亚洲一区二区欧美在线| 亚洲一区二区三区有码| 国产91麻豆精品成人区| 人妻人妻人人妻人人澡| 国产精品制服丝袜美腿丝袜| 少妇肥臀一区二区三区| 国产黄色高清内射熟女视频| 亚洲熟女熟妇乱色一区| 日韩精品中文在线观看| 中文字幕日韩欧美理伦片| 欧美一区二区三区五月婷婷| 欧美日韩精品一区免费| 亚洲男人天堂成人在线视频 | 五月天综合网五月天综合网| 婷婷亚洲综合五月天麻豆 | 日本人妻精品有码字幕| 丝袜人妻夜夜爽一区二区三区| 色综合视频一区二区观看| 91麻豆视频国产一区二区| 初尝人妻少妇中文字幕在线| 亚洲精品福利视频在线观看| 日本高清一区免费不卡| 中文字幕日韩欧美理伦片| 精品香蕉国产一区二区三区| 男女午夜视频在线观看免费| 东京热男人的天堂社区| 久热人妻中文字幕一区二区| 精品国产av一区二区三区不卡蜜 | 欧美一区二区三区五月婷婷| 国产亚洲精品香蕉视频播放| 亚洲av一区二区三区精品| 亚洲国产精品一区二区毛片| 最新69国产精品视频| 国产日韩精品激情在线观看| 国产老熟女乱子人伦视频| 草草夜色精品国产噜噜竹菊 | 欧美一级日韩中文字幕| 亚洲国产性生活高潮免费视频| 字幕日本欧美一区二区| 欧美日韩一区二区综合| 九九蜜桃视频香蕉视频|