天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁(yè) > 科技論文 > 信息工程論文 >

監(jiān)督性語(yǔ)音分離中訓(xùn)練目標(biāo)的研究

發(fā)布時(shí)間:2018-04-26 03:05

  本文選題:深度神經(jīng)網(wǎng)絡(luò) + 語(yǔ)音分離��; 參考:《內(nèi)蒙古大學(xué)》2017年碩士論文


【摘要】:語(yǔ)音分離是指從帶有噪聲的混合語(yǔ)音信號(hào)中提取出需要的目標(biāo)語(yǔ)音信號(hào),應(yīng)用于魯棒性語(yǔ)音識(shí)別、助聽(tīng)器設(shè)計(jì)和移動(dòng)語(yǔ)音通信等領(lǐng)域。當(dāng)前的語(yǔ)音分離技術(shù)在真實(shí)場(chǎng)景中的語(yǔ)音分離性能仍有待進(jìn)一步提升。語(yǔ)音分離問(wèn)題按照通道數(shù)分為單通道和多通道語(yǔ)音分離,本文主要研究單通道語(yǔ)音分離問(wèn)題。語(yǔ)音分離問(wèn)題可以被看做一個(gè)監(jiān)督性學(xué)習(xí)問(wèn)題,通過(guò)監(jiān)督性學(xué)習(xí)算法加以解決。而對(duì)于監(jiān)督性語(yǔ)音分離算法,訓(xùn)練目標(biāo)是其中的關(guān)鍵環(huán)節(jié)之一,對(duì)分離性能有著重要影響。目前最常用的訓(xùn)練目標(biāo)有理想二值掩蔽和理想浮值掩蔽,二者都是在假設(shè)純凈語(yǔ)音與噪聲相互獨(dú)立的條件下成立,在真實(shí)場(chǎng)景中難以滿(mǎn)足。而復(fù)數(shù)域上的理想浮值掩蔽和相敏掩蔽考慮了語(yǔ)音信號(hào)的相位信息,不易于估計(jì),因而實(shí)際分離效果仍不甚理想。相較于這些常用的時(shí)頻掩蔽,本文所采用的優(yōu)化浮值掩蔽,考慮了純凈語(yǔ)音與噪聲間的相關(guān)性,符合真實(shí)場(chǎng)景中語(yǔ)音分離的條件。本文將其與監(jiān)督性語(yǔ)音分離技術(shù)相結(jié)合,以?xún)?yōu)化浮值掩蔽作為分離目標(biāo),提出了解決語(yǔ)音分離問(wèn)題的新方案。本文在多種噪聲環(huán)境和信噪比條件下進(jìn)行了仿真實(shí)驗(yàn),并與幾種目前常用訓(xùn)練目標(biāo)進(jìn)行對(duì)比分析,實(shí)驗(yàn)結(jié)果表明,本文所提出的方法進(jìn)一步改善了語(yǔ)音分離的效果,更加適用于真實(shí)場(chǎng)景中的語(yǔ)音分離問(wèn)題�?紤]到優(yōu)化浮值掩蔽是基于純凈語(yǔ)音與噪聲的相關(guān)性信息,本文中進(jìn)一步對(duì)更具有挑戰(zhàn)性的不同人聲之間的語(yǔ)音分離做了仿真實(shí)驗(yàn),實(shí)驗(yàn)結(jié)果表明本文提出的分離方法對(duì)于不同說(shuō)話(huà)人語(yǔ)音的分離同樣具有性能優(yōu)勢(shì)。單通道語(yǔ)音去混響問(wèn)題也是語(yǔ)音信號(hào)處理領(lǐng)域的研究重點(diǎn)之一。近年隨著深度學(xué)習(xí)的推進(jìn),研究者們將深度學(xué)習(xí)應(yīng)用于語(yǔ)音去混響問(wèn)題,取得了不錯(cuò)的效果。本文將提出的語(yǔ)音分離方法用于實(shí)現(xiàn)語(yǔ)音去混響,實(shí)驗(yàn)結(jié)果表明去混響效果得到了一定程度的提升。
[Abstract]:Speech separation is to extract the target speech signal from the mixed speech signal with noise, which can be used in the fields of robust speech recognition, hearing aid design and mobile speech communication. The performance of the current speech separation technology in real-time scene still needs to be further improved. The speech separation problem is divided into single channel and multi channel according to the number of channels. The problem of speech separation can be regarded as a supervised learning problem, which can be solved by supervised learning algorithm. For supervised speech separation algorithm, the training target is one of the key links, which has an important impact on the separation performance. At present, the most commonly used training targets are ideal binary masking and ideal floating masking, both of which are based on the assumption that pure speech and noise are independent of each other, which is difficult to satisfy in real scenes. However, the ideal floating value masking and phase sensitive masking in complex domain take into account the phase information of speech signal, which is difficult to estimate, so the actual separation effect is still not very good. Compared with these commonly used time-frequency masking, the optimized floating value masking is adopted in this paper, considering the correlation between pure speech and noise, which accords with the condition of speech separation in real scene. In this paper, a new method to solve the problem of speech separation is proposed by combining it with the supervised speech separation technology and taking the optimization of floating value masking as the separation target. In this paper, simulation experiments are carried out in a variety of noise environments and signal-to-noise ratio (SNR) conditions, and compared with several commonly used training targets. The experimental results show that the method proposed in this paper can further improve the effect of speech separation. It is more suitable for speech separation in real scene. Considering that the optimization of floating value masking is based on the correlation information between pure speech and noise, this paper makes further simulation experiments on the more challenging speech separation between different voices. Experimental results show that the proposed separation method has the same performance advantages for different speaker speech separation. The problem of single-channel speech dereverberation is also one of the focuses in the field of speech signal processing. In recent years, with the development of deep learning, researchers have applied deep learning to the problem of phonological reverberation, and achieved good results. In this paper, the proposed speech separation method is used to realize the speech de-reverberation. The experimental results show that the de-reverberation effect has been improved to a certain extent.
【學(xué)位授予單位】:內(nèi)蒙古大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2017
【分類(lèi)號(hào)】:TN912.3

【相似文獻(xiàn)】

相關(guān)期刊論文 前10條

1 李從清;孫立新;龍東;任曉光;;語(yǔ)音分離技術(shù)的研究現(xiàn)狀與展望[J];聲學(xué)技術(shù);2008年05期

2 施劍;杜利民;;基于麥克陣列的實(shí)時(shí)盲語(yǔ)音分離系統(tǒng)[J];微計(jì)算機(jī)應(yīng)用;2008年05期

3 張磊;劉繼芳;項(xiàng)學(xué)智;;基于計(jì)算聽(tīng)覺(jué)場(chǎng)景分析的混合語(yǔ)音分離[J];計(jì)算機(jī)工程;2010年14期

4 楊海濱;張軍;;基于模型的單通道語(yǔ)音分離綜述[J];計(jì)算機(jī)應(yīng)用研究;2010年11期

5 虞曉,胡光銳;基于高斯混合密度函數(shù)估計(jì)的語(yǔ)音分離[J];上海交通大學(xué)學(xué)報(bào);2000年01期

6 虞曉,胡光銳;基于高斯混合密度函數(shù)估計(jì)的語(yǔ)音分離[J];上海交通大學(xué)學(xué)報(bào);2000年02期

7 張雪峰,劉建強(qiáng),馮大政;一種快速的頻域盲語(yǔ)音分離系統(tǒng)[J];信號(hào)處理;2005年05期

8 陳鍇;盧晶;徐柏齡;;基于話(huà)者狀態(tài)檢測(cè)的自適應(yīng)語(yǔ)音分離方法的研究[J];聲學(xué)學(xué)報(bào);2006年03期

9 董優(yōu)麗;謝勤嵐;;不確定信號(hào)源個(gè)數(shù)的語(yǔ)音分離[J];現(xiàn)代電子技術(shù);2008年03期

10 徐方鑫;;瑞米茲交替算法在語(yǔ)音分離上的應(yīng)用[J];電腦知識(shí)與技術(shù);2012年03期

相關(guān)會(huì)議論文 前5條

1 史曉非;王憲峰;黃耀P;劉人杰;;一個(gè)推廣參數(shù)矢量算法在語(yǔ)音分離中的應(yīng)用[A];中國(guó)航海學(xué)會(huì)通信導(dǎo)航專(zhuān)業(yè)委員會(huì)2004學(xué)術(shù)年會(huì)論文集[C];2004年

2 劉學(xué)觀(guān);陳雪勤;趙鶴鳴;;基于改進(jìn)遺傳算法的混疊語(yǔ)音分離研究[A];第十屆全國(guó)信號(hào)處理學(xué)術(shù)年會(huì)(CCSP-2001)論文集[C];2001年

3 林靜然;彭啟琮;邵懷宗;;基于麥克風(fēng)陣列的雙波束近場(chǎng)定位及語(yǔ)音分離[A];第二屆全國(guó)信息獲取與處理學(xué)術(shù)會(huì)議論文集[C];2004年

4 茅泉泉;趙力;;基于MIMO的盲信道語(yǔ)音分離技術(shù)[A];2004年全國(guó)物理聲學(xué)會(huì)議論文集[C];2004年

5 李量;杜憶;吳璽宏;Claude Alain;;人類(lèi)聽(tīng)皮層在語(yǔ)音分離中對(duì)頻率線(xiàn)索和空間線(xiàn)索的線(xiàn)性整合[A];增強(qiáng)心理學(xué)服務(wù)社會(huì)的意識(shí)和功能——中國(guó)心理學(xué)會(huì)成立90周年紀(jì)念大會(huì)暨第十四屆全國(guó)心理學(xué)學(xué)術(shù)會(huì)議論文摘要集[C];2011年

相關(guān)博士學(xué)位論文 前3條

1 王燕南;基于深度學(xué)習(xí)的說(shuō)話(huà)人無(wú)關(guān)單通道語(yǔ)音分離[D];中國(guó)科學(xué)技術(shù)大學(xué);2017年

2 趙立恒;基于計(jì)算聽(tīng)覺(jué)場(chǎng)景分析的單聲道語(yǔ)音分離研究[D];中國(guó)科學(xué)技術(shù)大學(xué);2012年

3 王雨;基于計(jì)算聽(tīng)覺(jué)場(chǎng)景分析的單通道語(yǔ)音分離研究[D];華東理工大學(xué);2013年

相關(guān)碩士學(xué)位論文 前10條

1 趙訓(xùn)川;基于計(jì)算聽(tīng)覺(jué)場(chǎng)景分析和麥克風(fēng)陣列的語(yǔ)音分離的研究[D];燕山大學(xué);2015年

2 何求知;單通道語(yǔ)音分離關(guān)鍵技術(shù)研究[D];電子科技大學(xué);2015年

3 曹猛;基于計(jì)算聽(tīng)覺(jué)場(chǎng)景分析和深度神經(jīng)網(wǎng)絡(luò)的混響語(yǔ)音分離[D];太原理工大學(xué);2016年

4 李梟雄;基于雙耳空間信息的語(yǔ)音分離研究[D];東南大學(xué);2015年

5 王瑜;基于計(jì)算聽(tīng)覺(jué)場(chǎng)景分析的三通道語(yǔ)音分離研究[D];燕山大學(xué);2016年

6 王菁;基于計(jì)算聽(tīng)覺(jué)場(chǎng)景分析的混合語(yǔ)音分離[D];燕山大學(xué);2016年

7 束佳明;基于雙耳聲源定位的魯棒語(yǔ)音分離研究[D];東南大學(xué);2016年

8 陳麟琳;基于機(jī)器學(xué)習(xí)的欠定語(yǔ)音分離方法研究[D];大連理工大學(xué);2016年

9 李號(hào);基于深度學(xué)習(xí)的單通道語(yǔ)音分離[D];內(nèi)蒙古大學(xué);2017年

10 夏莎莎;監(jiān)督性語(yǔ)音分離中訓(xùn)練目標(biāo)的研究[D];內(nèi)蒙古大學(xué);2017年

,

本文編號(hào):1804183

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/xinxigongchenglunwen/1804183.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶(hù)6133b***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com