基于深度學(xué)習(xí)語音分離技術(shù)的研究現(xiàn)狀與進(jìn)展

發(fā)布時(shí)間：2018-05-16 17:29

本文選題：神經(jīng)網(wǎng)絡(luò) + 語音分離　；參考：《自動(dòng)化學(xué)報(bào)》2016年06期

【摘要】：現(xiàn)階段,語音交互技術(shù)日益在現(xiàn)實(shí)生活中得到廣泛的應(yīng)用,然而,由于干擾的存在,現(xiàn)實(shí)環(huán)境中的語音交互技術(shù)遠(yuǎn)沒有達(dá)到令人滿意的程度.針對加性噪音的語音分離技術(shù)是提高語音交互性能的有效途徑,幾十年來,全世界范圍內(nèi)的許多研究者為此投入了巨大的努力,提出了很多實(shí)用的方法.特別是近年來,由于深度學(xué)習(xí)研究的興起,基于深度學(xué)習(xí)的語音分離技術(shù)日益得到了廣泛關(guān)注和重視,顯露出了相當(dāng)光明的應(yīng)用前景,逐漸成為語音分離中一個(gè)新的研究趨勢.目前已有很多基于深度學(xué)習(xí)的語音分離方法被提出,但是,對于深度學(xué)習(xí)語音分離技術(shù)一直以來都缺乏一個(gè)系統(tǒng)的分析和總結(jié),不同方法之間的聯(lián)系和區(qū)分也很少被研究.針對這個(gè)問題,本文試圖對語音分離的主要流程和整體框架進(jìn)行細(xì)致的分析和總結(jié),從特征、模型以及目標(biāo)三個(gè)方面對現(xiàn)有的前沿研究進(jìn)展進(jìn)行全面而深入的綜述,最后對語音分離技術(shù)進(jìn)行展望.
[Abstract]:At present, the technology of speech interaction is widely used in real life. However, due to the existence of interference, the technology of voice interaction in real environment is far from satisfactory. The technology of speech separation based on additive noise is an effective way to improve the performance of speech interaction. In recent decades, many researchers all over the world have put in great efforts and put forward many practical methods. Especially in recent years, due to the rise of deep learning research, the technology of speech separation based on deep learning has been paid more and more attention, showing a bright prospect of application, and gradually becoming a new research trend in speech separation. At present, many speech separation methods based on deep learning have been proposed. However, there is a lack of systematic analysis and summary of the deep learning speech separation technology, and the relationship and distinction between different methods are seldom studied. In order to solve this problem, this paper attempts to analyze and summarize the main flow and the whole framework of speech separation in detail, and make a comprehensive and in-depth review of the current research progress in the three aspects of features, models and objectives. Finally, the speech separation technology is prospected.
【作者單位】：中國科學(xué)院自動(dòng)化研究所模式識(shí)別國家重點(diǎn)實(shí)驗(yàn)室;內(nèi)蒙古大學(xué)計(jì)算機(jī)系;
【基金】：國家自然科學(xué)基金(61573357,61503382,61403370,61273267,91120303,61365006)資助~~
【分類號(hào)】：TP183;TP181

【相似文獻(xiàn)】

相關(guān)期刊論文前10條

1 施劍;杜利民;;基于麥克陣列的實(shí)時(shí)盲語音分離系統(tǒng)[J];微計(jì)算機(jī)應(yīng)用;2008年05期

2 張磊;劉繼芳;項(xiàng)學(xué)智;;基于計(jì)算聽覺場景分析的混合語音分離[J];計(jì)算機(jī)工程;2010年14期

3 楊海濱;張軍;;基于模型的單通道語音分離綜述[J];計(jì)算機(jī)應(yīng)用研究;2010年11期

4 虞曉,胡光銳;基于高斯混合密度函數(shù)估計(jì)的語音分離[J];上海交通大學(xué)學(xué)報(bào);2000年01期

5 虞曉,胡光銳;基于高斯混合密度函數(shù)估計(jì)的語音分離[J];上海交通大學(xué)學(xué)報(bào);2000年02期

6 張雪峰,劉建強(qiáng),馮大政;一種快速的頻域盲語音分離系統(tǒng)[J];信號(hào)處理;2005年05期

7 陳鍇;盧晶;徐柏齡;;基于話者狀態(tài)檢測的自適應(yīng)語音分離方法的研究[J];聲學(xué)學(xué)報(bào);2006年03期

8 董優(yōu)麗;謝勤嵐;;不確定信號(hào)源個(gè)數(shù)的語音分離[J];現(xiàn)代電子技術(shù);2008年03期

9 徐方鑫;;瑞米茲交替算法在語音分離上的應(yīng)用[J];電腦知識(shí)與技術(shù);2012年03期

10 劉俊良;于鳳芹;;基于分離度變步長的自然梯度算法的語音分離[J];計(jì)算機(jī)工程與應(yīng)用;2013年21期

相關(guān)會(huì)議論文前5條

1 史曉非;王憲峰;黃耀P;劉人杰;;一個(gè)推廣參數(shù)矢量算法在語音分離中的應(yīng)用[A];中國航海學(xué)會(huì)通信導(dǎo)航專業(yè)委員會(huì)2004學(xué)術(shù)年會(huì)論文集[C];2004年

2 劉學(xué)觀;陳雪勤;趙鶴鳴;;基于改進(jìn)遺傳算法的混疊語音分離研究[A];第十屆全國信號(hào)處理學(xué)術(shù)年會(huì)（CCSP-2001）論文集[C];2001年

3 林靜然;彭啟琮;邵懷宗;;基于麥克風(fēng)陣列的雙波束近場定位及語音分離[A];第二屆全國信息獲取與處理學(xué)術(shù)會(huì)議論文集[C];2004年

4 茅泉泉;趙力;;基于MIMO的盲信道語音分離技術(shù)[A];2004年全國物理聲學(xué)會(huì)議論文集[C];2004年

5 李量;杜憶;吳璽宏;Claude Alain;;人類聽皮層在語音分離中對頻率線索和空間線索的線性整合[A];增強(qiáng)心理學(xué)服務(wù)社會(huì)的意識(shí)和功能——中國心理學(xué)會(huì)成立90周年紀(jì)念大會(huì)暨第十四屆全國心理學(xué)學(xué)術(shù)會(huì)議論文摘要集[C];2011年

相關(guān)博士學(xué)位論文前2條

1 趙立恒;基于計(jì)算聽覺場景分析的單聲道語音分離研究[D];中國科學(xué)技術(shù)大學(xué);2012年

2 王雨;基于計(jì)算聽覺場景分析的單通道語音分離研究[D];華東理工大學(xué);2013年

相關(guān)碩士學(xué)位論文前10條

1 趙訓(xùn)川;基于計(jì)算聽覺場景分析和麥克風(fēng)陣列的語音分離的研究[D];燕山大學(xué);2015年

2 何求知;單通道語音分離關(guān)鍵技術(shù)研究[D];電子科技大學(xué);2015年

3 張暉;層疊與深度神經(jīng)網(wǎng)絡(luò)研究及其在語音分離中的應(yīng)用[D];內(nèi)蒙古大學(xué);2014年

4 童開國;多聲源環(huán)境下基于聽覺中樞系統(tǒng)的語音分離研究[D];重慶郵電大學(xué);2012年

5 陳雪勤;基于計(jì)算聲場景分析的混疊語音分離研究[D];蘇州大學(xué);2002年

6 丁文;非負(fù)矩陣的分解及其在單聲道語音分離中的應(yīng)用[D];南昌大學(xué);2014年

7 汪健;基于空域?yàn)V波的語音分離研究[D];西南交通大學(xué);2011年

8 劉仙偉;卷積語音盲分離的SOPC實(shí)現(xiàn)[D];大連理工大學(xué);2011年

9 宋岳陽;基于單源欠定語音分離的音樂主旋律提取方法研究[D];北京郵電大學(xué);2012年

10 吳春;基于計(jì)算聽覺場景分析的雙說話人混合語音分離研究[D];廣西大學(xué);2014年

，

本文編號(hào)：1897769

資料下載

論文發(fā)表

支付寶下載

Download by Alipay
微信下載

Download by Wechat
會(huì)員下載

Download by Member

本文鏈接：http://sikaile.net/kejilunwen/zidonghuakongzhilunwen/1897769.html

上一篇：具有時(shí)延和亂序網(wǎng)絡(luò)化系統(tǒng)的動(dòng)態(tài)矩陣控制
下一篇：函數(shù)優(yōu)化的量子正弦余弦算法

論文發(fā)表

·知網(wǎng)|萬方|維普|龍?jiān)磡省級(jí)|國家級(jí)|科技核心|北大核心|南大核心CSSCI|EI|SCI|SSCI|

天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

基于深度學(xué)習(xí)語音分離技術(shù)的研究現(xiàn)狀與進(jìn)展