天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當前位置:主頁 > 科技論文 > 自動化論文 >

基于深度學習語音分離技術的研究現(xiàn)狀與進展

發(fā)布時間:2018-05-16 17:29

  本文選題:神經(jīng)網(wǎng)絡 + 語音分離��; 參考:《自動化學報》2016年06期


【摘要】:現(xiàn)階段,語音交互技術日益在現(xiàn)實生活中得到廣泛的應用,然而,由于干擾的存在,現(xiàn)實環(huán)境中的語音交互技術遠沒有達到令人滿意的程度.針對加性噪音的語音分離技術是提高語音交互性能的有效途徑,幾十年來,全世界范圍內(nèi)的許多研究者為此投入了巨大的努力,提出了很多實用的方法.特別是近年來,由于深度學習研究的興起,基于深度學習的語音分離技術日益得到了廣泛關注和重視,顯露出了相當光明的應用前景,逐漸成為語音分離中一個新的研究趨勢.目前已有很多基于深度學習的語音分離方法被提出,但是,對于深度學習語音分離技術一直以來都缺乏一個系統(tǒng)的分析和總結(jié),不同方法之間的聯(lián)系和區(qū)分也很少被研究.針對這個問題,本文試圖對語音分離的主要流程和整體框架進行細致的分析和總結(jié),從特征、模型以及目標三個方面對現(xiàn)有的前沿研究進展進行全面而深入的綜述,最后對語音分離技術進行展望.
[Abstract]:At present, the technology of speech interaction is widely used in real life. However, due to the existence of interference, the technology of voice interaction in real environment is far from satisfactory. The technology of speech separation based on additive noise is an effective way to improve the performance of speech interaction. In recent decades, many researchers all over the world have put in great efforts and put forward many practical methods. Especially in recent years, due to the rise of deep learning research, the technology of speech separation based on deep learning has been paid more and more attention, showing a bright prospect of application, and gradually becoming a new research trend in speech separation. At present, many speech separation methods based on deep learning have been proposed. However, there is a lack of systematic analysis and summary of the deep learning speech separation technology, and the relationship and distinction between different methods are seldom studied. In order to solve this problem, this paper attempts to analyze and summarize the main flow and the whole framework of speech separation in detail, and make a comprehensive and in-depth review of the current research progress in the three aspects of features, models and objectives. Finally, the speech separation technology is prospected.
【作者單位】: 中國科學院自動化研究所模式識別國家重點實驗室;內(nèi)蒙古大學計算機系;
【基金】:國家自然科學基金(61573357,61503382,61403370,61273267,91120303,61365006)資助~~
【分類號】:TP183;TP181

【相似文獻】

相關期刊論文 前10條

1 施劍;杜利民;;基于麥克陣列的實時盲語音分離系統(tǒng)[J];微計算機應用;2008年05期

2 張磊;劉繼芳;項學智;;基于計算聽覺場景分析的混合語音分離[J];計算機工程;2010年14期

3 楊海濱;張軍;;基于模型的單通道語音分離綜述[J];計算機應用研究;2010年11期

4 虞曉,胡光銳;基于高斯混合密度函數(shù)估計的語音分離[J];上海交通大學學報;2000年01期

5 虞曉,胡光銳;基于高斯混合密度函數(shù)估計的語音分離[J];上海交通大學學報;2000年02期

6 張雪峰,劉建強,馮大政;一種快速的頻域盲語音分離系統(tǒng)[J];信號處理;2005年05期

7 陳鍇;盧晶;徐柏齡;;基于話者狀態(tài)檢測的自適應語音分離方法的研究[J];聲學學報;2006年03期

8 董優(yōu)麗;謝勤嵐;;不確定信號源個數(shù)的語音分離[J];現(xiàn)代電子技術;2008年03期

9 徐方鑫;;瑞米茲交替算法在語音分離上的應用[J];電腦知識與技術;2012年03期

10 劉俊良;于鳳芹;;基于分離度變步長的自然梯度算法的語音分離[J];計算機工程與應用;2013年21期

相關會議論文 前5條

1 史曉非;王憲峰;黃耀P;劉人杰;;一個推廣參數(shù)矢量算法在語音分離中的應用[A];中國航海學會通信導航專業(yè)委員會2004學術年會論文集[C];2004年

2 劉學觀;陳雪勤;趙鶴鳴;;基于改進遺傳算法的混疊語音分離研究[A];第十屆全國信號處理學術年會(CCSP-2001)論文集[C];2001年

3 林靜然;彭啟琮;邵懷宗;;基于麥克風陣列的雙波束近場定位及語音分離[A];第二屆全國信息獲取與處理學術會議論文集[C];2004年

4 茅泉泉;趙力;;基于MIMO的盲信道語音分離技術[A];2004年全國物理聲學會議論文集[C];2004年

5 李量;杜憶;吳璽宏;Claude Alain;;人類聽皮層在語音分離中對頻率線索和空間線索的線性整合[A];增強心理學服務社會的意識和功能——中國心理學會成立90周年紀念大會暨第十四屆全國心理學學術會議論文摘要集[C];2011年

相關博士學位論文 前2條

1 趙立恒;基于計算聽覺場景分析的單聲道語音分離研究[D];中國科學技術大學;2012年

2 王雨;基于計算聽覺場景分析的單通道語音分離研究[D];華東理工大學;2013年

相關碩士學位論文 前10條

1 趙訓川;基于計算聽覺場景分析和麥克風陣列的語音分離的研究[D];燕山大學;2015年

2 何求知;單通道語音分離關鍵技術研究[D];電子科技大學;2015年

3 張暉;層疊與深度神經(jīng)網(wǎng)絡研究及其在語音分離中的應用[D];內(nèi)蒙古大學;2014年

4 童開國;多聲源環(huán)境下基于聽覺中樞系統(tǒng)的語音分離研究[D];重慶郵電大學;2012年

5 陳雪勤;基于計算聲場景分析的混疊語音分離研究[D];蘇州大學;2002年

6 丁文;非負矩陣的分解及其在單聲道語音分離中的應用[D];南昌大學;2014年

7 汪健;基于空域濾波的語音分離研究[D];西南交通大學;2011年

8 劉仙偉;卷積語音盲分離的SOPC實現(xiàn)[D];大連理工大學;2011年

9 宋岳陽;基于單源欠定語音分離的音樂主旋律提取方法研究[D];北京郵電大學;2012年

10 吳春;基于計算聽覺場景分析的雙說話人混合語音分離研究[D];廣西大學;2014年

,

本文編號:1897769

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/zidonghuakongzhilunwen/1897769.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權申明:資料由用戶00650***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com