基于NMF和FCRF的單通道語(yǔ)音分離
[Abstract]:In recent years, non-negative matrix factorization has been widely used in single channel speech separation. However, the standard NMF algorithm assumes that the adjacent frames of speech are independent of each other and cannot represent the time continuity information of speech signals. In this paper, a speech separation algorithm based on NMF and factor conditional random field (factorial conditional random (factorial conditional random) is proposed. Firstly, the spectral structure and time continuity of pure speech are modeled by combining NMF and k-means clustering. Then the FCRF model is trained by the obtained model, and the mixed speech signal is separated. The results show that compared with the algorithm based on NMF, such as active-set Newton algorithm, which does not take into account the continuous feature of speech time, the objective index of the algorithm is improved obviously.
【作者單位】: 中國(guó)科學(xué)院聲學(xué)研究所語(yǔ)言聲學(xué)與內(nèi)容理解重點(diǎn)實(shí)驗(yàn)室;亞利桑那州立大學(xué)信號(hào)分析與感知實(shí)驗(yàn)室;
【基金】:國(guó)家自然科學(xué)基金資助項(xiàng)目(11461141004,91120001,61271426) 中國(guó)科學(xué)院戰(zhàn)略性先導(dǎo)科技專項(xiàng)(XDA06030100,XDA06030500) 國(guó)家“八六三”高技術(shù)項(xiàng)目(2012AA012503) 中科院重點(diǎn)部署項(xiàng)目(KGZD-EW-103-2)
【分類號(hào)】:TN912.3
【相似文獻(xiàn)】
相關(guān)期刊論文 前10條
1 施劍;杜利民;;基于麥克陣列的實(shí)時(shí)盲語(yǔ)音分離系統(tǒng)[J];微計(jì)算機(jī)應(yīng)用;2008年05期
2 張磊;劉繼芳;項(xiàng)學(xué)智;;基于計(jì)算聽覺場(chǎng)景分析的混合語(yǔ)音分離[J];計(jì)算機(jī)工程;2010年14期
3 楊海濱;張軍;;基于模型的單通道語(yǔ)音分離綜述[J];計(jì)算機(jī)應(yīng)用研究;2010年11期
4 虞曉,胡光銳;基于高斯混合密度函數(shù)估計(jì)的語(yǔ)音分離[J];上海交通大學(xué)學(xué)報(bào);2000年01期
5 虞曉,胡光銳;基于高斯混合密度函數(shù)估計(jì)的語(yǔ)音分離[J];上海交通大學(xué)學(xué)報(bào);2000年02期
6 張雪峰,劉建強(qiáng),馮大政;一種快速的頻域盲語(yǔ)音分離系統(tǒng)[J];信號(hào)處理;2005年05期
7 陳鍇;盧晶;徐柏齡;;基于話者狀態(tài)檢測(cè)的自適應(yīng)語(yǔ)音分離方法的研究[J];聲學(xué)學(xué)報(bào);2006年03期
8 董優(yōu)麗;謝勤嵐;;不確定信號(hào)源個(gè)數(shù)的語(yǔ)音分離[J];現(xiàn)代電子技術(shù);2008年03期
9 徐方鑫;;瑞米茲交替算法在語(yǔ)音分離上的應(yīng)用[J];電腦知識(shí)與技術(shù);2012年03期
10 劉俊良;于鳳芹;;基于分離度變步長(zhǎng)的自然梯度算法的語(yǔ)音分離[J];計(jì)算機(jī)工程與應(yīng)用;2013年21期
相關(guān)會(huì)議論文 前5條
1 史曉非;王憲峰;黃耀P;劉人杰;;一個(gè)推廣參數(shù)矢量算法在語(yǔ)音分離中的應(yīng)用[A];中國(guó)航海學(xué)會(huì)通信導(dǎo)航專業(yè)委員會(huì)2004學(xué)術(shù)年會(huì)論文集[C];2004年
2 劉學(xué)觀;陳雪勤;趙鶴鳴;;基于改進(jìn)遺傳算法的混疊語(yǔ)音分離研究[A];第十屆全國(guó)信號(hào)處理學(xué)術(shù)年會(huì)(CCSP-2001)論文集[C];2001年
3 林靜然;彭啟琮;邵懷宗;;基于麥克風(fēng)陣列的雙波束近場(chǎng)定位及語(yǔ)音分離[A];第二屆全國(guó)信息獲取與處理學(xué)術(shù)會(huì)議論文集[C];2004年
4 茅泉泉;趙力;;基于MIMO的盲信道語(yǔ)音分離技術(shù)[A];2004年全國(guó)物理聲學(xué)會(huì)議論文集[C];2004年
5 李量;杜憶;吳璽宏;Claude Alain;;人類聽皮層在語(yǔ)音分離中對(duì)頻率線索和空間線索的線性整合[A];增強(qiáng)心理學(xué)服務(wù)社會(huì)的意識(shí)和功能——中國(guó)心理學(xué)會(huì)成立90周年紀(jì)念大會(huì)暨第十四屆全國(guó)心理學(xué)學(xué)術(shù)會(huì)議論文摘要集[C];2011年
相關(guān)博士學(xué)位論文 前2條
1 趙立恒;基于計(jì)算聽覺場(chǎng)景分析的單聲道語(yǔ)音分離研究[D];中國(guó)科學(xué)技術(shù)大學(xué);2012年
2 王雨;基于計(jì)算聽覺場(chǎng)景分析的單通道語(yǔ)音分離研究[D];華東理工大學(xué);2013年
相關(guān)碩士學(xué)位論文 前10條
1 趙訓(xùn)川;基于計(jì)算聽覺場(chǎng)景分析和麥克風(fēng)陣列的語(yǔ)音分離的研究[D];燕山大學(xué);2015年
2 何求知;單通道語(yǔ)音分離關(guān)鍵技術(shù)研究[D];電子科技大學(xué);2015年
3 曹猛;基于計(jì)算聽覺場(chǎng)景分析和深度神經(jīng)網(wǎng)絡(luò)的混響語(yǔ)音分離[D];太原理工大學(xué);2016年
4 李梟雄;基于雙耳空間信息的語(yǔ)音分離研究[D];東南大學(xué);2015年
5 王瑜;基于計(jì)算聽覺場(chǎng)景分析的三通道語(yǔ)音分離研究[D];燕山大學(xué);2016年
6 王菁;基于計(jì)算聽覺場(chǎng)景分析的混合語(yǔ)音分離[D];燕山大學(xué);2016年
7 束佳明;基于雙耳聲源定位的魯棒語(yǔ)音分離研究[D];東南大學(xué);2016年
8 陳麟琳;基于機(jī)器學(xué)習(xí)的欠定語(yǔ)音分離方法研究[D];大連理工大學(xué);2016年
9 張暉;層疊與深度神經(jīng)網(wǎng)絡(luò)研究及其在語(yǔ)音分離中的應(yīng)用[D];內(nèi)蒙古大學(xué);2014年
10 童開國(guó);多聲源環(huán)境下基于聽覺中樞系統(tǒng)的語(yǔ)音分離研究[D];重慶郵電大學(xué);2012年
,本文編號(hào):2157108
本文鏈接:http://sikaile.net/kejilunwen/xinxigongchenglunwen/2157108.html