天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

基于雙耳空間信息的語音分離研究

發(fā)布時間:2017-11-29 01:15

  本文關(guān)鍵詞:基于雙耳空間信息的語音分離研究


  更多相關(guān)文章: 雙耳聲源定位 盲源分離 語音分離 二進(jìn)制掩碼 壓縮感知


【摘要】:語音分離技術(shù)尤其是基于人耳聽覺的語音分離技術(shù),在語音增強(qiáng)、語音識別和助聽器等語音信號處理領(lǐng)域具有重要的地位。本文以雙耳空間信息為基礎(chǔ),結(jié)合語音信號的稀疏性,提出了兩種基于雙耳定位的語音分離方法:基于時頻掩蔽的語音分離和基于壓縮感知的語音分離。對于基于空間信息的多聲源混合語音分離,論文主要做了以下幾方面的工作:(1)分析了雙耳定位的語音分離的研究思路?臻g聽覺是人耳聽覺的一個重要特性,多聲源環(huán)境下,人耳聽覺系統(tǒng)首先整合聲源的空間信息,經(jīng)由大腦的中樞神經(jīng),進(jìn)行定位及分離,本文根據(jù)該特性,提出了先通過雙耳定位算法對多聲源進(jìn)行定位,再根據(jù)定位結(jié)果進(jìn)行語音分離的思路。(2)研究了雙耳多聲源定位算法。通過對耳間時間差和耳間強(qiáng)度差兩個聲源定位線索進(jìn)行模型訓(xùn)練,建立方位映射模型,將多聲源混合語音進(jìn)行參數(shù)提取,通過耳間時間差與耳間強(qiáng)度差的聯(lián)合判定,獲取多聲源定位結(jié)果,包括聲源個數(shù)及其對應(yīng)的水平面上的角度。實驗結(jié)果表明,該定位算法對單聲源至多聲源定位有較高的定位準(zhǔn)確度。(3)提出了基于雙耳定位結(jié)果的時頻掩蔽語音分離算法。在多聲源環(huán)境下,在頻域的同一頻點,能量最大的聲源將掩蔽其它能量較小的聲源,最終只有一個信號占主導(dǎo),本文依據(jù)語音信號的頻域稀疏性,根據(jù)聲源定位的結(jié)果,將所有時頻點都劃分為離該時頻點距離最近的聲源,將每個聲源所劃分到的時頻點進(jìn)行時域轉(zhuǎn)換,獲得該聲源的分離信號。基于雙耳定位的時頻掩蔽語音分離其實驗結(jié)果要明顯優(yōu)于同類算法。(4)提出了基于雙耳定位結(jié)果的壓縮感知語音分離算法。本文分析了基于雙耳的多聲源混合模型,其形式與基本的壓縮感知模型是相一致的,因此,本文利用雙耳定位結(jié)果、聲源的字典信息和混合語音構(gòu)建出壓縮感知模型,采用正交匹配追蹤算法對多聲源混合語音進(jìn)行重構(gòu),實驗結(jié)果表明,語音分離指標(biāo)SIR、SNR與時頻掩蔽方法相比獲得有效提高。
【學(xué)位授予單位】:東南大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2015
【分類號】:TN912.3

【相似文獻(xiàn)】

中國期刊全文數(shù)據(jù)庫 前10條

1 施劍;杜利民;;基于麥克陣列的實時盲語音分離系統(tǒng)[J];微計算機(jī)應(yīng)用;2008年05期

2 張磊;劉繼芳;項學(xué)智;;基于計算聽覺場景分析的混合語音分離[J];計算機(jī)工程;2010年14期

3 楊海濱;張軍;;基于模型的單通道語音分離綜述[J];計算機(jī)應(yīng)用研究;2010年11期

4 虞曉,胡光銳;基于高斯混合密度函數(shù)估計的語音分離[J];上海交通大學(xué)學(xué)報;2000年01期

5 虞曉,胡光銳;基于高斯混合密度函數(shù)估計的語音分離[J];上海交通大學(xué)學(xué)報;2000年02期

6 張雪峰,劉建強(qiáng),馮大政;一種快速的頻域盲語音分離系統(tǒng)[J];信號處理;2005年05期

7 陳鍇;盧晶;徐柏齡;;基于話者狀態(tài)檢測的自適應(yīng)語音分離方法的研究[J];聲學(xué)學(xué)報;2006年03期

8 董優(yōu)麗;謝勤嵐;;不確定信號源個數(shù)的語音分離[J];現(xiàn)代電子技術(shù);2008年03期

9 徐方鑫;;瑞米茲交替算法在語音分離上的應(yīng)用[J];電腦知識與技術(shù);2012年03期

10 劉俊良;于鳳芹;;基于分離度變步長的自然梯度算法的語音分離[J];計算機(jī)工程與應(yīng)用;2013年21期

中國重要會議論文全文數(shù)據(jù)庫 前5條

1 史曉非;王憲峰;黃耀P;劉人杰;;一個推廣參數(shù)矢量算法在語音分離中的應(yīng)用[A];中國航海學(xué)會通信導(dǎo)航專業(yè)委員會2004學(xué)術(shù)年會論文集[C];2004年

2 劉學(xué)觀;陳雪勤;趙鶴鳴;;基于改進(jìn)遺傳算法的混疊語音分離研究[A];第十屆全國信號處理學(xué)術(shù)年會(CCSP-2001)論文集[C];2001年

3 林靜然;彭啟琮;邵懷宗;;基于麥克風(fēng)陣列的雙波束近場定位及語音分離[A];第二屆全國信息獲取與處理學(xué)術(shù)會議論文集[C];2004年

4 茅泉泉;趙力;;基于MIMO的盲信道語音分離技術(shù)[A];2004年全國物理聲學(xué)會議論文集[C];2004年

5 李量;杜憶;吳璽宏;Claude Alain;;人類聽皮層在語音分離中對頻率線索和空間線索的線性整合[A];增強(qiáng)心理學(xué)服務(wù)社會的意識和功能——中國心理學(xué)會成立90周年紀(jì)念大會暨第十四屆全國心理學(xué)學(xué)術(shù)會議論文摘要集[C];2011年

中國博士學(xué)位論文全文數(shù)據(jù)庫 前2條

1 趙立恒;基于計算聽覺場景分析的單聲道語音分離研究[D];中國科學(xué)技術(shù)大學(xué);2012年

2 王雨;基于計算聽覺場景分析的單通道語音分離研究[D];華東理工大學(xué);2013年

中國碩士學(xué)位論文全文數(shù)據(jù)庫 前10條

1 趙訓(xùn)川;基于計算聽覺場景分析和麥克風(fēng)陣列的語音分離的研究[D];燕山大學(xué);2015年

2 何求知;單通道語音分離關(guān)鍵技術(shù)研究[D];電子科技大學(xué);2015年

3 曹猛;基于計算聽覺場景分析和深度神經(jīng)網(wǎng)絡(luò)的混響語音分離[D];太原理工大學(xué);2016年

4 李梟雄;基于雙耳空間信息的語音分離研究[D];東南大學(xué);2015年

5 張暉;層疊與深度神經(jīng)網(wǎng)絡(luò)研究及其在語音分離中的應(yīng)用[D];內(nèi)蒙古大學(xué);2014年

6 童開國;多聲源環(huán)境下基于聽覺中樞系統(tǒng)的語音分離研究[D];重慶郵電大學(xué);2012年

7 陳雪勤;基于計算聲場景分析的混疊語音分離研究[D];蘇州大學(xué);2002年

8 丁文;非負(fù)矩陣的分解及其在單聲道語音分離中的應(yīng)用[D];南昌大學(xué);2014年

9 汪健;基于空域濾波的語音分離研究[D];西南交通大學(xué);2011年

10 劉仙偉;卷積語音盲分離的SOPC實現(xiàn)[D];大連理工大學(xué);2011年

,

本文編號:1235668

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/wltx/1235668.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶1c6ed***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com