天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

基于時(shí)頻分析的音樂(lè)識(shí)別和歌聲分離算法研究

發(fā)布時(shí)間:2020-08-29 09:14
   隨著互聯(lián)網(wǎng)的普及和多媒體技術(shù)的飛速發(fā)展,網(wǎng)絡(luò)上的音樂(lè)數(shù)量呈現(xiàn)了爆炸式的增長(zhǎng)。與此同時(shí)越來(lái)越多的用戶開(kāi)始使用網(wǎng)絡(luò)音樂(lè)應(yīng)用,帶來(lái)了多樣化的音樂(lè)信息需求。因此,如何自動(dòng)地對(duì)海量音樂(lè)數(shù)據(jù)進(jìn)行有效的組織和管理,以及如何從音樂(lè)中提取各種不同的信息成為了亟待解決的問(wèn)題。音樂(lè)信息檢索就是在這種背景下誕生和發(fā)展起來(lái)的研究領(lǐng)域。在本文中,我們關(guān)注音樂(lè)信息檢索中的兩個(gè)重要任務(wù),即音樂(lè)識(shí)別和單聲道歌聲分離。我們?yōu)檫@兩個(gè)任務(wù)分別提出了一種和兩種新算法。這共計(jì)三種算法均采用了時(shí)頻分析的方法,它們都包括了首先將音樂(lè)信號(hào)變換為一種時(shí)頻表示,然后基于這種時(shí)頻表示對(duì)音樂(lè)進(jìn)行時(shí)域和頻域的同步分析。為解決音樂(lè)識(shí)別對(duì)時(shí)間伸縮和音高平移的魯棒性問(wèn)題,我們提出了一種基于時(shí)頻譜圖尺度不變特征變換(Scale Invariant Feature Transform, SIFT)的音樂(lè)識(shí)別算法。在研究中我們發(fā)現(xiàn),音樂(lè)的時(shí)間伸縮和音高平移可以被分別描述為相應(yīng)的對(duì)數(shù)頻率尺度時(shí)頻譜圖圖像的時(shí)間軸伸縮和頻率軸平移,而SIFT正是一種對(duì)圖像伸縮和平移具有較強(qiáng)不變性的圖像特征。因此,從時(shí)頻譜圖圖像中提取的SIFT特征也表現(xiàn)出了對(duì)音樂(lè)時(shí)間伸縮和音高平移的魯棒性。為解決單聲道歌聲分離問(wèn)題,我們首先提出了一種基于兩層時(shí)頻譜圖分解的新算法。在算法的兩層中,我們分別為輸入歌曲構(gòu)建長(zhǎng)窗口和短窗口的時(shí)頻譜圖并對(duì)時(shí)頻譜圖進(jìn)行非負(fù)矩陣分解(Non-Negative Matrix Factorization, NMF).我們?cè)O(shè)計(jì)了一種頻譜不連續(xù)性的閾值判定方法來(lái)從長(zhǎng)窗口NMF中選出諧和樂(lè)器分量,以及一種時(shí)間不連續(xù)性的閾值判定方法來(lái)從短窗口NMF中選出打擊樂(lè)器分量。通過(guò)將選出的分量刪除,歌曲中的諧和和打擊樂(lè)器伴奏被分別消減,而歌聲不受影響。除上面的方法外,我們還提出了一種對(duì)傳統(tǒng)的基于音高的歌聲分離算法的改進(jìn)。改進(jìn)后的方法增加了使用NMF將歌曲的時(shí)頻表示分解為一組互不相交的時(shí)頻塊,每個(gè)時(shí)頻塊來(lái)自于唯一一個(gè)聲源。與歌聲音高所帶來(lái)的諧波結(jié)構(gòu)信息相配合,這些時(shí)頻塊能夠顯著提高歌聲分離的性能。
【學(xué)位單位】:復(fù)旦大學(xué)
【學(xué)位級(jí)別】:博士
【學(xué)位年份】:2014
【中圖分類(lèi)】:TN912.34

【相似文獻(xiàn)】

相關(guān)期刊論文 前10條

1 任智源;張海林;李釗;呂波;;一種基于分離算法記憶效應(yīng)的預(yù)失真技術(shù)[J];山西電子技術(shù);2007年01期

2 何清波;孔凡讓;馮志華;張志偉;朱忠奎;;盲卷積信號(hào)的一種高效分離算法[J];系統(tǒng)仿真學(xué)報(bào);2006年01期

3 林航;胡林豐;王鵬飛;湯俊杰;;基于最大信噪比的帶噪測(cè)控信號(hào)分離算法[J];航天電子對(duì)抗;2011年03期

4 張俊濤,于海勛;有理分式展開(kāi)為部分分式的逐項(xiàng)分離算法[J];西北工業(yè)大學(xué)學(xué)報(bào);2005年03期

5 趙立權(quán);蔡幫貴;;改進(jìn)的擴(kuò)展互信息分離算法[J];電訊技術(shù);2013年04期

6 劉柳;馬秀榮;吳永超;張俊生;;基于能量分離算法的多分量線性調(diào)頻信號(hào)頻率估計(jì)[J];天津理工大學(xué)學(xué)報(bào);2011年02期

7 唐莉萍;曾培峰;張樂(lè);;基于距離變換剝離的黏連纖維圖像分離算法[J];東華大學(xué)學(xué)報(bào)(自然科學(xué)版);2009年05期

8 湯政;;歌唱人聲分離算法改進(jìn)研究[J];電聲技術(shù);2013年12期

9 劉相濱,鄒北驥,胡峰松;基于邊界剝離的細(xì)胞圖象分離算法[J];中國(guó)圖象圖形學(xué)報(bào);2002年03期

10 余桐奎;王曉峰;韓德寶;張國(guó)鋒;;基于獨(dú)立分量的信號(hào)分離算法研究[J];測(cè)控技術(shù);2012年04期

相關(guān)會(huì)議論文 前4條

1 李勇軍;蔡皖東;;一種基于Clark-Wilson模型的職責(zé)分離算法及應(yīng)用[A];全國(guó)網(wǎng)絡(luò)與信息安全技術(shù)研討會(huì)’2004論文集[C];2004年

2 唐世浩;李小文;王錦地;孫睿;張麗華;;基于訂正ALPHA差值譜的MODIS溫度/發(fā)射率分離算法[A];第十五屆全國(guó)遙感技術(shù)學(xué)術(shù)交流會(huì)論文摘要集[C];2005年

3 肖志;于鳳芹;李玉;;基于Windows Vista的TTS系統(tǒng)實(shí)現(xiàn)[A];第二十六屆中國(guó)控制會(huì)議論文集[C];2007年

4 丁慧;盧晶;沈春華;徐柏齡;;一種改進(jìn)的自適應(yīng)語(yǔ)音分離算法[A];中國(guó)聲學(xué)學(xué)會(huì)2001年青年學(xué)術(shù)會(huì)議[CYCA'01]論文集[C];2001年

相關(guān)博士學(xué)位論文 前3條

1 朱碧磊;基于時(shí)頻分析的音樂(lè)識(shí)別和歌聲分離算法研究[D];復(fù)旦大學(xué);2014年

2 關(guān)偉波;Banach空間中函數(shù)和的最小化問(wèn)題前后分離算法及收斂率[D];哈爾濱工業(yè)大學(xué);2015年

3 程皓;低截獲直擴(kuò)信號(hào)參數(shù)盲估計(jì)方法研究[D];電子科技大學(xué);2007年

相關(guān)碩士學(xué)位論文 前10條

1 徐楊飛;基于序貫字典學(xué)習(xí)的單通道語(yǔ)音分離算法研究[D];中國(guó)科學(xué)技術(shù)大學(xué);2015年

2 張峰華;基于統(tǒng)計(jì)量概率正交分解的故障分離算法研究[D];上海交通大學(xué);2014年

3 趙祖云;交叉及粘連物體的分離算法研究[D];東華大學(xué);2010年

4 陸春華;KTRP核心樹(shù)融合與分離算法設(shè)計(jì)[D];電子科技大學(xué);2006年

5 廖理;基于ICA和矩陣分解的單通道數(shù)字調(diào)制信號(hào)分離算法研究[D];電子科技大學(xué);2013年

6 張華;非平穩(wěn)寬帶有色信號(hào)盲卷積分離算法的研究[D];西安電子科技大學(xué);2006年

7 李冰;PAL制電視信號(hào)的亮色分離算法研究[D];西安電子科技大學(xué);2013年

8 談華f

本文編號(hào):2808356


資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/wltx/2808356.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶91ff9***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com