西洋樂器的音色識別
發(fā)布時間:2020-02-04 16:04
【摘要】:樂器識別是音頻信息檢索領(lǐng)域中的重要研究方向之一,其主要目標(biāo)是從樂音信號中分辨出樂器的所屬類別和具體名稱。音色的差異是區(qū)分不同樂器聲音的根本依據(jù),但現(xiàn)有的樂器識別算法通常使用大量的特征用于分類,往往忽略了探索樂器音色的本質(zhì)。本文以音色信息的提取為出發(fā)點(diǎn),對西洋樂器的識別問題展開了研究。合理的數(shù)學(xué)模型是音色特征提取的重要基礎(chǔ),本文總結(jié)了三種不同類別的樂音模型,并對常見的音色特征進(jìn)行了簡要介紹。激勵源-濾波器模型以樂器的發(fā)聲機(jī)制為基礎(chǔ),將樂音信號建模為激勵源與共振體的卷積。樂器的音色主要由共振體的修飾作用決定,并可以通過倒譜分析進(jìn)行有效提取。在倒頻域特征中,梅爾頻率倒譜系數(shù)(Mel Frequency Cepstral Coefficient, MFCC)將樂器的發(fā)聲機(jī)制與人耳的聽覺特性相結(jié)合,更全面地詮釋了音色的感知。本文將傳統(tǒng)的激勵源-濾波器模型加以改進(jìn),利用正弦成分和噪聲成分的疊加對激勵源信號建模,構(gòu)建出對樂音信號描述更為詳細(xì)的綜合模型。受MFCC的啟發(fā),本文在綜合模型的基礎(chǔ)上提出了基于非音高成分的梅爾頻率倒譜系數(shù)(Nontonal Mel Frequency Cepstral Coefficient, NMFCC)。非音高成分對應(yīng)于噪聲激勵,此時提取出的共振體信息去除了激勵源的影響,對音色的描述更加準(zhǔn)確。此外,本文對經(jīng)驗(yàn)?zāi)B(tài)分解(Empirical Mode Decomposition, EMD)得到的本征模態(tài)函數(shù)(Intrinsic Mode Function, IMF)進(jìn)行篩選求和,提出了基于低階本征模態(tài)和的梅爾頻率倒譜系數(shù)(Mel Frequency Cepstral Coefficient of Low Order Modes Summation, LOMS-MFCC),有效突出了樂音信號高頻段的共振峰信息。本文通過大量的樂器分類實(shí)驗(yàn),對NMFCC和LOMS-MFCC的音色描述能力進(jìn)行了驗(yàn)證。與MFCC特征相比,本文提出的兩種音色特征在樂器分類實(shí)驗(yàn)中性能均有明顯改善。鑒于NMFCC令人滿意的區(qū)分能力,論文最后將NMFCC特征和相關(guān)時域特征進(jìn)行組合,使識別系統(tǒng)整體的識別正確率得到進(jìn)一步提高。
【圖文】:
圖2-2邋Mel濾波器細(xì)的頻率響應(yīng)逡逑
對應(yīng)的基頻約為329Hz,在幅度譜中基頻的整數(shù)倍位置處可W看出有明顯的逡逑諧波結(jié)構(gòu)。為了方便比較,本文采用True邋Envelope算法求解了,
本文編號:2576360
【圖文】:
圖2-2邋Mel濾波器細(xì)的頻率響應(yīng)逡逑
對應(yīng)的基頻約為329Hz,在幅度譜中基頻的整數(shù)倍位置處可W看出有明顯的逡逑諧波結(jié)構(gòu)。為了方便比較,本文采用True邋Envelope算法求解了,
本文編號:2576360
本文鏈接:http://sikaile.net/kejilunwen/wltx/2576360.html
最近更新
教材專著