天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁 > 文藝論文 > 音樂藝術(shù)論文 >

基于卷積神經(jīng)網(wǎng)絡(luò)的中國樂器分類

發(fā)布時(shí)間:2024-03-01 00:09
  中國樂器有著豐富的種類,但過去由于缺少數(shù)字化的保存形式,在音樂信息檢索領(lǐng)域有關(guān)它們的研究很少.基于中國音樂學(xué)院收集完成的中國樂器數(shù)據(jù)庫,本文旨在找到每種中國樂器各自獨(dú)有的聲音特征,并希望找到泛化能力較強(qiáng)的模型以更好地利用有限的數(shù)據(jù)集.使用卷積神經(jīng)網(wǎng)絡(luò)并以對(duì)數(shù)Mel聲譜圖作為輸入特征,在所構(gòu)建的兩個(gè)子數(shù)據(jù)集中實(shí)現(xiàn)了超過97%的分類準(zhǔn)確率,說明所構(gòu)建的模型能較好地學(xué)習(xí)到每種樂器的特征.此外,當(dāng)以較短片段數(shù)據(jù)集訓(xùn)練的模型來對(duì)較長片段的數(shù)據(jù)集進(jìn)行分類時(shí),準(zhǔn)確率依然高達(dá)92.70%,說明模型具有較好的泛化能力.

【文章頁數(shù)】:6 頁

【部分圖文】:

圖1曲笛和侗笛的MFCC特征

圖1曲笛和侗笛的MFCC特征

我們比較了被作為音頻特征廣泛地使用的Mel頻率倒譜系數(shù)(MelFrequencyCepstralCoefficients,MFCC)[3]和常數(shù)Q變換(ConstantQTransform,CQT)[4].圖1展示了曲笛和侗笛的MFCC特征,圖1(a),(b)來自曲笛的....


圖2曲笛和侗笛的CQT特征

圖2曲笛和侗笛的CQT特征

圖1曲笛和侗笛的MFCC特征大數(shù)據(jù)時(shí)代機(jī)器算力的提升使得深度學(xué)習(xí)得以蓬勃發(fā)展,而深度神經(jīng)網(wǎng)絡(luò)可以自動(dòng)地從數(shù)據(jù)中學(xué)習(xí)到特征,從而減少人本身在特征工程中所做的工作.伴隨著深度學(xué)習(xí)的廣泛使用,當(dāng)使用神經(jīng)網(wǎng)絡(luò)作為分類器時(shí),對(duì)數(shù)Mel聲譜圖[5]被普遍采用.從提取過程上來講,提取對(duì)數(shù)Me....


圖3特征提取的過程

圖3特征提取的過程

特征提取的整個(gè)過程如圖3所示.首先,采樣率為44.1kHz的單聲道音頻在使用漢寧窗分窗后被分成一系列的幀,在這個(gè)過程中使用了1024個(gè)采樣點(diǎn)作為跳距,2048個(gè)采樣點(diǎn)作為窗距.之后,快速傅里葉變換在每一幀上得到了使用,這樣就得到了聲譜圖.接下來,64個(gè)Mel濾波器組被用來對(duì)得....


圖4VGGish的網(wǎng)絡(luò)結(jié)構(gòu)

圖4VGGish的網(wǎng)絡(luò)結(jié)構(gòu)

VGGish的網(wǎng)絡(luò)結(jié)構(gòu)如圖4所示,它由8個(gè)卷積層和1個(gè)全連接層組成,使用對(duì)數(shù)Mel聲譜圖作為輸入特征.每個(gè)卷積層的通道數(shù)都在圖4中進(jìn)行了標(biāo)注,卷積層的卷積核的大小為3×3,步長為1,每次卷積操作前會(huì)對(duì)圖像進(jìn)行大小為1的邊緣像素填充,批量歸一化(BatchNormalizatio....



本文編號(hào):3915140

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/wenyilunwen/yinlelunwen/3915140.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶61c54***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com