基于遞歸圖的樂器識(shí)別算法
發(fā)布時(shí)間:2021-12-30 01:24
針對(duì)樂器分類問題,基于非線性動(dòng)力學(xué)概念,將不同樂器產(chǎn)生的音頻時(shí)間序列利用遞歸圖方法進(jìn)行處理,每組音頻時(shí)間序列對(duì)應(yīng)得到一張遞歸圖。提取每張遞歸圖的稠密比例不變特征變換(SIFT)特征,通過視覺詞袋模型法將高維度的SIFT特征降維,得到每張遞歸圖的視覺單詞頻率直方圖向量作為特征輸入線性支持向量機(jī),采用支持向量機(jī)(SVM)算法中的"一對(duì)多法"實(shí)現(xiàn)多分類。實(shí)驗(yàn)表明,該方法識(shí)別準(zhǔn)確率高于遞歸圖密度比特征法,且比基于梅爾頻率倒譜系數(shù)方法高出3%~4%。為樂器識(shí)別提供新思路。
【文章來源】:傳感器與微系統(tǒng). 2020,39(11)CSCD
【文章頁數(shù)】:4 頁
【部分圖文】:
樂器識(shí)別系統(tǒng)框圖
視覺詞袋模型算法流程框圖
為了讓SIFT特征映射到詞典中,需使所有SIFT特征矩陣大小一致,并且所提特征能更好地表征遞歸圖信息,因此本文提取的是稠密SIFT特征。稠密SIFT特征與SIFT特征不同的是不需要鎖定關(guān)鍵點(diǎn)以及關(guān)鍵點(diǎn)方向,直接把所有SIFT特征點(diǎn)生成特征點(diǎn)描述子[9]。本文在提取稠密SIFT特征點(diǎn)時(shí)設(shè)置網(wǎng)格間距為2個(gè)像素。由于SIFT特征是高維度特征,為減少計(jì)算量,利用詞袋模型降維。其中詞典由文獻(xiàn)[10]提供。詞袋體現(xiàn)的是SIFT空間順序信息,若將詞袋細(xì)分還可以獲取空間信息以及局部特征,在本文中,將詞袋劃分為2×2=4份,再獨(dú)立計(jì)算每1份的頻率直方圖向量,最后將這4份頻率直方圖向量依次拼接得到一個(gè)大的頻率直方圖向量,此向量就是送入機(jī)器學(xué)習(xí)中的特征向量。3.3 SVM分類
【參考文獻(xiàn)】:
期刊論文
[1]基于SIFT特征的鐵路扣件狀態(tài)檢測(cè)算法[J]. 趙珊珊,何寧,曹珊. 傳感器與微系統(tǒng). 2018(11)
[2]基于SVM一對(duì)一多分類算法的二次細(xì)分法研究[J]. 陳中杰,蔣剛,蔡勇. 傳感器與微系統(tǒng). 2013(04)
[3]基于非線性動(dòng)力學(xué)的樂器分類方法[J]. 芮瑞,鮑長春. 電子學(xué)報(bào). 2012(07)
碩士論文
[1]基于單音的西洋樂器音色識(shí)別方法研究[D]. 后方帥.山東大學(xué) 2018
[2]基于聲學(xué)特征的幾種典型樂器識(shí)別研究[D]. 任田麗.東北林業(yè)大學(xué) 2018
[3]基于視覺詞袋模型的圖像分類研究[D]. 朱道廣.解放軍信息工程大學(xué) 2013
本文編號(hào):3557203
【文章來源】:傳感器與微系統(tǒng). 2020,39(11)CSCD
【文章頁數(shù)】:4 頁
【部分圖文】:
樂器識(shí)別系統(tǒng)框圖
視覺詞袋模型算法流程框圖
為了讓SIFT特征映射到詞典中,需使所有SIFT特征矩陣大小一致,并且所提特征能更好地表征遞歸圖信息,因此本文提取的是稠密SIFT特征。稠密SIFT特征與SIFT特征不同的是不需要鎖定關(guān)鍵點(diǎn)以及關(guān)鍵點(diǎn)方向,直接把所有SIFT特征點(diǎn)生成特征點(diǎn)描述子[9]。本文在提取稠密SIFT特征點(diǎn)時(shí)設(shè)置網(wǎng)格間距為2個(gè)像素。由于SIFT特征是高維度特征,為減少計(jì)算量,利用詞袋模型降維。其中詞典由文獻(xiàn)[10]提供。詞袋體現(xiàn)的是SIFT空間順序信息,若將詞袋細(xì)分還可以獲取空間信息以及局部特征,在本文中,將詞袋劃分為2×2=4份,再獨(dú)立計(jì)算每1份的頻率直方圖向量,最后將這4份頻率直方圖向量依次拼接得到一個(gè)大的頻率直方圖向量,此向量就是送入機(jī)器學(xué)習(xí)中的特征向量。3.3 SVM分類
【參考文獻(xiàn)】:
期刊論文
[1]基于SIFT特征的鐵路扣件狀態(tài)檢測(cè)算法[J]. 趙珊珊,何寧,曹珊. 傳感器與微系統(tǒng). 2018(11)
[2]基于SVM一對(duì)一多分類算法的二次細(xì)分法研究[J]. 陳中杰,蔣剛,蔡勇. 傳感器與微系統(tǒng). 2013(04)
[3]基于非線性動(dòng)力學(xué)的樂器分類方法[J]. 芮瑞,鮑長春. 電子學(xué)報(bào). 2012(07)
碩士論文
[1]基于單音的西洋樂器音色識(shí)別方法研究[D]. 后方帥.山東大學(xué) 2018
[2]基于聲學(xué)特征的幾種典型樂器識(shí)別研究[D]. 任田麗.東北林業(yè)大學(xué) 2018
[3]基于視覺詞袋模型的圖像分類研究[D]. 朱道廣.解放軍信息工程大學(xué) 2013
本文編號(hào):3557203
本文鏈接:http://sikaile.net/kejilunwen/xinxigongchenglunwen/3557203.html
最近更新
教材專著