基于稀疏表示和深度神經(jīng)網(wǎng)絡(luò)模型的西洋樂器自動(dòng)分類方法
本文選題:字典庫(kù) 切入點(diǎn):稀疏重構(gòu) 出處:《南京理工大學(xué)》2017年碩士論文 論文類型:學(xué)位論文
【摘要】:隨著現(xiàn)代社會(huì)科技的快速發(fā)展,數(shù)字音樂的數(shù)量也以海量的方式增長(zhǎng),為了方便用戶音樂檢索,對(duì)音樂進(jìn)行有效合理的分類十分重要。但音樂基數(shù)多,每天新的單曲數(shù)又不斷增加,采取人工的方式對(duì)音樂進(jìn)行分類不切實(shí)際。因此,本文采用深度神經(jīng)網(wǎng)絡(luò)模型對(duì)音樂提取特征實(shí)現(xiàn)自動(dòng)分類。與此同時(shí),由于音樂信號(hào)具備稀疏性的特點(diǎn),本文創(chuàng)新型地提出將稀疏特征與深度神經(jīng)網(wǎng)絡(luò)模型相結(jié)合的方法,實(shí)現(xiàn)音樂信號(hào)的自動(dòng)分類。音樂信號(hào)分類標(biāo)準(zhǔn)眾多,本文旨在將提出的新方法應(yīng)用在西洋樂器的自動(dòng)分類上。本文首先介紹了音樂信號(hào)的常見特征,包括基本的物理學(xué)特征和人耳感知的心理學(xué)角度的特征,與此同時(shí)還介紹了人耳聽覺系統(tǒng)的特性。接著介紹了音樂自動(dòng)分類的理論,包含對(duì)音樂的特征提取,并著重介紹了本文所采用的深度神經(jīng)網(wǎng)絡(luò)模型方面的相關(guān)概念。然后研究了音樂信號(hào)的稀疏特征提取過程,創(chuàng)新性地引入新型的稀疏表示字典庫(kù),該字典庫(kù)是基于不同樂器發(fā)出音色頻率間的差異。本文通過MATLAB仿真實(shí)驗(yàn),對(duì)比了基于傳統(tǒng)字典庫(kù)和基于本文構(gòu)建字典庫(kù)下的稀疏重構(gòu)結(jié)果,證明了基于本文構(gòu)建字典庫(kù)下進(jìn)行稀疏重構(gòu)效果優(yōu)于傳統(tǒng)字典庫(kù)。最后本文研究了基于稀疏表示和深度神經(jīng)網(wǎng)絡(luò)模型結(jié)合的西洋樂器自動(dòng)分類情況,傳統(tǒng)的深度神經(jīng)網(wǎng)絡(luò)模型輸入端為音頻信號(hào)的梅爾頻率倒譜系數(shù)(Mel Frequency Cepstrum Coefficient,MFCC),本文創(chuàng)新性地使用音頻信號(hào)的稀疏特征作為深度神經(jīng)網(wǎng)絡(luò)模型輸入端,在此基礎(chǔ)上訓(xùn)練深度神經(jīng)網(wǎng)絡(luò)模型參數(shù),實(shí)現(xiàn)西洋樂器的自動(dòng)分類。本文采用Python腳本語言,通過實(shí)驗(yàn)證明了基于稀疏特征和深度神經(jīng)網(wǎng)絡(luò)模型相結(jié)合的方法,實(shí)現(xiàn)西洋樂器自動(dòng)分類,準(zhǔn)確率可達(dá)82%。
[Abstract]:With the rapid development of modern social science and technology, the number of digital music is also increasing in a massive way. In order to facilitate users' music retrieval, it is very important to classify music effectively and reasonably. The number of new single songs is increasing every day, so it is impractical to classify music manually. Therefore, the depth neural network model is used to realize the automatic classification of music features in this paper. Due to the sparsity of music signals, this paper proposes an innovative method to combine sparse features with depth neural network model to realize the automatic classification of music signals. The purpose of this paper is to apply the proposed new method to the automatic classification of western musical instruments. This paper first introduces the common features of musical signals, including the basic physical features and the psychological features of human ear perception. At the same time, it also introduces the characteristics of human ear and hearing system, and then introduces the theory of automatic music classification, including the feature extraction of music. Then the sparse feature extraction process of music signal is studied, and a new sparse representation dictionary is introduced. The dictionary is based on the difference of timbre frequency between different musical instruments. This paper compares the sparse reconstruction results based on the traditional dictionary library and the dictionary database based on this paper through MATLAB simulation experiments. It is proved that the effect of sparse reconstruction based on this paper is better than that of traditional dictionary library. Finally, the paper studies the automatic classification of western musical instruments based on sparse representation and depth neural network model. The traditional depth neural network model input end is Mel Frequency Cepstrum efficient Mel frequency cepstrum. In this paper, the sparse feature of audio signal is innovatively used as the input of depth neural network model. On this basis, the parameters of the deep neural network model are trained to realize the automatic classification of western musical instruments. In this paper, the method based on sparse feature and depth neural network model is proved by using Python script language. The automatic classification of western musical instruments is realized, and the accuracy rate is up to 82.
【學(xué)位授予單位】:南京理工大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2017
【分類號(hào)】:TP183;TN912.3
【相似文獻(xiàn)】
相關(guān)期刊論文 前10條
1 李映;張艷寧;許星;;基于信號(hào)稀疏表示的形態(tài)成分分析:進(jìn)展和展望[J];電子學(xué)報(bào);2009年01期
2 趙瑞珍;王飛;羅阿理;張彥霞;;基于稀疏表示的譜線自動(dòng)提取方法[J];光譜學(xué)與光譜分析;2009年07期
3 楊蜀秦;寧紀(jì)鋒;何東健;;基于稀疏表示的大米品種識(shí)別[J];農(nóng)業(yè)工程學(xué)報(bào);2011年03期
4 史加榮;楊威;魏宗田;;基于非負(fù)稀疏表示的人臉識(shí)別[J];計(jì)算機(jī)工程與設(shè)計(jì);2012年05期
5 高志榮;熊承義;笪邦友;;改進(jìn)的基于殘差加權(quán)的稀疏表示人臉識(shí)別[J];中南民族大學(xué)學(xué)報(bào)(自然科學(xué)版);2012年03期
6 朱杰;楊萬扣;唐振民;;基于字典學(xué)習(xí)的核稀疏表示人臉識(shí)別方法[J];模式識(shí)別與人工智能;2012年05期
7 耿耀君;張軍英;袁細(xì)國(guó);;一種基于稀疏表示系數(shù)的特征相關(guān)性測(cè)度[J];模式識(shí)別與人工智能;2013年01期
8 張疆勤;廖海斌;李原;;基于因子分析與稀疏表示的多姿態(tài)人臉識(shí)別[J];計(jì)算機(jī)工程與應(yīng)用;2013年05期
9 李正周;王會(huì)改;劉梅;丁浩;金鋼;;基于形態(tài)成分稀疏表示的紅外小弱目標(biāo)檢測(cè)[J];彈箭與制導(dǎo)學(xué)報(bào);2013年04期
10 胡正平;趙淑歡;李靜;;基于塊稀疏遞推殘差分析的稀疏表示遮擋魯棒識(shí)別算法研究[J];模式識(shí)別與人工智能;2014年01期
相關(guān)會(huì)議論文 前3條
1 何愛香;劉玉春;魏廣芬;;基于稀疏表示的煤矸界面識(shí)別研究[A];虛擬運(yùn)營(yíng)與云計(jì)算——第十八屆全國(guó)青年通信學(xué)術(shù)年會(huì)論文集(上冊(cè))[C];2013年
2 樊亞翔;孫浩;周石琳;鄒煥新;;基于元樣本稀疏表示的多視角目標(biāo)識(shí)別[A];2013年中國(guó)智能自動(dòng)化學(xué)術(shù)會(huì)議論文集(第五分冊(cè))[C];2013年
3 葛鳳翔;任歲玲;郭鑫;郭良浩;孫波;;微弱信號(hào)處理及其研究進(jìn)展[A];中國(guó)聲學(xué)學(xué)會(huì)水聲學(xué)分會(huì)2013年全國(guó)水聲學(xué)學(xué)術(shù)會(huì)議論文集[C];2013年
相關(guān)博士學(xué)位論文 前10條
1 李進(jìn)明;基于稀疏表示的圖像超分辨率重建方法研究[D];重慶大學(xué);2015年
2 王亞寧;基于信號(hào)稀疏表示的電機(jī)故障診斷研究[D];河北工業(yè)大學(xué);2014年
3 姚明海;視頻異常事件檢測(cè)與認(rèn)證方法研究[D];東北師范大學(xué);2015年
4 黃國(guó)華;蛋白質(zhì)翻譯后修飾位點(diǎn)與藥物適應(yīng)癥預(yù)測(cè)方法研究[D];上海大學(xué);2015年
5 王瑾;基于稀疏表示的數(shù)據(jù)收集、復(fù)原與壓縮研究[D];北京工業(yè)大學(xué);2015年
6 王文卿;基于融合框架與稀疏表示的遙感影像銳化[D];西安電子科技大學(xué);2015年
7 解虎;高維小樣本陣列自適應(yīng)信號(hào)處理方法研究[D];西安電子科技大學(xué);2015年
8 秦振濤;基于稀疏表示及字典學(xué)習(xí)遙感圖像處理關(guān)鍵技術(shù)研究[D];成都理工大學(xué);2015年
9 薛明;基于稀疏表示的在線目標(biāo)跟蹤研究[D];上海交通大學(xué);2014年
10 孫樂;空譜聯(lián)合先驗(yàn)的高光譜圖像解混與分類方法[D];南京理工大學(xué);2014年
相關(guān)碩士學(xué)位論文 前10條
1 王道文;基于稀疏表示的目標(biāo)跟蹤算法研究[D];華南理工大學(xué);2015年
2 李哲;基于稀疏表示和LS-SVM的心電信號(hào)分類[D];河北大學(xué);2015年
3 孫雪青;Shearlet變換和稀疏表示相結(jié)合的甲狀腺結(jié)節(jié)圖像融合[D];河北大學(xué);2015年
4 吳麗璇;基于稀疏表示的微聚焦X射線圖像去噪方法[D];華南理工大學(xué);2015年
5 趙孝磊;基于圖像分塊稀疏表示的人臉識(shí)別算法研究[D];南京信息工程大學(xué);2015年
6 黃志明;基于辨別式稀疏字典學(xué)習(xí)的視覺追蹤算法研究[D];華南理工大學(xué);2015年
7 張鈴華;非約束環(huán)境下的稀疏表示人臉識(shí)別算法研究[D];南京信息工程大學(xué);2015年
8 賀妍斐;基于稀疏表示與自適應(yīng)倒易晶胞的遙感圖像復(fù)原方法研究[D];南京信息工程大學(xué);2015年
9 楊爍;電能質(zhì)量擾動(dòng)信號(hào)的稀疏表示/壓縮采樣研究[D];西南交通大學(xué);2015年
10 應(yīng)艷麗;基于低秩稀疏表示的目標(biāo)跟蹤算法研究[D];西南交通大學(xué);2015年
,本文編號(hào):1613321
本文鏈接:http://sikaile.net/kejilunwen/xinxigongchenglunwen/1613321.html