基于單音的西洋樂器音色識別方法研究
發(fā)布時間:2023-10-12 02:55
作為音樂信息檢索領(lǐng)域內(nèi)的重要分支,樂器識別的關(guān)鍵在于音色信息的提取;跇菲饕羯纬蓹C制,樂器音色的穩(wěn)定成分主要表現(xiàn)為樂音不同頻率成份的時間演變。傳統(tǒng)上,音色信息的表達是通過人工設(shè)計的音色特征,因此樂器音色主要表現(xiàn)為音色特征時間序列的演變。本文的研究工作側(cè)重于西洋樂器單音的音色識別。首先,本文將經(jīng)過特征選擇與降維的音色特征組合,按多種方式作為淺層分類器的輸入來實現(xiàn)樂器音色識別。其中,高斯混合模型與通用背景模型將樂器音色信息建模成概率分布,隱馬爾可夫模型將樂器音色信息建模成隱狀態(tài)概率分布與轉(zhuǎn)移概率。無論哪一種分類器,基于信息增益(Information Gain,IG)原則的特征選擇方法都表現(xiàn)出相對優(yōu)越的性能。通用背景模型優(yōu)于其他兩類分類器,取得了 92.3%的整體準確率。另外,本文將音色特征時間序列的時間整合作為支持向量機的輸入來實現(xiàn)樂器音色識別。對于不同的音色特征,時間整合的組合特征,即統(tǒng)計量與多變量自回歸的組合特征(Combination of Multivariate Auto Regression,CMAR),相對于單純的多變量自回歸的特征(Multivariate Auto ...
【文章頁數(shù)】:91 頁
【學位級別】:碩士
【文章目錄】:
摘要
ABSTRACT
符號說明
第1章 緒論
1.1 研究背景與意義
1.2 課題研究現(xiàn)狀及發(fā)展趨勢
1.2.1 音色特征的現(xiàn)狀與發(fā)展
1.2.2 識別算法的現(xiàn)狀與發(fā)展
1.3 論文主要工作與組織結(jié)構(gòu)
第2章 音色描述與評價方法
2.1 樂器音色的形成機制
2.1.1 樂器分類
2.1.2 樂器的聲學模型
2.2 音色特征
2.2.1 時域特征
2.2.2 頻域特征
2.2.3 倒頻域特征
2.3 評價方法
2.3.1 樂器測度
2.3.2 整體測度
2.3.3 可視化方法
2.4 交叉驗證
2.5 實驗數(shù)據(jù)庫
2.6 本章小結(jié)
第3章 基于淺層分類器的樂器音色識別
3.1 樂器音色識別框架
3.2 淺層分類器簡介
3.2.1 高斯混合模型
3.2.2 通用背景模型
3.2.3 隱馬爾可夫模型
3.2.4 支持向量機
3.3 基于音色特征時間序列的樂器音色識別
3.3.1 音色特征集介紹
3.3.2 特征選擇與降維
3.3.3 淺層分類器配置
3.3.4 樂器音色識別結(jié)果分析
3.4 基于音色特征時間整合的樂器音色識別
3.4.1 音色特征時間整合
3.4.2 淺層分類器配置
3.4.3 樂器音色識別結(jié)果分析
3.5 本章小結(jié)
第4章 基于深度學習的樂器音色識別
4.1 深度學習簡介
4.1.1 卷積神經(jīng)網(wǎng)絡(luò)
4.1.2 深度神經(jīng)網(wǎng)絡(luò)
4.1.3 深度卷積自編碼器
4.2 基于CNN的樂器音色識別
4.2.1 卷積神經(jīng)網(wǎng)絡(luò)配置
4.2.2 樂器音色識別結(jié)果分析
4.3 基于DNN的樂器音色識別
4.3.1 深度神經(jīng)網(wǎng)絡(luò)配置
4.3.2 樂器音色識別結(jié)果分析
4.4 基于DCAE的自動音色特征提取
4.4.1 反池化
4.4.2 解卷積
4.4.3 訓練策略
4.4.4 深度卷積自編碼器配置
4.4.5 DCAE音色特征的評價與分析
4.5 本章小結(jié)
第5章 總結(jié)與展望
5.1 總結(jié)
5.2 展望
附錄
參考文獻
致謝
攻讀學位期間發(fā)表學術(shù)論文
學位論文評閱及答辯情況表
本文編號:3853312
【文章頁數(shù)】:91 頁
【學位級別】:碩士
【文章目錄】:
摘要
ABSTRACT
符號說明
第1章 緒論
1.1 研究背景與意義
1.2 課題研究現(xiàn)狀及發(fā)展趨勢
1.2.1 音色特征的現(xiàn)狀與發(fā)展
1.2.2 識別算法的現(xiàn)狀與發(fā)展
1.3 論文主要工作與組織結(jié)構(gòu)
第2章 音色描述與評價方法
2.1 樂器音色的形成機制
2.1.1 樂器分類
2.1.2 樂器的聲學模型
2.2 音色特征
2.2.1 時域特征
2.2.2 頻域特征
2.2.3 倒頻域特征
2.3 評價方法
2.3.1 樂器測度
2.3.2 整體測度
2.3.3 可視化方法
2.4 交叉驗證
2.5 實驗數(shù)據(jù)庫
2.6 本章小結(jié)
第3章 基于淺層分類器的樂器音色識別
3.1 樂器音色識別框架
3.2 淺層分類器簡介
3.2.1 高斯混合模型
3.2.2 通用背景模型
3.2.3 隱馬爾可夫模型
3.2.4 支持向量機
3.3 基于音色特征時間序列的樂器音色識別
3.3.1 音色特征集介紹
3.3.2 特征選擇與降維
3.3.3 淺層分類器配置
3.3.4 樂器音色識別結(jié)果分析
3.4 基于音色特征時間整合的樂器音色識別
3.4.1 音色特征時間整合
3.4.2 淺層分類器配置
3.4.3 樂器音色識別結(jié)果分析
3.5 本章小結(jié)
第4章 基于深度學習的樂器音色識別
4.1 深度學習簡介
4.1.1 卷積神經(jīng)網(wǎng)絡(luò)
4.1.2 深度神經(jīng)網(wǎng)絡(luò)
4.1.3 深度卷積自編碼器
4.2 基于CNN的樂器音色識別
4.2.1 卷積神經(jīng)網(wǎng)絡(luò)配置
4.2.2 樂器音色識別結(jié)果分析
4.3 基于DNN的樂器音色識別
4.3.1 深度神經(jīng)網(wǎng)絡(luò)配置
4.3.2 樂器音色識別結(jié)果分析
4.4 基于DCAE的自動音色特征提取
4.4.1 反池化
4.4.2 解卷積
4.4.3 訓練策略
4.4.4 深度卷積自編碼器配置
4.4.5 DCAE音色特征的評價與分析
4.5 本章小結(jié)
第5章 總結(jié)與展望
5.1 總結(jié)
5.2 展望
附錄
參考文獻
致謝
攻讀學位期間發(fā)表學術(shù)論文
學位論文評閱及答辯情況表
本文編號:3853312
本文鏈接:http://sikaile.net/kejilunwen/wltx/3853312.html
最近更新
教材專著