融合聲紋信息的能量譜圖在鳥類識別中的研究
發(fā)布時間:2023-04-05 10:21
常用的梅爾倒譜系數(shù)結(jié)合高斯混合模型(MFCC+GMM)方法的鳥鳴聲識別技術(shù)難適應(yīng)噪聲環(huán)境,模型難以收斂,且計算復(fù)雜度高。該文提出一種融合聲紋信息的能量譜圖的鳥類識別方法 (VPS-BR),該方法利用鳥類鳴聲在能量譜圖上所表現(xiàn)的多維差異性,定量識別鳴聲聲紋特征。通過對分貝能量進行顏色映射得到能量譜圖,提取其視覺特征所表達的聲學特征,分析歸納得到鳥類特有鳴聲模式。在特征提取步驟中,選用識別速度快的局部二值模式、識別魯棒性高的方向梯度直方圖兩個參數(shù)表征鳥鳴聲譜圖的邊緣聲紋;在識別步驟中,用局部二值模式和方向梯度直方圖兩種特征分別與支持向量機、K最近鄰和隨機森林3種分類器算法進行兩兩組合構(gòu)建識別模型測試。對15種原始帶噪鳥類鳴聲數(shù)據(jù)集進行交叉驗證,VPS-BR模型的平均識別率比MFCC+GMM組合模型高出11.3%,方向梯度直方圖特征與K最近鄰分類器的組合模型識別率達90.5%,表現(xiàn)出較好的抗噪性能和識別性能。最后針對樣本數(shù)據(jù)集缺乏問題,使用生成對抗網(wǎng)絡(luò)進行圖像增強,進一步將識別率提升1.48%。
【文章頁數(shù)】:11 頁
【文章目錄】:
0 引言
1 基本原理與模型
1.1 識別原理
1.2 MBCS-LBP特征提取
1.3 HOG特征提取
2 實驗結(jié)果分析與討論
2.1 樣本選取
2.2 特征分析
2.3 識別率與識別時間
3 生成式對抗網(wǎng)絡(luò)進行數(shù)據(jù)增強
3.1 圖譜數(shù)據(jù)生成
3.2 實驗驗證
4 結(jié)論
本文編號:3783241
【文章頁數(shù)】:11 頁
【文章目錄】:
0 引言
1 基本原理與模型
1.1 識別原理
1.2 MBCS-LBP特征提取
1.3 HOG特征提取
2 實驗結(jié)果分析與討論
2.1 樣本選取
2.2 特征分析
2.3 識別率與識別時間
3 生成式對抗網(wǎng)絡(luò)進行數(shù)據(jù)增強
3.1 圖譜數(shù)據(jù)生成
3.2 實驗驗證
4 結(jié)論
本文編號:3783241
本文鏈接:http://sikaile.net/kejilunwen/xinxigongchenglunwen/3783241.html
最近更新
教材專著