融合聲紋信息的能量譜圖在鳥(niǎo)類識(shí)別中的研究
發(fā)布時(shí)間:2023-04-05 10:21
常用的梅爾倒譜系數(shù)結(jié)合高斯混合模型(MFCC+GMM)方法的鳥(niǎo)鳴聲識(shí)別技術(shù)難適應(yīng)噪聲環(huán)境,模型難以收斂,且計(jì)算復(fù)雜度高。該文提出一種融合聲紋信息的能量譜圖的鳥(niǎo)類識(shí)別方法 (VPS-BR),該方法利用鳥(niǎo)類鳴聲在能量譜圖上所表現(xiàn)的多維差異性,定量識(shí)別鳴聲聲紋特征。通過(guò)對(duì)分貝能量進(jìn)行顏色映射得到能量譜圖,提取其視覺(jué)特征所表達(dá)的聲學(xué)特征,分析歸納得到鳥(niǎo)類特有鳴聲模式。在特征提取步驟中,選用識(shí)別速度快的局部二值模式、識(shí)別魯棒性高的方向梯度直方圖兩個(gè)參數(shù)表征鳥(niǎo)鳴聲譜圖的邊緣聲紋;在識(shí)別步驟中,用局部二值模式和方向梯度直方圖兩種特征分別與支持向量機(jī)、K最近鄰和隨機(jī)森林3種分類器算法進(jìn)行兩兩組合構(gòu)建識(shí)別模型測(cè)試。對(duì)15種原始帶噪鳥(niǎo)類鳴聲數(shù)據(jù)集進(jìn)行交叉驗(yàn)證,VPS-BR模型的平均識(shí)別率比MFCC+GMM組合模型高出11.3%,方向梯度直方圖特征與K最近鄰分類器的組合模型識(shí)別率達(dá)90.5%,表現(xiàn)出較好的抗噪性能和識(shí)別性能。最后針對(duì)樣本數(shù)據(jù)集缺乏問(wèn)題,使用生成對(duì)抗網(wǎng)絡(luò)進(jìn)行圖像增強(qiáng),進(jìn)一步將識(shí)別率提升1.48%。
【文章頁(yè)數(shù)】:11 頁(yè)
【文章目錄】:
0 引言
1 基本原理與模型
1.1 識(shí)別原理
1.2 MBCS-LBP特征提取
1.3 HOG特征提取
2 實(shí)驗(yàn)結(jié)果分析與討論
2.1 樣本選取
2.2 特征分析
2.3 識(shí)別率與識(shí)別時(shí)間
3 生成式對(duì)抗網(wǎng)絡(luò)進(jìn)行數(shù)據(jù)增強(qiáng)
3.1 圖譜數(shù)據(jù)生成
3.2 實(shí)驗(yàn)驗(yàn)證
4 結(jié)論
本文編號(hào):3783241
【文章頁(yè)數(shù)】:11 頁(yè)
【文章目錄】:
0 引言
1 基本原理與模型
1.1 識(shí)別原理
1.2 MBCS-LBP特征提取
1.3 HOG特征提取
2 實(shí)驗(yàn)結(jié)果分析與討論
2.1 樣本選取
2.2 特征分析
2.3 識(shí)別率與識(shí)別時(shí)間
3 生成式對(duì)抗網(wǎng)絡(luò)進(jìn)行數(shù)據(jù)增強(qiáng)
3.1 圖譜數(shù)據(jù)生成
3.2 實(shí)驗(yàn)驗(yàn)證
4 結(jié)論
本文編號(hào):3783241
本文鏈接:http://sikaile.net/kejilunwen/xinxigongchenglunwen/3783241.html
最近更新
教材專著