環(huán)境輔助的多任務(wù)混合聲音事件檢測(cè)方法
發(fā)布時(shí)間:2021-04-29 05:02
在混合聲音事件檢測(cè)任務(wù)中,不同事件的聲音信號(hào)相互混雜,從混合語(yǔ)音信號(hào)中提取的全局特征無(wú)法很好地表達(dá)每種單獨(dú)的事件,導(dǎo)致當(dāng)聲音事件數(shù)量增加或者環(huán)境變化時(shí),聲音事件檢測(cè)性能急劇下降。目前已存在的方法尚未考慮環(huán)境變化對(duì)檢測(cè)性能的影響。鑒于此,文中提出了一種基于多任務(wù)學(xué)習(xí)的環(huán)境輔助的聲音事件檢測(cè)模型(Environment-Assisted Multi-Task,EAMT),該模型主要包含場(chǎng)景分類器和事件檢測(cè)器兩大核心部分,其中場(chǎng)景分類器用于學(xué)習(xí)環(huán)境上下文特征,該特征作為事件檢測(cè)的額外信息與聲音事件特征融合,并通過(guò)多任務(wù)學(xué)習(xí)方式來(lái)輔助聲音事件檢測(cè),以此提高模型對(duì)環(huán)境變化的魯棒性及多目標(biāo)事件檢測(cè)的性能;诼曇羰录䴔z測(cè)領(lǐng)域的主流公開(kāi)數(shù)據(jù)集Freesound以及通用性能評(píng)估指標(biāo)F1分?jǐn)?shù),將所提模型與基準(zhǔn)模型(Deep Neural Network,DNN)及主流模型(Convolutional Recurrent Neural Network,CRNN)進(jìn)行對(duì)比,共設(shè)置了3組對(duì)比實(shí)驗(yàn)。實(shí)驗(yàn)結(jié)果表明:1)相比單一任務(wù)的模型,基于多任務(wù)學(xué)習(xí)的EAMT模型的場(chǎng)景分類效果和事件檢測(cè)性能均有所提升,且環(huán)境上...
【文章來(lái)源】:計(jì)算機(jī)科學(xué). 2020,47(01)北大核心CSCD
【文章頁(yè)數(shù)】:6 頁(yè)
【文章目錄】:
1 引言
2 環(huán)境輔助的混合聲音事件檢測(cè)
2.1 EAMT模型結(jié)構(gòu)
2.1.1 輸入層
2.1.2 硬共享層
2.1.3 場(chǎng)景分類器
2.1.4 聲音事件檢測(cè)器
2.2 多任務(wù)學(xué)習(xí)方法
3 實(shí)驗(yàn)
3.1 數(shù)據(jù)集
1)Freesound-env:
2)Freesound-6:
3)Freesound-9:
4)Freesound-12:
3.2 實(shí)驗(yàn)設(shè)置
3.3 性能評(píng)估
1)不同的多任務(wù)學(xué)習(xí)結(jié)構(gòu)對(duì)F1分?jǐn)?shù)的影響。
2)環(huán)境變化對(duì)聲音事件檢測(cè)F1的影響。
3)聲音事件數(shù)量對(duì)聲音事件檢測(cè)F1的影響。
本文編號(hào):3166892
【文章來(lái)源】:計(jì)算機(jī)科學(xué). 2020,47(01)北大核心CSCD
【文章頁(yè)數(shù)】:6 頁(yè)
【文章目錄】:
1 引言
2 環(huán)境輔助的混合聲音事件檢測(cè)
2.1 EAMT模型結(jié)構(gòu)
2.1.1 輸入層
2.1.2 硬共享層
2.1.3 場(chǎng)景分類器
2.1.4 聲音事件檢測(cè)器
2.2 多任務(wù)學(xué)習(xí)方法
3 實(shí)驗(yàn)
3.1 數(shù)據(jù)集
1)Freesound-env:
2)Freesound-6:
3)Freesound-9:
4)Freesound-12:
3.2 實(shí)驗(yàn)設(shè)置
3.3 性能評(píng)估
1)不同的多任務(wù)學(xué)習(xí)結(jié)構(gòu)對(duì)F1分?jǐn)?shù)的影響。
2)環(huán)境變化對(duì)聲音事件檢測(cè)F1的影響。
3)聲音事件數(shù)量對(duì)聲音事件檢測(cè)F1的影響。
本文編號(hào):3166892
本文鏈接:http://sikaile.net/kejilunwen/wltx/3166892.html
最近更新
教材專著