基于多特征融合的SVM聲學(xué)場景分類算法研究
發(fā)布時(shí)間:2021-06-25 01:34
針對(duì)DCASE2017挑戰(zhàn)賽的聲場環(huán)境數(shù)據(jù)集,提取梅爾頻率倒譜系數(shù)(MFCC)、短時(shí)能量(SE)、聲學(xué)事件似然特征(AELF)、靜音時(shí)間(MT)特征,組成多特征融合矩陣,通過對(duì)比多種核函數(shù)和尋優(yōu)算法,最終選取高斯徑向基核函數(shù)(RK)建立支持向量機(jī)(SVM)模型,采用交叉驗(yàn)證(CV)方法進(jìn)行SVM參數(shù)尋優(yōu),對(duì)15種聲學(xué)場景進(jìn)行分類.實(shí)驗(yàn)結(jié)果表明,雜貨店、辦公室的分類準(zhǔn)確性達(dá)到了90%以上,平均分類準(zhǔn)確性達(dá)到71.11%,遠(yuǎn)高于挑戰(zhàn)賽的基線系統(tǒng)61%的平均分類準(zhǔn)確性.
【文章來源】:北京理工大學(xué)學(xué)報(bào). 2020,40(01)北大核心EICSCD
【文章頁數(shù)】:7 頁
【部分圖文】:
MFCC提取流程圖
由于聲學(xué)事件音頻信號(hào)樣點(diǎn)之間存在相關(guān)性,因此一個(gè)采樣值可利用若干個(gè)過去的聲學(xué)事件音頻采樣值的線性組合來逼近,得到一組唯一的預(yù)測系數(shù),即線性預(yù)測系數(shù)(LPC). 為了提高特征參數(shù)的穩(wěn)定性,本文對(duì)聲學(xué)事件音頻信號(hào)求倒譜,用線性預(yù)測倒譜系數(shù)(LPCC)提取聲學(xué)事件特征.1.4 靜音時(shí)間(mute time,MT)
本文所用訓(xùn)練和測試集來自于IEEE音頻與聲學(xué)協(xié)會(huì)舉辦的DCASE2017(聲學(xué)場景和事件檢測分類挑戰(zhàn)賽)公開數(shù)據(jù)集. 該數(shù)據(jù)集由芬蘭坦佩雷理工大學(xué)(Tampere University of Technology,2015.06-2016.01)收錄,包括15類日常生活的環(huán)境和測試集兩部分. 相對(duì)于2016年挑戰(zhàn)賽的30 s素材,2017年每段的素材長度縮減到10 s,這導(dǎo)致其中所包含的音頻信息大大減少,無論對(duì)人類還是機(jī)器都是更難的挑戰(zhàn). 錄音中包含了大量的聲學(xué)事件,其中包括鳥叫、風(fēng)聲等自然音源,人的談笑聲、腳步聲等人類活動(dòng)音源,清洗杯盤、推拉抽屜、汽車馬達(dá)聲等物品發(fā)出的音源[19]. 聲學(xué)場景類型如圖3所示.3.2 基線系統(tǒng)(baseline system)
本文編號(hào):3248225
【文章來源】:北京理工大學(xué)學(xué)報(bào). 2020,40(01)北大核心EICSCD
【文章頁數(shù)】:7 頁
【部分圖文】:
MFCC提取流程圖
由于聲學(xué)事件音頻信號(hào)樣點(diǎn)之間存在相關(guān)性,因此一個(gè)采樣值可利用若干個(gè)過去的聲學(xué)事件音頻采樣值的線性組合來逼近,得到一組唯一的預(yù)測系數(shù),即線性預(yù)測系數(shù)(LPC). 為了提高特征參數(shù)的穩(wěn)定性,本文對(duì)聲學(xué)事件音頻信號(hào)求倒譜,用線性預(yù)測倒譜系數(shù)(LPCC)提取聲學(xué)事件特征.1.4 靜音時(shí)間(mute time,MT)
本文所用訓(xùn)練和測試集來自于IEEE音頻與聲學(xué)協(xié)會(huì)舉辦的DCASE2017(聲學(xué)場景和事件檢測分類挑戰(zhàn)賽)公開數(shù)據(jù)集. 該數(shù)據(jù)集由芬蘭坦佩雷理工大學(xué)(Tampere University of Technology,2015.06-2016.01)收錄,包括15類日常生活的環(huán)境和測試集兩部分. 相對(duì)于2016年挑戰(zhàn)賽的30 s素材,2017年每段的素材長度縮減到10 s,這導(dǎo)致其中所包含的音頻信息大大減少,無論對(duì)人類還是機(jī)器都是更難的挑戰(zhàn). 錄音中包含了大量的聲學(xué)事件,其中包括鳥叫、風(fēng)聲等自然音源,人的談笑聲、腳步聲等人類活動(dòng)音源,清洗杯盤、推拉抽屜、汽車馬達(dá)聲等物品發(fā)出的音源[19]. 聲學(xué)場景類型如圖3所示.3.2 基線系統(tǒng)(baseline system)
本文編號(hào):3248225
本文鏈接:http://sikaile.net/kejilunwen/wulilw/3248225.html
最近更新
教材專著