基于耳蝸?zhàn)V圖紋理特征的聲音事件識(shí)別
發(fā)布時(shí)間:2021-06-05 13:08
針對(duì)在各種環(huán)境下聲音事件的識(shí)別問(wèn)題,提出了一種基于譜圖紋理特征的聲音事件識(shí)別方法。首先,將聲音信號(hào)通過(guò)伽馬通(Gammatone)濾波器組,使原始聲音樣本轉(zhuǎn)化為灰度耳蝸?zhàn)V圖;然后,對(duì)譜圖進(jìn)行曲波(Curvelet)變換,得到不同尺度、不同方向的Curvelet子帶;再采用改進(jìn)完全局部二值模式(ImprovedCompletedLocalBinaryPattern,ICLBP)提取Curvelet子帶的紋理特征,并生成分塊統(tǒng)計(jì)直方圖,將統(tǒng)計(jì)直方圖級(jí)聯(lián)作為一種新的聲音事件特征;最后,使用支持向量機(jī)作為分類器對(duì)16種聲音事件在不同噪聲和不同信噪比下進(jìn)行識(shí)別。實(shí)驗(yàn)結(jié)果表明,所提特征與其他聲音特征相比,可以有效識(shí)別各種噪聲環(huán)境下不同種類的聲音事件。
【文章來(lái)源】:聲學(xué)技術(shù). 2020,39(01)北大核心CSCD
【文章頁(yè)數(shù)】:7 頁(yè)
【部分圖文】:
算法的流程框架圖
Curvelet變換考慮了尺度、角度、位置信息,使其在表達(dá)圖像中的曲線時(shí)明顯優(yōu)于小波變換。同時(shí),Curvelet變換克服了小波變換的局限性,具有比小波變換更寬的幾何特征。Curvelet變換之后得到的系數(shù)具有多尺度、多方向特點(diǎn),能夠更好地凸顯圖像像素間的變化?紤]到耳蝸?zhàn)V圖表征聲音信息的有限性,而Curvelet變換的多尺度分析能力,將譜圖分解為不同尺度層,各尺度層分別表示譜圖不同頻率的信息。這樣,可以獲取關(guān)于譜圖的更多細(xì)節(jié)信息。設(shè)f(m,n)表示圖像信號(hào),則其基于Wrapping的離散Curvelet變換可表示為
同時(shí),表3給出了4種噪聲環(huán)境條件下,UCLBP_S/ICLBP_M(jìn)特征與SPD等其他4種特征在不同信噪比下的平均識(shí)別率。從表3可知,當(dāng)信噪比為0時(shí),UCLBP_S/ICLBP_M(jìn)特征的平均識(shí)別率達(dá)到80%,依然能夠保持較高的識(shí)別率。且在4種信噪比下的平均識(shí)別率達(dá)到92.03%,比SPD特征、SIF特征、OMP+MFCC特征、MFCC特征分別高出6.06%、18.04%、40.49%、46.98%。從表3中的各特征對(duì)比說(shuō)明,UCLBP_S/ICLBP_M(jìn)特征是一個(gè)性能較好的特征,在不同噪聲環(huán)境及不同信噪比條件下,仍然能取得較好的識(shí)別結(jié)果,具有較優(yōu)的魯棒性。這是因?yàn)镃urvelet變換可以更好表示譜圖中出現(xiàn)的邊緣和其他變化,獲取譜圖中更多的細(xì)節(jié)信息。此外,使用UCLBP_S和ICLBP_M(jìn)提取特征,串聯(lián)得到融合的UCLBP_S/ICLBP_M(jìn)特征,降低了特征維數(shù),減少了特征冗余,從而使提取的特征更具有鑒別性。圖4 信噪比為0時(shí),babble噪聲測(cè)試樣本的混淆矩陣
【參考文獻(xiàn)】:
期刊論文
[1]基于肺音譜圖Hough變換的喘鳴音識(shí)別方法[J]. 張柯欣,龍哲,王雪峰,趙宏. 東北大學(xué)學(xué)報(bào)(自然科學(xué)版). 2017(11)
[2]用于水聲目標(biāo)識(shí)別的近鄰無(wú)監(jiān)督特征選擇算法[J]. 陳含露,楊宏暉,申昇. 聲學(xué)技術(shù). 2016(03)
[3]類獨(dú)立特征提取法在環(huán)境聲音識(shí)別中的應(yīng)用[J]. 李玲俐,陳曉明. 計(jì)算機(jī)工程與應(yīng)用. 2012(22)
本文編號(hào):3212228
【文章來(lái)源】:聲學(xué)技術(shù). 2020,39(01)北大核心CSCD
【文章頁(yè)數(shù)】:7 頁(yè)
【部分圖文】:
算法的流程框架圖
Curvelet變換考慮了尺度、角度、位置信息,使其在表達(dá)圖像中的曲線時(shí)明顯優(yōu)于小波變換。同時(shí),Curvelet變換克服了小波變換的局限性,具有比小波變換更寬的幾何特征。Curvelet變換之后得到的系數(shù)具有多尺度、多方向特點(diǎn),能夠更好地凸顯圖像像素間的變化?紤]到耳蝸?zhàn)V圖表征聲音信息的有限性,而Curvelet變換的多尺度分析能力,將譜圖分解為不同尺度層,各尺度層分別表示譜圖不同頻率的信息。這樣,可以獲取關(guān)于譜圖的更多細(xì)節(jié)信息。設(shè)f(m,n)表示圖像信號(hào),則其基于Wrapping的離散Curvelet變換可表示為
同時(shí),表3給出了4種噪聲環(huán)境條件下,UCLBP_S/ICLBP_M(jìn)特征與SPD等其他4種特征在不同信噪比下的平均識(shí)別率。從表3可知,當(dāng)信噪比為0時(shí),UCLBP_S/ICLBP_M(jìn)特征的平均識(shí)別率達(dá)到80%,依然能夠保持較高的識(shí)別率。且在4種信噪比下的平均識(shí)別率達(dá)到92.03%,比SPD特征、SIF特征、OMP+MFCC特征、MFCC特征分別高出6.06%、18.04%、40.49%、46.98%。從表3中的各特征對(duì)比說(shuō)明,UCLBP_S/ICLBP_M(jìn)特征是一個(gè)性能較好的特征,在不同噪聲環(huán)境及不同信噪比條件下,仍然能取得較好的識(shí)別結(jié)果,具有較優(yōu)的魯棒性。這是因?yàn)镃urvelet變換可以更好表示譜圖中出現(xiàn)的邊緣和其他變化,獲取譜圖中更多的細(xì)節(jié)信息。此外,使用UCLBP_S和ICLBP_M(jìn)提取特征,串聯(lián)得到融合的UCLBP_S/ICLBP_M(jìn)特征,降低了特征維數(shù),減少了特征冗余,從而使提取的特征更具有鑒別性。圖4 信噪比為0時(shí),babble噪聲測(cè)試樣本的混淆矩陣
【參考文獻(xiàn)】:
期刊論文
[1]基于肺音譜圖Hough變換的喘鳴音識(shí)別方法[J]. 張柯欣,龍哲,王雪峰,趙宏. 東北大學(xué)學(xué)報(bào)(自然科學(xué)版). 2017(11)
[2]用于水聲目標(biāo)識(shí)別的近鄰無(wú)監(jiān)督特征選擇算法[J]. 陳含露,楊宏暉,申昇. 聲學(xué)技術(shù). 2016(03)
[3]類獨(dú)立特征提取法在環(huán)境聲音識(shí)別中的應(yīng)用[J]. 李玲俐,陳曉明. 計(jì)算機(jī)工程與應(yīng)用. 2012(22)
本文編號(hào):3212228
本文鏈接:http://sikaile.net/kejilunwen/dianzigongchenglunwen/3212228.html
最近更新
教材專著