基于機器學習與卷積神經網(wǎng)絡的放電聲音識別研究
發(fā)布時間:2024-06-02 14:59
為了實現(xiàn)對電氣設備放電聲音的精準檢測,文中篩選比較了多種經典的機器學習算法和新興的卷積神經網(wǎng)絡算法,以期得到識別效果最優(yōu)的選擇。首先對音頻進行預處理,再通過將放電聲與環(huán)境噪聲和變電站正常工況背景聲混合來模擬變電站真實工作環(huán)境,并使用梅爾頻率倒譜系數(shù)提取特征,最后采用支持向量機等機器學習算法與卷積神經網(wǎng)絡算法進行識別,選取識別效果最佳的算法并考察不同采樣頻率、采樣時長等因素對識別效果的影響。實驗結果表明,使用梅爾頻率倒譜系數(shù)提取特征可以良好區(qū)分放電與環(huán)境噪聲,支持向量機在一系列算法中識別放電聲音能力最強,采樣頻率、標準化方式等因素對識別效果影響較小。
【文章頁數(shù)】:7 頁
【部分圖文】:
本文編號:3987408
【文章頁數(shù)】:7 頁
【部分圖文】:
圖1放電模擬模型
實驗使用傳感器采樣頻率為44100Hz,采樣精度16位,頻率響應與人耳可聽聲范圍相同,為20~20000Hz。對于3種模型,在實驗中均將傳感器放置在離模型1.5m處,緩慢加壓直至火花放電,觀察室可見細微藍光,并有“嗒嗒”響聲,該階段的波形見圖2(a)。圖2(a)中縱軸為....
圖2放電聲信號波形圖
圖1放電模擬模型通過以上實驗合計收集原始的放電聲音音頻1601s。
圖3放電聲聲譜圖
樸素貝葉斯(NB)、隨機森林(RF)、支持向量機(SVM)與K近鄰(KNN)是幾種常用的機器學習算法,廣泛應用于文本分類,用戶身份辨識等分類場景[26]。這幾種算法對于輸入數(shù)據(jù)的結構有著不同的假設和處理方式,因此需考察對比其與放電聲音信號的匹配性。NB屬于生成學習算法,根據(jù)輸入x....
圖4CNN模型結構
文中移植了TaraN.Sainath等人用于語音關鍵詞識別的CNN模型,在對模型進行一定的修改后通過將音頻轉化為聲譜圖使用CNN進行識別[27]。模型結構見圖4。圖4由一層卷積層、兩層全連接層和一層輸出層組成。輸入為(32,40,1)形狀的聲譜圖,卷積層含有186個(32,8)....
本文編號:3987408
本文鏈接:http://sikaile.net/kejilunwen/dianlilw/3987408.html
教材專著