基于ICRNN-GRU異常音頻事件檢測及增強算法研究
發(fā)布時間:2022-07-14 12:10
音頻信號作為信息傳遞的主要途徑,相比于視頻而言,擁有采集設(shè)備簡單、方式便捷、所需存儲空間小及隱私性高等優(yōu)點,因此音頻監(jiān)控彌補了視頻監(jiān)控的許多不足,成為安全監(jiān)控領(lǐng)域關(guān)注的焦點。其中,音頻事件檢測是音頻監(jiān)控的核心技術(shù),即在安全監(jiān)控中通過音頻識別所發(fā)生的伴有異常聲音的突發(fā)異常事件。傳統(tǒng)的音頻事件檢測方法主要用到特征提取方法搭配分類器的方法進行,首先核心的問題仍然是特征提取,經(jīng)典的音頻特征以及針對特定情況人為設(shè)計的特征往往過于具體從而并不完整,存在明顯缺陷最后導致建模結(jié)果偏差。而近年來,深度學習被證明可以有效地應(yīng)用在音頻事件檢測領(lǐng)域及提高檢測結(jié)果。音頻事件檢測過程中,周圍背景聲音往往復雜多變且沒有規(guī)律,這些背景聲的出現(xiàn)會明顯降低檢測性能。本文針對傳統(tǒng)音頻事件檢測方法的不足,在學習、分析深度學習相關(guān)知識的基礎(chǔ)上,提出了一種將卷積神經(jīng)網(wǎng)絡(luò)和循環(huán)神經(jīng)網(wǎng)絡(luò)相結(jié)合的異常音頻事件檢測模型,并且采用數(shù)據(jù)增強模塊結(jié)合基本識別模塊的神經(jīng)網(wǎng)絡(luò)架構(gòu),算法提取異常音頻的聲譜圖作為特征輸入,通過數(shù)據(jù)增強模塊獲得去噪、增強的特征譜圖,然后經(jīng)由識別模型得出最終識別結(jié)果。針對使用深度學習方法在訓練異常音頻事件檢測模型時需要大...
【文章頁數(shù)】:59 頁
【學位級別】:碩士
【部分圖文】:
說話聲原始采樣點波形和過零率圖
Mel濾波器組示意圖
全連接神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)
【參考文獻】:
期刊論文
[1]公共安全視頻監(jiān)控地方立法中的個人信息保護研究[J]. 王秀哲. 東北師大學報(哲學社會科學版). 2019(05)
[2]快速傅里葉變換的研究[J]. 陳晉. 黑龍江科學. 2018(24)
[3]基于EEMD的異常聲音特征提取[J]. 陳志全,楊駿,喬樹山. 計算機與數(shù)字工程. 2016(10)
[4]基于窗函數(shù)與MATLAB的數(shù)字FIR濾波器設(shè)計[J]. 董胡. 微型電腦應(yīng)用. 2016(03)
[5]面向語音情感識別的語譜圖特征提取算法[J]. 陶華偉,査誠,梁瑞宇,張昕然,趙力,王青云. 東南大學學報(自然科學版). 2015(05)
[6]基于雙門限兩級判決的語音端點檢測方法[J]. 路青起,白燕燕. 電子科技. 2012(01)
[7]基于倒譜特征的帶噪語音端點檢測[J]. 胡光銳,韋曉東. 電子學報. 2000(10)
本文編號:3661102
【文章頁數(shù)】:59 頁
【學位級別】:碩士
【部分圖文】:
說話聲原始采樣點波形和過零率圖
Mel濾波器組示意圖
全連接神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)
【參考文獻】:
期刊論文
[1]公共安全視頻監(jiān)控地方立法中的個人信息保護研究[J]. 王秀哲. 東北師大學報(哲學社會科學版). 2019(05)
[2]快速傅里葉變換的研究[J]. 陳晉. 黑龍江科學. 2018(24)
[3]基于EEMD的異常聲音特征提取[J]. 陳志全,楊駿,喬樹山. 計算機與數(shù)字工程. 2016(10)
[4]基于窗函數(shù)與MATLAB的數(shù)字FIR濾波器設(shè)計[J]. 董胡. 微型電腦應(yīng)用. 2016(03)
[5]面向語音情感識別的語譜圖特征提取算法[J]. 陶華偉,査誠,梁瑞宇,張昕然,趙力,王青云. 東南大學學報(自然科學版). 2015(05)
[6]基于雙門限兩級判決的語音端點檢測方法[J]. 路青起,白燕燕. 電子科技. 2012(01)
[7]基于倒譜特征的帶噪語音端點檢測[J]. 胡光銳,韋曉東. 電子學報. 2000(10)
本文編號:3661102
本文鏈接:http://sikaile.net/kejilunwen/zidonghuakongzhilunwen/3661102.html
最近更新
教材專著