基于ICRNN-GRU異常音頻事件檢測(cè)及增強(qiáng)算法研究
發(fā)布時(shí)間:2022-07-14 12:10
音頻信號(hào)作為信息傳遞的主要途徑,相比于視頻而言,擁有采集設(shè)備簡(jiǎn)單、方式便捷、所需存儲(chǔ)空間小及隱私性高等優(yōu)點(diǎn),因此音頻監(jiān)控彌補(bǔ)了視頻監(jiān)控的許多不足,成為安全監(jiān)控領(lǐng)域關(guān)注的焦點(diǎn)。其中,音頻事件檢測(cè)是音頻監(jiān)控的核心技術(shù),即在安全監(jiān)控中通過(guò)音頻識(shí)別所發(fā)生的伴有異常聲音的突發(fā)異常事件。傳統(tǒng)的音頻事件檢測(cè)方法主要用到特征提取方法搭配分類(lèi)器的方法進(jìn)行,首先核心的問(wèn)題仍然是特征提取,經(jīng)典的音頻特征以及針對(duì)特定情況人為設(shè)計(jì)的特征往往過(guò)于具體從而并不完整,存在明顯缺陷最后導(dǎo)致建模結(jié)果偏差。而近年來(lái),深度學(xué)習(xí)被證明可以有效地應(yīng)用在音頻事件檢測(cè)領(lǐng)域及提高檢測(cè)結(jié)果。音頻事件檢測(cè)過(guò)程中,周?chē)尘奥曇敉鶑?fù)雜多變且沒(méi)有規(guī)律,這些背景聲的出現(xiàn)會(huì)明顯降低檢測(cè)性能。本文針對(duì)傳統(tǒng)音頻事件檢測(cè)方法的不足,在學(xué)習(xí)、分析深度學(xué)習(xí)相關(guān)知識(shí)的基礎(chǔ)上,提出了一種將卷積神經(jīng)網(wǎng)絡(luò)和循環(huán)神經(jīng)網(wǎng)絡(luò)相結(jié)合的異常音頻事件檢測(cè)模型,并且采用數(shù)據(jù)增強(qiáng)模塊結(jié)合基本識(shí)別模塊的神經(jīng)網(wǎng)絡(luò)架構(gòu),算法提取異常音頻的聲譜圖作為特征輸入,通過(guò)數(shù)據(jù)增強(qiáng)模塊獲得去噪、增強(qiáng)的特征譜圖,然后經(jīng)由識(shí)別模型得出最終識(shí)別結(jié)果。針對(duì)使用深度學(xué)習(xí)方法在訓(xùn)練異常音頻事件檢測(cè)模型時(shí)需要大...
【文章頁(yè)數(shù)】:59 頁(yè)
【學(xué)位級(jí)別】:碩士
【部分圖文】:
說(shuō)話(huà)聲原始采樣點(diǎn)波形和過(guò)零率圖
Mel濾波器組示意圖
全連接神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)
【參考文獻(xiàn)】:
期刊論文
[1]公共安全視頻監(jiān)控地方立法中的個(gè)人信息保護(hù)研究[J]. 王秀哲. 東北師大學(xué)報(bào)(哲學(xué)社會(huì)科學(xué)版). 2019(05)
[2]快速傅里葉變換的研究[J]. 陳晉. 黑龍江科學(xué). 2018(24)
[3]基于EEMD的異常聲音特征提取[J]. 陳志全,楊駿,喬樹(shù)山. 計(jì)算機(jī)與數(shù)字工程. 2016(10)
[4]基于窗函數(shù)與MATLAB的數(shù)字FIR濾波器設(shè)計(jì)[J]. 董胡. 微型電腦應(yīng)用. 2016(03)
[5]面向語(yǔ)音情感識(shí)別的語(yǔ)譜圖特征提取算法[J]. 陶華偉,査誠(chéng),梁瑞宇,張昕然,趙力,王青云. 東南大學(xué)學(xué)報(bào)(自然科學(xué)版). 2015(05)
[6]基于雙門(mén)限兩級(jí)判決的語(yǔ)音端點(diǎn)檢測(cè)方法[J]. 路青起,白燕燕. 電子科技. 2012(01)
[7]基于倒譜特征的帶噪語(yǔ)音端點(diǎn)檢測(cè)[J]. 胡光銳,韋曉東. 電子學(xué)報(bào). 2000(10)
本文編號(hào):3661102
【文章頁(yè)數(shù)】:59 頁(yè)
【學(xué)位級(jí)別】:碩士
【部分圖文】:
說(shuō)話(huà)聲原始采樣點(diǎn)波形和過(guò)零率圖
Mel濾波器組示意圖
全連接神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)
【參考文獻(xiàn)】:
期刊論文
[1]公共安全視頻監(jiān)控地方立法中的個(gè)人信息保護(hù)研究[J]. 王秀哲. 東北師大學(xué)報(bào)(哲學(xué)社會(huì)科學(xué)版). 2019(05)
[2]快速傅里葉變換的研究[J]. 陳晉. 黑龍江科學(xué). 2018(24)
[3]基于EEMD的異常聲音特征提取[J]. 陳志全,楊駿,喬樹(shù)山. 計(jì)算機(jī)與數(shù)字工程. 2016(10)
[4]基于窗函數(shù)與MATLAB的數(shù)字FIR濾波器設(shè)計(jì)[J]. 董胡. 微型電腦應(yīng)用. 2016(03)
[5]面向語(yǔ)音情感識(shí)別的語(yǔ)譜圖特征提取算法[J]. 陶華偉,査誠(chéng),梁瑞宇,張昕然,趙力,王青云. 東南大學(xué)學(xué)報(bào)(自然科學(xué)版). 2015(05)
[6]基于雙門(mén)限兩級(jí)判決的語(yǔ)音端點(diǎn)檢測(cè)方法[J]. 路青起,白燕燕. 電子科技. 2012(01)
[7]基于倒譜特征的帶噪語(yǔ)音端點(diǎn)檢測(cè)[J]. 胡光銳,韋曉東. 電子學(xué)報(bào). 2000(10)
本文編號(hào):3661102
本文鏈接:http://sikaile.net/kejilunwen/zidonghuakongzhilunwen/3661102.html
最近更新
教材專(zhuān)著