基于深度神經(jīng)網(wǎng)絡(luò)的音頻事件檢測(cè)
本文關(guān)鍵詞:基于深度神經(jīng)網(wǎng)絡(luò)的音頻事件檢測(cè)
更多相關(guān)文章: 音頻事件檢測(cè) 深度神經(jīng)網(wǎng)絡(luò) 深層變換特征 分類(lèi)器
【摘要】:隨著互聯(lián)網(wǎng)技術(shù)的快速發(fā)展及手持錄音設(shè)備的普及,人們可獲取的音頻數(shù)據(jù)呈爆炸式增長(zhǎng)。為了有效管理、利用海量音頻數(shù)據(jù),音頻檢索技術(shù)成為研究熱點(diǎn)。音頻事件檢測(cè)是音頻檢索的重要組成部分,其主要任務(wù)是將連續(xù)音頻流中感興趣的音頻事件檢測(cè)出來(lái)。本文采用深度神經(jīng)網(wǎng)絡(luò)(Deep Neural Network,DNN)作為深層特征提取器和音頻事件分類(lèi)器,提出一種基于深度神經(jīng)網(wǎng)絡(luò)的音頻事件檢測(cè)框架,并比較不同音頻特征及分類(lèi)器在復(fù)雜音頻事件檢測(cè)中的性能差異。本文主要工作及貢獻(xiàn)如下:(1)針對(duì)傳統(tǒng)音頻特征不能有效刻畫(huà)復(fù)雜音頻事件之間差異的問(wèn)題,提出一種基于多流多層深度神經(jīng)網(wǎng)絡(luò)的復(fù)雜音頻事件深層變換特征提取方法。首先以傳統(tǒng)音頻特征分別作為第一層深度神經(jīng)網(wǎng)絡(luò)的輸入并將該層深度神經(jīng)網(wǎng)絡(luò)瓶頸層的輸出作為第二層深度神經(jīng)網(wǎng)絡(luò)的輸入,然后將第二層深度神經(jīng)網(wǎng)絡(luò)瓶頸層的輸出作為深層變換特征。多個(gè)傳統(tǒng)音頻特征經(jīng)過(guò)多流多層深度神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)變換之后,最終得到的音頻特征融合了傳統(tǒng)音頻特征的優(yōu)勢(shì)并進(jìn)一步挖掘了新的輸入特征信息。采用取自BBC音頻事件數(shù)據(jù)庫(kù)和影視劇音頻事件數(shù)據(jù)庫(kù)的實(shí)驗(yàn)數(shù)據(jù)進(jìn)行測(cè)試,實(shí)驗(yàn)結(jié)果表明:與目前被廣泛使用的梅爾頻率倒譜系數(shù)(Mel Frequency Cepstral Coefficients,MFCC)和Gabor特征相比,本文提取的特征在區(qū)分復(fù)雜音頻事件時(shí)獲得更好的分類(lèi)效果。(2)將深度神經(jīng)網(wǎng)絡(luò)作為音頻事件分類(lèi)器并結(jié)合(1)中提取的深層變換特征,提出一種基于深度神經(jīng)網(wǎng)絡(luò)的音頻事件檢測(cè)方法,并深入探討深層變換特征在音頻事件檢測(cè)時(shí)的抗噪性。該方法將深度神經(jīng)網(wǎng)絡(luò)既作為特征提取器又作為分類(lèi)器,旨在利用深度神經(jīng)網(wǎng)絡(luò)的數(shù)據(jù)學(xué)習(xí)能力獲得更優(yōu)的音頻事件檢測(cè)性能。采用取自BBC音頻事件數(shù)據(jù)庫(kù)和影視劇音頻事件數(shù)據(jù)庫(kù)的實(shí)驗(yàn)數(shù)據(jù)進(jìn)行測(cè)試,實(shí)驗(yàn)結(jié)果表明:與目前基于高斯混合模型、基于隱馬爾科夫模型和基于支持向量機(jī)的音頻事件檢測(cè)方法相比,本文方法獲得了更好的檢測(cè)結(jié)果。采用帶有Babble噪聲、Destroyerops噪聲、F16噪聲和Factory1噪聲的影視劇音頻事件數(shù)據(jù)集依次進(jìn)行測(cè)試,深層變換特征比MFCC特征的平均F1值分別提高9.08%、12.01%、6.79%和13.64%;比Gabor特征的平均F1值分別提高5.39%、3.56%、4.75%和3.26%。采用帶有Babble噪聲、Destroyerops噪聲、F16噪聲和Factory1噪聲的BBC音頻事件數(shù)據(jù)集依次進(jìn)行測(cè)試,深層變換特征比MFCC特征的平均F1值分別提高8.77%、10.64%、8.76%和10.40%;比Gabor特征的平均F1值分別提高11.19%、6.29%、7.04%和6.99%。上述結(jié)果表明:深層變換特征比MFCC特征、Gabor特征具有更好的抗噪性。綜上所述,本文基于深度神經(jīng)網(wǎng)絡(luò)深入探討音頻事件深層變換特征提取方法及檢測(cè)方法。實(shí)驗(yàn)分析深層變換特征與傳統(tǒng)音頻特征、本文檢測(cè)方法與傳統(tǒng)檢測(cè)方法的性能差異,驗(yàn)證了本文的深層變換特征及音頻事件檢測(cè)方法的有效性。
【關(guān)鍵詞】:音頻事件檢測(cè) 深度神經(jīng)網(wǎng)絡(luò) 深層變換特征 分類(lèi)器
【學(xué)位授予單位】:華南理工大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2016
【分類(lèi)號(hào)】:TN912.3;TP183
【目錄】:
- 摘要5-7
- Abstract7-11
- 第一章 緒論11-17
- 1.1 研究背景與意義11-12
- 1.2 國(guó)內(nèi)外研究現(xiàn)狀12-14
- 1.3 論文主要研究?jī)?nèi)容14-15
- 1.4 論文結(jié)構(gòu)安排15-17
- 第二章 音頻事件檢測(cè)理論基礎(chǔ)17-34
- 2.1 常用特征17-21
- 2.1.1 梅爾頻率倒譜系數(shù)17-18
- 2.1.2 Gabor特征18-21
- 2.2 常用分類(lèi)器21-33
- 2.2.1 高斯混合模型21-25
- 2.2.2 隱馬爾科夫模型25-29
- 2.2.3 支持向量機(jī)29-33
- 2.3 本章小結(jié)33-34
- 第三章 基于多流多層深度神經(jīng)網(wǎng)絡(luò)的深層特征提取34-53
- 3.1 神經(jīng)網(wǎng)絡(luò)發(fā)展34-35
- 3.2 深度神經(jīng)網(wǎng)絡(luò)基本原理35-39
- 3.2.1 DNN數(shù)學(xué)表達(dá)式35-36
- 3.2.2 隨機(jī)梯度下降算法36-37
- 3.2.3 受限玻爾茲曼機(jī)37-39
- 3.3 深層變換特征提取框架39-41
- 3.3.1 深度神經(jīng)網(wǎng)絡(luò)參數(shù)初始化40-41
- 3.3.2 深層變換特征提取41
- 3.4 實(shí)驗(yàn)設(shè)計(jì)41-45
- 3.4.1 實(shí)驗(yàn)數(shù)據(jù)42-43
- 3.4.2 淺層音頻特征選取43-44
- 3.4.3 實(shí)驗(yàn)設(shè)置44
- 3.4.4 評(píng)價(jià)指標(biāo)44-45
- 3.5 實(shí)驗(yàn)結(jié)果分析45-52
- 3.5.1 隱層數(shù)對(duì)特征分類(lèi)性能影響45-47
- 3.5.2 各種特征分類(lèi)性能比較47-52
- 3.6 本章小結(jié)52-53
- 第四章 基于深度神經(jīng)網(wǎng)絡(luò)的音頻事件檢測(cè)53-70
- 4.1 音頻事件檢測(cè)思想53
- 4.2 音頻事件檢測(cè)框架53-54
- 4.3 實(shí)驗(yàn)設(shè)計(jì)54-58
- 4.3.1 實(shí)驗(yàn)數(shù)據(jù)55-57
- 4.3.2 評(píng)價(jià)指標(biāo)57-58
- 4.3.3 實(shí)驗(yàn)設(shè)置58
- 4.4 實(shí)驗(yàn)結(jié)果分析58-69
- 4.4.1 DNN分類(lèi)器結(jié)構(gòu)確定58-59
- 4.4.2 不同分類(lèi)器檢測(cè)結(jié)果對(duì)比59-60
- 4.4.3 不同特征魯棒性對(duì)比60-69
- 4.5 本章小結(jié)69-70
- 結(jié)論70-72
- 參考文獻(xiàn)72-79
- 攻讀碩士學(xué)位期間取得的研究成果79-80
- 致謝80-82
- 附件82
【相似文獻(xiàn)】
中國(guó)期刊全文數(shù)據(jù)庫(kù) 前10條
1 洪宇;張宇;范基禮;劉挺;李生;;基于子話(huà)題分治匹配的新事件檢測(cè)[J];計(jì)算機(jī)學(xué)報(bào);2008年04期
2 史新宏,蔡伯根;高速公路自動(dòng)事件檢測(cè)算法[J];交通運(yùn)輸系統(tǒng)工程與信息;2001年04期
3 周林英;朱斌;趙忠杰;;基于支持向量機(jī)的高速公路事件檢測(cè)算法[J];系統(tǒng)仿真技術(shù);2010年03期
4 陳艷艷;田啟華;;公交調(diào)度系統(tǒng)事件檢測(cè)算法研究[J];北京工業(yè)大學(xué)學(xué)報(bào);2011年12期
5 郝艷哲;;京秦高速公路視頻事件檢測(cè)系統(tǒng)應(yīng)用[J];中國(guó)交通信息化;2013年04期
6 王闖舟;;提升事件檢測(cè)的商業(yè)價(jià)值[J];軟件世界;2007年20期
7 王彩琴;;基于智能分析的高速公路事件檢測(cè)系統(tǒng)的研究與開(kāi)發(fā)[J];浙江統(tǒng)計(jì);2007年11期
8 王穎穎;張峗;胡乃靜;;在線(xiàn)新事件檢測(cè)系統(tǒng)中的性能提升策略[J];計(jì)算機(jī)工程;2008年15期
9 倉(cāng)玉;洪宇;姚建民;朱巧明;;基于時(shí)序話(huà)題模型的新事件檢測(cè)[J];智能計(jì)算機(jī)與應(yīng)用;2011年03期
10 樓曉俊;鮑必賽;劉海濤;;分布式信息融合的物聯(lián)網(wǎng)事件檢測(cè)方法[J];南京郵電大學(xué)學(xué)報(bào)(自然科學(xué)版);2012年01期
中國(guó)重要會(huì)議論文全文數(shù)據(jù)庫(kù) 前10條
1 洪宇;張宇;范基禮;劉挺;李生;;基于子話(huà)題分治匹配的新事件檢測(cè)[A];第三屆全國(guó)信息檢索與內(nèi)容安全學(xué)術(shù)會(huì)議論文集[C];2007年
2 劉霄;邵健;莊越挺;;基于主題模型的網(wǎng)絡(luò)突發(fā)熱點(diǎn)事件檢測(cè)[A];第七屆和諧人機(jī)環(huán)境聯(lián)合學(xué)術(shù)會(huì)議(HHME2011)論文集【poster】[C];2011年
3 胡佳鋒;金蓓弘;陳海彪;;空間事件檢測(cè)的加速策略研究[A];第七屆和諧人機(jī)環(huán)境聯(lián)合學(xué)術(shù)會(huì)議(HHME2011)論文集【oral】[C];2011年
4 萬(wàn)濤;陳學(xué)武;王川久;;高速公路事件自動(dòng)檢測(cè)算法研究綜述[A];第一屆中國(guó)智能交通年會(huì)論文集[C];2005年
5 張闊;李涓子;吳剛;;基于關(guān)鍵詞元的話(huà)題內(nèi)事件檢測(cè)[A];第三屆全國(guó)信息檢索與內(nèi)容安全學(xué)術(shù)會(huì)議論文集[C];2007年
6 覃頻頻;許登元;姚起宏;黃大明;;基于表決融合的高速公路事件檢測(cè)算法融合[A];'2006系統(tǒng)仿真技術(shù)及其應(yīng)用學(xué)術(shù)交流會(huì)論文集[C];2006年
7 陳俊;李國(guó)輝;;擁擠視頻監(jiān)控中的事件檢測(cè)[A];第七屆和諧人機(jī)環(huán)境聯(lián)合學(xué)術(shù)會(huì)議(HHME2011)論文集【poster】[C];2011年
8 張永忠;趙靜;;基于事件檢測(cè)算法的交通數(shù)據(jù)分析系統(tǒng)[A];中國(guó)計(jì)量協(xié)會(huì)冶金分會(huì)2008年會(huì)論文集[C];2008年
9 劉海龍;李戰(zhàn)懷;陳群;;RFID供應(yīng)鏈系統(tǒng)中的在線(xiàn)復(fù)雜事件檢測(cè)方法[A];NDBC2010第27屆中國(guó)數(shù)據(jù)庫(kù)學(xué)術(shù)會(huì)議論文集A輯二[C];2010年
10 周春姐;孟小峰;文潔;;Flickr中的復(fù)合事件檢測(cè)[A];NDBC2010第27屆中國(guó)數(shù)據(jù)庫(kù)學(xué)術(shù)會(huì)議論文集(B輯)[C];2010年
中國(guó)重要報(bào)紙全文數(shù)據(jù)庫(kù) 前2條
1 王闖舟;事件檢測(cè)提升服務(wù)的商業(yè)價(jià)值[N];計(jì)算機(jī)世界;2006年
2 杭州?低晹(shù)字技術(shù)股份有限公司 浦世亮;IVS技術(shù)在城市安防系統(tǒng)中的應(yīng)用[N];計(jì)算機(jī)世界;2008年
中國(guó)博士學(xué)位論文全文數(shù)據(jù)庫(kù) 前4條
1 劉昌余;多媒體事件檢測(cè)中的關(guān)鍵技術(shù)研究[D];華南理工大學(xué);2015年
2 覃頻頻;基于信息融合的高速公路事件檢測(cè)建模與仿真[D];西南交通大學(xué);2007年
3 余柳;基于移動(dòng)源數(shù)據(jù)的城市快速交通事件檢測(cè)W-CUSUM算法與評(píng)價(jià)[D];北京交通大學(xué);2010年
4 柯佳;基于語(yǔ)義的視頻事件檢測(cè)分析方法研究[D];江蘇大學(xué);2013年
中國(guó)碩士學(xué)位論文全文數(shù)據(jù)庫(kù) 前10條
1 孫方園;基于圖的中文微博災(zāi)難事件檢測(cè)[D];浙江大學(xué);2016年
2 趙偉;足球視頻精彩事件檢測(cè)算法研究[D];北京理工大學(xué);2016年
3 張玉;基于微博的突發(fā)事件檢測(cè)方法研究[D];蘭州大學(xué);2016年
4 吳維耀;制造業(yè)物聯(lián)網(wǎng)基于事件優(yōu)先級(jí)的復(fù)雜事件檢測(cè)方法研究[D];廣東工業(yè)大學(xué);2016年
5 金海;基于深度神經(jīng)網(wǎng)絡(luò)的音頻事件檢測(cè)[D];華南理工大學(xué);2016年
6 李紅梅;基于微博的突發(fā)事件檢測(cè)研究[D];南京理工大學(xué);2016年
7 周林英;基于支持向量機(jī)的高速公路事件檢測(cè)算法[D];長(zhǎng)安大學(xué);2009年
8 熊偉晴;基于位置信息的事件檢測(cè)[D];哈爾濱工業(yè)大學(xué);2015年
9 肖軍;基于車(chē)檢器數(shù)據(jù)的高速公路事件檢測(cè)可靠性提升技術(shù)研究[D];重慶大學(xué);2015年
10 龍睿;針對(duì)微博數(shù)據(jù)的事件檢測(cè)、跟蹤及摘要生成[D];上海交通大學(xué);2012年
,本文編號(hào):1101433
本文鏈接:http://sikaile.net/kejilunwen/xinxigongchenglunwen/1101433.html