天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁(yè) > 科技論文 > 信息工程論文 >

基于深度神經(jīng)網(wǎng)絡(luò)的音頻事件檢測(cè)

發(fā)布時(shí)間:2017-10-27 02:05

  本文關(guān)鍵詞:基于深度神經(jīng)網(wǎng)絡(luò)的音頻事件檢測(cè)


  更多相關(guān)文章: 音頻事件檢測(cè) 深度神經(jīng)網(wǎng)絡(luò) 深層變換特征 分類(lèi)器


【摘要】:隨著互聯(lián)網(wǎng)技術(shù)的快速發(fā)展及手持錄音設(shè)備的普及,人們可獲取的音頻數(shù)據(jù)呈爆炸式增長(zhǎng)。為了有效管理、利用海量音頻數(shù)據(jù),音頻檢索技術(shù)成為研究熱點(diǎn)。音頻事件檢測(cè)是音頻檢索的重要組成部分,其主要任務(wù)是將連續(xù)音頻流中感興趣的音頻事件檢測(cè)出來(lái)。本文采用深度神經(jīng)網(wǎng)絡(luò)(Deep Neural Network,DNN)作為深層特征提取器和音頻事件分類(lèi)器,提出一種基于深度神經(jīng)網(wǎng)絡(luò)的音頻事件檢測(cè)框架,并比較不同音頻特征及分類(lèi)器在復(fù)雜音頻事件檢測(cè)中的性能差異。本文主要工作及貢獻(xiàn)如下:(1)針對(duì)傳統(tǒng)音頻特征不能有效刻畫(huà)復(fù)雜音頻事件之間差異的問(wèn)題,提出一種基于多流多層深度神經(jīng)網(wǎng)絡(luò)的復(fù)雜音頻事件深層變換特征提取方法。首先以傳統(tǒng)音頻特征分別作為第一層深度神經(jīng)網(wǎng)絡(luò)的輸入并將該層深度神經(jīng)網(wǎng)絡(luò)瓶頸層的輸出作為第二層深度神經(jīng)網(wǎng)絡(luò)的輸入,然后將第二層深度神經(jīng)網(wǎng)絡(luò)瓶頸層的輸出作為深層變換特征。多個(gè)傳統(tǒng)音頻特征經(jīng)過(guò)多流多層深度神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)變換之后,最終得到的音頻特征融合了傳統(tǒng)音頻特征的優(yōu)勢(shì)并進(jìn)一步挖掘了新的輸入特征信息。采用取自BBC音頻事件數(shù)據(jù)庫(kù)和影視劇音頻事件數(shù)據(jù)庫(kù)的實(shí)驗(yàn)數(shù)據(jù)進(jìn)行測(cè)試,實(shí)驗(yàn)結(jié)果表明:與目前被廣泛使用的梅爾頻率倒譜系數(shù)(Mel Frequency Cepstral Coefficients,MFCC)和Gabor特征相比,本文提取的特征在區(qū)分復(fù)雜音頻事件時(shí)獲得更好的分類(lèi)效果。(2)將深度神經(jīng)網(wǎng)絡(luò)作為音頻事件分類(lèi)器并結(jié)合(1)中提取的深層變換特征,提出一種基于深度神經(jīng)網(wǎng)絡(luò)的音頻事件檢測(cè)方法,并深入探討深層變換特征在音頻事件檢測(cè)時(shí)的抗噪性。該方法將深度神經(jīng)網(wǎng)絡(luò)既作為特征提取器又作為分類(lèi)器,旨在利用深度神經(jīng)網(wǎng)絡(luò)的數(shù)據(jù)學(xué)習(xí)能力獲得更優(yōu)的音頻事件檢測(cè)性能。采用取自BBC音頻事件數(shù)據(jù)庫(kù)和影視劇音頻事件數(shù)據(jù)庫(kù)的實(shí)驗(yàn)數(shù)據(jù)進(jìn)行測(cè)試,實(shí)驗(yàn)結(jié)果表明:與目前基于高斯混合模型、基于隱馬爾科夫模型和基于支持向量機(jī)的音頻事件檢測(cè)方法相比,本文方法獲得了更好的檢測(cè)結(jié)果。采用帶有Babble噪聲、Destroyerops噪聲、F16噪聲和Factory1噪聲的影視劇音頻事件數(shù)據(jù)集依次進(jìn)行測(cè)試,深層變換特征比MFCC特征的平均F1值分別提高9.08%、12.01%、6.79%和13.64%;比Gabor特征的平均F1值分別提高5.39%、3.56%、4.75%和3.26%。采用帶有Babble噪聲、Destroyerops噪聲、F16噪聲和Factory1噪聲的BBC音頻事件數(shù)據(jù)集依次進(jìn)行測(cè)試,深層變換特征比MFCC特征的平均F1值分別提高8.77%、10.64%、8.76%和10.40%;比Gabor特征的平均F1值分別提高11.19%、6.29%、7.04%和6.99%。上述結(jié)果表明:深層變換特征比MFCC特征、Gabor特征具有更好的抗噪性。綜上所述,本文基于深度神經(jīng)網(wǎng)絡(luò)深入探討音頻事件深層變換特征提取方法及檢測(cè)方法。實(shí)驗(yàn)分析深層變換特征與傳統(tǒng)音頻特征、本文檢測(cè)方法與傳統(tǒng)檢測(cè)方法的性能差異,驗(yàn)證了本文的深層變換特征及音頻事件檢測(cè)方法的有效性。
【關(guān)鍵詞】:音頻事件檢測(cè) 深度神經(jīng)網(wǎng)絡(luò) 深層變換特征 分類(lèi)器
【學(xué)位授予單位】:華南理工大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2016
【分類(lèi)號(hào)】:TN912.3;TP183
【目錄】:
  • 摘要5-7
  • Abstract7-11
  • 第一章 緒論11-17
  • 1.1 研究背景與意義11-12
  • 1.2 國(guó)內(nèi)外研究現(xiàn)狀12-14
  • 1.3 論文主要研究?jī)?nèi)容14-15
  • 1.4 論文結(jié)構(gòu)安排15-17
  • 第二章 音頻事件檢測(cè)理論基礎(chǔ)17-34
  • 2.1 常用特征17-21
  • 2.1.1 梅爾頻率倒譜系數(shù)17-18
  • 2.1.2 Gabor特征18-21
  • 2.2 常用分類(lèi)器21-33
  • 2.2.1 高斯混合模型21-25
  • 2.2.2 隱馬爾科夫模型25-29
  • 2.2.3 支持向量機(jī)29-33
  • 2.3 本章小結(jié)33-34
  • 第三章 基于多流多層深度神經(jīng)網(wǎng)絡(luò)的深層特征提取34-53
  • 3.1 神經(jīng)網(wǎng)絡(luò)發(fā)展34-35
  • 3.2 深度神經(jīng)網(wǎng)絡(luò)基本原理35-39
  • 3.2.1 DNN數(shù)學(xué)表達(dá)式35-36
  • 3.2.2 隨機(jī)梯度下降算法36-37
  • 3.2.3 受限玻爾茲曼機(jī)37-39
  • 3.3 深層變換特征提取框架39-41
  • 3.3.1 深度神經(jīng)網(wǎng)絡(luò)參數(shù)初始化40-41
  • 3.3.2 深層變換特征提取41
  • 3.4 實(shí)驗(yàn)設(shè)計(jì)41-45
  • 3.4.1 實(shí)驗(yàn)數(shù)據(jù)42-43
  • 3.4.2 淺層音頻特征選取43-44
  • 3.4.3 實(shí)驗(yàn)設(shè)置44
  • 3.4.4 評(píng)價(jià)指標(biāo)44-45
  • 3.5 實(shí)驗(yàn)結(jié)果分析45-52
  • 3.5.1 隱層數(shù)對(duì)特征分類(lèi)性能影響45-47
  • 3.5.2 各種特征分類(lèi)性能比較47-52
  • 3.6 本章小結(jié)52-53
  • 第四章 基于深度神經(jīng)網(wǎng)絡(luò)的音頻事件檢測(cè)53-70
  • 4.1 音頻事件檢測(cè)思想53
  • 4.2 音頻事件檢測(cè)框架53-54
  • 4.3 實(shí)驗(yàn)設(shè)計(jì)54-58
  • 4.3.1 實(shí)驗(yàn)數(shù)據(jù)55-57
  • 4.3.2 評(píng)價(jià)指標(biāo)57-58
  • 4.3.3 實(shí)驗(yàn)設(shè)置58
  • 4.4 實(shí)驗(yàn)結(jié)果分析58-69
  • 4.4.1 DNN分類(lèi)器結(jié)構(gòu)確定58-59
  • 4.4.2 不同分類(lèi)器檢測(cè)結(jié)果對(duì)比59-60
  • 4.4.3 不同特征魯棒性對(duì)比60-69
  • 4.5 本章小結(jié)69-70
  • 結(jié)論70-72
  • 參考文獻(xiàn)72-79
  • 攻讀碩士學(xué)位期間取得的研究成果79-80
  • 致謝80-82
  • 附件82

【相似文獻(xiàn)】

中國(guó)期刊全文數(shù)據(jù)庫(kù) 前10條

1 洪宇;張宇;范基禮;劉挺;李生;;基于子話(huà)題分治匹配的新事件檢測(cè)[J];計(jì)算機(jī)學(xué)報(bào);2008年04期

2 史新宏,蔡伯根;高速公路自動(dòng)事件檢測(cè)算法[J];交通運(yùn)輸系統(tǒng)工程與信息;2001年04期

3 周林英;朱斌;趙忠杰;;基于支持向量機(jī)的高速公路事件檢測(cè)算法[J];系統(tǒng)仿真技術(shù);2010年03期

4 陳艷艷;田啟華;;公交調(diào)度系統(tǒng)事件檢測(cè)算法研究[J];北京工業(yè)大學(xué)學(xué)報(bào);2011年12期

5 郝艷哲;;京秦高速公路視頻事件檢測(cè)系統(tǒng)應(yīng)用[J];中國(guó)交通信息化;2013年04期

6 王闖舟;;提升事件檢測(cè)的商業(yè)價(jià)值[J];軟件世界;2007年20期

7 王彩琴;;基于智能分析的高速公路事件檢測(cè)系統(tǒng)的研究與開(kāi)發(fā)[J];浙江統(tǒng)計(jì);2007年11期

8 王穎穎;張峗;胡乃靜;;在線(xiàn)新事件檢測(cè)系統(tǒng)中的性能提升策略[J];計(jì)算機(jī)工程;2008年15期

9 倉(cāng)玉;洪宇;姚建民;朱巧明;;基于時(shí)序話(huà)題模型的新事件檢測(cè)[J];智能計(jì)算機(jī)與應(yīng)用;2011年03期

10 樓曉俊;鮑必賽;劉海濤;;分布式信息融合的物聯(lián)網(wǎng)事件檢測(cè)方法[J];南京郵電大學(xué)學(xué)報(bào)(自然科學(xué)版);2012年01期

中國(guó)重要會(huì)議論文全文數(shù)據(jù)庫(kù) 前10條

1 洪宇;張宇;范基禮;劉挺;李生;;基于子話(huà)題分治匹配的新事件檢測(cè)[A];第三屆全國(guó)信息檢索與內(nèi)容安全學(xué)術(shù)會(huì)議論文集[C];2007年

2 劉霄;邵健;莊越挺;;基于主題模型的網(wǎng)絡(luò)突發(fā)熱點(diǎn)事件檢測(cè)[A];第七屆和諧人機(jī)環(huán)境聯(lián)合學(xué)術(shù)會(huì)議(HHME2011)論文集【poster】[C];2011年

3 胡佳鋒;金蓓弘;陳海彪;;空間事件檢測(cè)的加速策略研究[A];第七屆和諧人機(jī)環(huán)境聯(lián)合學(xué)術(shù)會(huì)議(HHME2011)論文集【oral】[C];2011年

4 萬(wàn)濤;陳學(xué)武;王川久;;高速公路事件自動(dòng)檢測(cè)算法研究綜述[A];第一屆中國(guó)智能交通年會(huì)論文集[C];2005年

5 張闊;李涓子;吳剛;;基于關(guān)鍵詞元的話(huà)題內(nèi)事件檢測(cè)[A];第三屆全國(guó)信息檢索與內(nèi)容安全學(xué)術(shù)會(huì)議論文集[C];2007年

6 覃頻頻;許登元;姚起宏;黃大明;;基于表決融合的高速公路事件檢測(cè)算法融合[A];'2006系統(tǒng)仿真技術(shù)及其應(yīng)用學(xué)術(shù)交流會(huì)論文集[C];2006年

7 陳俊;李國(guó)輝;;擁擠視頻監(jiān)控中的事件檢測(cè)[A];第七屆和諧人機(jī)環(huán)境聯(lián)合學(xué)術(shù)會(huì)議(HHME2011)論文集【poster】[C];2011年

8 張永忠;趙靜;;基于事件檢測(cè)算法的交通數(shù)據(jù)分析系統(tǒng)[A];中國(guó)計(jì)量協(xié)會(huì)冶金分會(huì)2008年會(huì)論文集[C];2008年

9 劉海龍;李戰(zhàn)懷;陳群;;RFID供應(yīng)鏈系統(tǒng)中的在線(xiàn)復(fù)雜事件檢測(cè)方法[A];NDBC2010第27屆中國(guó)數(shù)據(jù)庫(kù)學(xué)術(shù)會(huì)議論文集A輯二[C];2010年

10 周春姐;孟小峰;文潔;;Flickr中的復(fù)合事件檢測(cè)[A];NDBC2010第27屆中國(guó)數(shù)據(jù)庫(kù)學(xué)術(shù)會(huì)議論文集(B輯)[C];2010年

中國(guó)重要報(bào)紙全文數(shù)據(jù)庫(kù) 前2條

1 王闖舟;事件檢測(cè)提升服務(wù)的商業(yè)價(jià)值[N];計(jì)算機(jī)世界;2006年

2 杭州?低晹(shù)字技術(shù)股份有限公司 浦世亮;IVS技術(shù)在城市安防系統(tǒng)中的應(yīng)用[N];計(jì)算機(jī)世界;2008年

中國(guó)博士學(xué)位論文全文數(shù)據(jù)庫(kù) 前4條

1 劉昌余;多媒體事件檢測(cè)中的關(guān)鍵技術(shù)研究[D];華南理工大學(xué);2015年

2 覃頻頻;基于信息融合的高速公路事件檢測(cè)建模與仿真[D];西南交通大學(xué);2007年

3 余柳;基于移動(dòng)源數(shù)據(jù)的城市快速交通事件檢測(cè)W-CUSUM算法與評(píng)價(jià)[D];北京交通大學(xué);2010年

4 柯佳;基于語(yǔ)義的視頻事件檢測(cè)分析方法研究[D];江蘇大學(xué);2013年

中國(guó)碩士學(xué)位論文全文數(shù)據(jù)庫(kù) 前10條

1 孫方園;基于圖的中文微博災(zāi)難事件檢測(cè)[D];浙江大學(xué);2016年

2 趙偉;足球視頻精彩事件檢測(cè)算法研究[D];北京理工大學(xué);2016年

3 張玉;基于微博的突發(fā)事件檢測(cè)方法研究[D];蘭州大學(xué);2016年

4 吳維耀;制造業(yè)物聯(lián)網(wǎng)基于事件優(yōu)先級(jí)的復(fù)雜事件檢測(cè)方法研究[D];廣東工業(yè)大學(xué);2016年

5 金海;基于深度神經(jīng)網(wǎng)絡(luò)的音頻事件檢測(cè)[D];華南理工大學(xué);2016年

6 李紅梅;基于微博的突發(fā)事件檢測(cè)研究[D];南京理工大學(xué);2016年

7 周林英;基于支持向量機(jī)的高速公路事件檢測(cè)算法[D];長(zhǎng)安大學(xué);2009年

8 熊偉晴;基于位置信息的事件檢測(cè)[D];哈爾濱工業(yè)大學(xué);2015年

9 肖軍;基于車(chē)檢器數(shù)據(jù)的高速公路事件檢測(cè)可靠性提升技術(shù)研究[D];重慶大學(xué);2015年

10 龍睿;針對(duì)微博數(shù)據(jù)的事件檢測(cè)、跟蹤及摘要生成[D];上海交通大學(xué);2012年

,

本文編號(hào):1101433

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/xinxigongchenglunwen/1101433.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶(hù)3b680***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com