基于深度學(xué)習(xí)方法的環(huán)境聲音識(shí)別
發(fā)布時(shí)間:2024-04-27 18:20
環(huán)境聲音識(shí)別通常采集環(huán)境中的音頻數(shù)據(jù)并對(duì)其進(jìn)行分析和識(shí)別,從而達(dá)到對(duì)環(huán)境感知的能力。它在音頻取證、聲源定位與分類、聲音事件檢測(cè)和場(chǎng)景識(shí)別等領(lǐng)域都具有重要的意義。本文針對(duì)自然環(huán)境下動(dòng)物聲音識(shí)別受到非平穩(wěn)的噪聲干擾及復(fù)雜聲音場(chǎng)景識(shí)別問題,提出使用棧式降噪自編碼器(Stack Denoise Auto-encoder,SDA)的聲音增強(qiáng)算法、卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Networks,CNN)結(jié)合隨機(jī)森林(Random Forest,RF)的聲音場(chǎng)景識(shí)別方法。本文的主要內(nèi)容如下:(1)聲音增強(qiáng)算法。針對(duì)自然環(huán)境中各種非平穩(wěn)背景噪聲對(duì)聲音特征干擾,傳統(tǒng)方法無(wú)法有效濾除噪聲成分,提出使用多信噪比混合的聲音數(shù)據(jù)增強(qiáng)方式結(jié)合多層卷積結(jié)構(gòu)的SDA模型進(jìn)行訓(xùn)練,使帶噪信號(hào)的聲譜圖可以濾除噪聲的成分。首先,使用純凈聲與環(huán)境中的噪聲以不同的信噪比進(jìn)行混合、并對(duì)混合后的聲音信號(hào)進(jìn)行g(shù)ammatone聲譜圖生成;接著,將帶噪聲音信號(hào)的聲譜圖作為SDA的輸入,讓其有監(jiān)督地輸出純凈聲的聲譜圖。(2)聲音場(chǎng)景的特征提取。使用Mel能量譜結(jié)合CNN對(duì)高維聲譜特征的自主學(xué)習(xí)能力來(lái)提取聲音場(chǎng)景...
【文章頁(yè)數(shù)】:61 頁(yè)
【學(xué)位級(jí)別】:碩士
【文章目錄】:
中文摘要
ABSTRACT
第一章 引言
1.1 選題背景與研究意義
1.2 研究現(xiàn)狀
1.3 本文主要工作
1.3.1 研究?jī)?nèi)容
1.3.2 論文結(jié)構(gòu)
第二章 深度學(xué)習(xí)方法概述
2.1 深度學(xué)習(xí)相關(guān)概念
2.2 感知機(jī)模型
2.3 前饋神經(jīng)網(wǎng)絡(luò)
2.4 反向傳播算法
2.5 卷積神經(jīng)網(wǎng)絡(luò)
2.5.1 卷積運(yùn)算
2.5.2 卷積神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu)
2.6 深度學(xué)習(xí)中的常見問題及其解決方案
2.6.1 梯度消失和梯度爆炸
2.6.2 深度網(wǎng)絡(luò)難以訓(xùn)練
2.6.3 過擬合問題
2.7 本章小結(jié)
第三章 聲音增強(qiáng)算法
3.1 棧式降噪自編碼器的相關(guān)概念
3.1.1 稀疏編碼
3.1.2 自編碼器與棧式降噪自編碼器
3.2 基于棧式降噪自編碼器的聲音增強(qiáng)算法
3.3 其他聲音增強(qiáng)算法
3.3.1 多頻帶譜減法
3.3.2 維納濾波法
3.4 本章小結(jié)
第四章 聲音場(chǎng)景識(shí)別
4.1 聲音的特征提取
4.1.1 聲音特征概述
4.1.2 Mel能量譜
4.1.3 Mel頻率倒譜系數(shù)
4.2 常見的分類器
4.2.1 支持向量機(jī)
4.2.2 隨機(jī)森林
4.3 用卷積神經(jīng)網(wǎng)絡(luò)和隨機(jī)森林識(shí)別聲音場(chǎng)景
4.3.1 聲音場(chǎng)景識(shí)別架構(gòu)
4.3.2 卷積神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)
4.3.3 CNN訓(xùn)練過程及其特征提取
4.3.4 隨機(jī)森林識(shí)別過程
4.4 本章小結(jié)
第五章 實(shí)驗(yàn)設(shè)計(jì)與結(jié)果分析
5.1 聲音增強(qiáng)算法實(shí)驗(yàn)及其分析
5.1.1 聲音樣本集
5.1.2 實(shí)驗(yàn)參數(shù)設(shè)置與實(shí)驗(yàn)設(shè)計(jì)
5.1.3 實(shí)驗(yàn)分析
5.2 聲音場(chǎng)景識(shí)別實(shí)驗(yàn)及其分析
5.2.1 聲音樣本集
5.2.2 實(shí)驗(yàn)參數(shù)設(shè)置與實(shí)驗(yàn)設(shè)計(jì)
5.2.3 實(shí)驗(yàn)結(jié)果與分析
5.3 本章小結(jié)
總結(jié)與展望
參考文獻(xiàn)
致謝
個(gè)人簡(jiǎn)歷、在學(xué)期間的研究成果及發(fā)表的學(xué)術(shù)論文
本文編號(hào):3965532
【文章頁(yè)數(shù)】:61 頁(yè)
【學(xué)位級(jí)別】:碩士
【文章目錄】:
中文摘要
ABSTRACT
第一章 引言
1.1 選題背景與研究意義
1.2 研究現(xiàn)狀
1.3 本文主要工作
1.3.1 研究?jī)?nèi)容
1.3.2 論文結(jié)構(gòu)
第二章 深度學(xué)習(xí)方法概述
2.1 深度學(xué)習(xí)相關(guān)概念
2.2 感知機(jī)模型
2.3 前饋神經(jīng)網(wǎng)絡(luò)
2.4 反向傳播算法
2.5 卷積神經(jīng)網(wǎng)絡(luò)
2.5.1 卷積運(yùn)算
2.5.2 卷積神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu)
2.6 深度學(xué)習(xí)中的常見問題及其解決方案
2.6.1 梯度消失和梯度爆炸
2.6.2 深度網(wǎng)絡(luò)難以訓(xùn)練
2.6.3 過擬合問題
2.7 本章小結(jié)
第三章 聲音增強(qiáng)算法
3.1 棧式降噪自編碼器的相關(guān)概念
3.1.1 稀疏編碼
3.1.2 自編碼器與棧式降噪自編碼器
3.2 基于棧式降噪自編碼器的聲音增強(qiáng)算法
3.3 其他聲音增強(qiáng)算法
3.3.1 多頻帶譜減法
3.3.2 維納濾波法
3.4 本章小結(jié)
第四章 聲音場(chǎng)景識(shí)別
4.1 聲音的特征提取
4.1.1 聲音特征概述
4.1.2 Mel能量譜
4.1.3 Mel頻率倒譜系數(shù)
4.2 常見的分類器
4.2.1 支持向量機(jī)
4.2.2 隨機(jī)森林
4.3 用卷積神經(jīng)網(wǎng)絡(luò)和隨機(jī)森林識(shí)別聲音場(chǎng)景
4.3.1 聲音場(chǎng)景識(shí)別架構(gòu)
4.3.2 卷積神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)
4.3.3 CNN訓(xùn)練過程及其特征提取
4.3.4 隨機(jī)森林識(shí)別過程
4.4 本章小結(jié)
第五章 實(shí)驗(yàn)設(shè)計(jì)與結(jié)果分析
5.1 聲音增強(qiáng)算法實(shí)驗(yàn)及其分析
5.1.1 聲音樣本集
5.1.2 實(shí)驗(yàn)參數(shù)設(shè)置與實(shí)驗(yàn)設(shè)計(jì)
5.1.3 實(shí)驗(yàn)分析
5.2 聲音場(chǎng)景識(shí)別實(shí)驗(yàn)及其分析
5.2.1 聲音樣本集
5.2.2 實(shí)驗(yàn)參數(shù)設(shè)置與實(shí)驗(yàn)設(shè)計(jì)
5.2.3 實(shí)驗(yàn)結(jié)果與分析
5.3 本章小結(jié)
總結(jié)與展望
參考文獻(xiàn)
致謝
個(gè)人簡(jiǎn)歷、在學(xué)期間的研究成果及發(fā)表的學(xué)術(shù)論文
本文編號(hào):3965532
本文鏈接:http://sikaile.net/kejilunwen/zidonghuakongzhilunwen/3965532.html
最近更新
教材專著