天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

基于循環(huán)神經(jīng)網(wǎng)絡的聲音識別

發(fā)布時間:2023-05-23 19:47
  聲音是一種最常見的信息載體,可以作為信息傳遞的媒介。并且聲學傳感器相比于其他類型的傳感器來說,在隱蔽性上做的更好,成本很低,在受到電磁干擾的情況時,抗外界干擾能力比其他類型的傳感器更強,F(xiàn)在,聲音識別在各行各業(yè)中都得到了廣泛應用。因此,對于聲音目標識別的研究具有重大意義。特征提取和分類兩個模塊是研究聲音識別的兩個核心部分,在傳統(tǒng)方法中,一般是通過人工方式提取特征,這對個人的經(jīng)驗要求很高。另外,一些特定環(huán)境中復雜的聲音特征很難被人工提取出來。這就會導致無法進行分類器的構(gòu)建以及復雜聲音的分類。深度學習算法,其作為智能感知算法,可以高效的挖掘類別屬性與深層特征。基于深度學習的理論基礎(chǔ),本文提出了利用深度學習中不同神經(jīng)網(wǎng)絡的算法來構(gòu)建分類器,用來實現(xiàn)聲音目標的識別。由此,本文基于對聲音特征提取與分類識別兩個主要模塊,設(shè)計了適用于處理音頻信號的卷積神經(jīng)網(wǎng)絡(CNN)和循環(huán)神經(jīng)網(wǎng)絡(RNN)兩種不同的深度學習算法來對聲音信息進行特征提取,訓練,最后實現(xiàn)正確分類。本文的創(chuàng)新主要有以下4點:(1)利用深度學習模型設(shè)計了發(fā)動機噪聲識別系統(tǒng)。(2)利用卷積神經(jīng)網(wǎng)絡對多噪聲源多時長的聲音特征進行提取。(3)...

【文章頁數(shù)】:62 頁

【學位級別】:碩士

【文章目錄】:
摘要
abstract
縮略詞表
1 緒論
    1.1 研究的背景及意義
    1.2 國內(nèi)外研究現(xiàn)狀
    1.3 本論文的結(jié)構(gòu)安排
2 聲音識別方案設(shè)計的理論基礎(chǔ)
    2.1 預處理
        2.1.1 預加重
        2.1.2 信號分幀
        2.1.3 信號加窗
    2.2 特征的提取
        2.2.1 梅爾頻率倒譜系數(shù)(MFCC)
    2.3 深度學習網(wǎng)絡的基礎(chǔ)知識
        2.3.1 常見的激活函數(shù)和損失函數(shù)
        2.3.2 卷積神經(jīng)網(wǎng)絡的基礎(chǔ)知識
        2.3.3 循環(huán)神經(jīng)網(wǎng)絡的基礎(chǔ)知識
    2.4 神經(jīng)網(wǎng)絡的訓練
        2.4.1 神經(jīng)網(wǎng)絡的正向傳播
        2.4.2 神經(jīng)網(wǎng)絡的反向傳播
    2.5 本章小結(jié)
3 基于深度學習模型的多噪聲源識別系統(tǒng)
    3.1 設(shè)計背景
    3.2 系統(tǒng)總體架構(gòu)
    3.3 聲音文件的預處理
        3.3.1 噪聲窗的選取
        3.3.2 聲音文件的分析處理
    3.4 聲音文件多步長提取FFT特征
    3.5 多維度MFCC的特征提取
    3.6 多時長聲音信息的特征提取
        3.6.1 MFCC特征歸一化
        3.6.2 基于卷積神經(jīng)網(wǎng)絡特征的優(yōu)化處理
        3.6.3 基于卷積神經(jīng)網(wǎng)絡的特征提取模型設(shè)計
    3.7 基于循環(huán)神經(jīng)網(wǎng)絡的優(yōu)化處理
    3.8 網(wǎng)絡算法的優(yōu)化
    3.9 實驗方案及訓練流程
        3.9.1 數(shù)據(jù)集
        3.9.2 實驗環(huán)境
        3.9.3 基于循環(huán)神經(jīng)網(wǎng)絡的訓練流程
        3.9.4 基于循環(huán)神經(jīng)網(wǎng)絡的訓練方案
    3.10 本章小結(jié)
4 實驗結(jié)果及分析
    4.1 模型性能評估指標
    4.2 對原始音頻數(shù)據(jù)的分析
    4.3 基于循環(huán)神經(jīng)網(wǎng)絡的識別結(jié)果分析
        4.3.1 基于特征提取BN層優(yōu)化的識別結(jié)果分析
        4.3.2 基于不同F(xiàn)FT長度的聲音識別結(jié)果分析
        4.3.3 基于不同維度長度的MFCC的循環(huán)神經(jīng)網(wǎng)絡的模型分析
        4.3.4 基于循環(huán)神經(jīng)網(wǎng)絡不同網(wǎng)絡結(jié)構(gòu)的分析
        4.3.5 加深網(wǎng)絡層數(shù)對識別效果的影響
    4.4 本章小結(jié)
5 結(jié)論與展望
    5.1 結(jié)論
    5.2 工作展望
參考文獻
攻讀學位期間發(fā)表的論文與研究成果清單
致謝



本文編號:3822250

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/shoufeilunwen/xixikjs/3822250.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶0cfda***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com