基于深度卷積神經(jīng)網(wǎng)絡(luò)遷移學(xué)習(xí)特征的城市環(huán)境噪聲識別
發(fā)布時間:2020-07-02 14:44
【摘要】:隨著城市化建設(shè)進(jìn)程的不斷加快,建筑施工、交通運輸、社會生活等活動會產(chǎn)生大量的城市噪聲。城市噪聲識別在噪聲監(jiān)控、城市聲景理解和噪聲源識別中起著至關(guān)重要的作用。針對傳統(tǒng)人工設(shè)計的聲學(xué)特征在城市噪聲識別中識別率較低的問題,本文研究了一種高精度的城市環(huán)境噪聲識別方法,主要工作和成果如下:1、提出了一種遷移特征的城市環(huán)境噪聲識別方法。該方法首先通過在ImageNet數(shù)據(jù)集上預(yù)訓(xùn)練的深度卷積神經(jīng)網(wǎng)絡(luò)(CNN)作為特征提取器,提取出語譜圖圖像的深層特征;然后通過全連接層和Softmax分類器對提取出的遷移特征進(jìn)行分類。本文采用 Inception-v3,ResNet152,Inception-ResNet-v2 3 種網(wǎng)絡(luò)進(jìn)行實驗對比與驗證。并采用特征融合的方法,進(jìn)一步提高了城市環(huán)境噪聲的識別精度;2、提出了采用深度信念網(wǎng)絡(luò)(DBN)對遷移學(xué)習(xí)融合特征的識別方法。首先,比較了不同的DBN參數(shù)對于識別結(jié)果的影響,包括隱藏層節(jié)點個數(shù)、受限玻爾茲曼機(jī)(RBM)迭代次數(shù)、DBN隱藏層層數(shù)。然后根據(jù)以上實驗結(jié)果,獲得了基于遷移學(xué)習(xí)融合特征識別率最高的DBN模型。最后,與傳統(tǒng)聲音識別方法進(jìn)行對比。實驗證明,本文所提出的基于深度CNN遷移學(xué)習(xí)融合特征利用DBN分類的方法能達(dá)到98.55%的平均識別率,優(yōu)于傳統(tǒng)聲音識別方法。
【學(xué)位授予單位】:杭州電子科技大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2019
【分類號】:TP18;TN912.34
【圖文】:
逡逑的發(fā)展逡逑向主要是基于深度學(xué)習(xí)對城市環(huán)境聲音的進(jìn)行闡述。逡逑ep邋Learning)的概念起源于機(jī)器學(xué)習(xí),是在人的。深度學(xué)習(xí)的設(shè)計靈感來源于人腦視覺皮以及信息提取,來實現(xiàn)對目標(biāo)的識別和判斷。非線性映射,提取出信息最本質(zhì),抽象的高進(jìn)行的,沒有人工干預(yù),因此避免了特征的工智能。逡逑006年提出以來,特別是在Hinton通過預(yù)訓(xùn)題后,在機(jī)器學(xué)習(xí)領(lǐng)域的應(yīng)用研宄進(jìn)入了白的發(fā)展,科研人員們設(shè)計出了許多不同的文本等領(lǐng)域取得了很大的成功。逡逑Perception邋^逡逑
第2章聲音識別與深度學(xué)習(xí)相關(guān)知識逡逑2.1城市環(huán)境噪聲的識別流程逡逑城市噪聲識別算法模塊一般分為兩個部分:特征提取與分類識別。圖2.邋1為逡逑城市噪聲識別算法的一般流程。特征提取部分的作用是獲取聲信號中能夠表征其逡逑主要信息的參數(shù),分類識別則利用提取出來的特征進(jìn)行訓(xùn)練和建立噪聲信號模型,逡逑再將測試噪聲的特征與模型進(jìn)行匹配識別,輸出測試特征所屬的噪聲類別[1()1]。逡逑聲信號、I邐.邋I邋4?土燈+日而識別11相似性度量識別結(jié)果、逡逑邐H預(yù)處■邐特征提。掊澹J狡ヅ洌┻姡掊义线?!模式匹配庫逡逑圖2.1聲音識別基本原理逡逑聲信號特征的提取是城市環(huán)境噪聲識別最重要的一部分,理想的特征能夠保逡逑留聲信號中重要的聲學(xué)信息,對于同一類聲信號的特征應(yīng)當(dāng)差距較小,具有相同逡逑的分布特性,而對于不同類的聲信號特征具有明顯的區(qū)分度。同時優(yōu)秀的聲信號逡逑特征應(yīng)當(dāng)不受噪聲、環(huán)境和聲音衰減等因素的影響。逡逑目前針對聲信號特征提取方式主要是基于手工制作的時域,頻域特征。在時逡逑域特征方面,主要是基于聲信號的一些數(shù)學(xué)統(tǒng)計,如幅值、過零率、信號的能量逡逑等;在頻域特征方面
本文編號:2738320
【學(xué)位授予單位】:杭州電子科技大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2019
【分類號】:TP18;TN912.34
【圖文】:
逡逑的發(fā)展逡逑向主要是基于深度學(xué)習(xí)對城市環(huán)境聲音的進(jìn)行闡述。逡逑ep邋Learning)的概念起源于機(jī)器學(xué)習(xí),是在人的。深度學(xué)習(xí)的設(shè)計靈感來源于人腦視覺皮以及信息提取,來實現(xiàn)對目標(biāo)的識別和判斷。非線性映射,提取出信息最本質(zhì),抽象的高進(jìn)行的,沒有人工干預(yù),因此避免了特征的工智能。逡逑006年提出以來,特別是在Hinton通過預(yù)訓(xùn)題后,在機(jī)器學(xué)習(xí)領(lǐng)域的應(yīng)用研宄進(jìn)入了白的發(fā)展,科研人員們設(shè)計出了許多不同的文本等領(lǐng)域取得了很大的成功。逡逑Perception邋^逡逑
第2章聲音識別與深度學(xué)習(xí)相關(guān)知識逡逑2.1城市環(huán)境噪聲的識別流程逡逑城市噪聲識別算法模塊一般分為兩個部分:特征提取與分類識別。圖2.邋1為逡逑城市噪聲識別算法的一般流程。特征提取部分的作用是獲取聲信號中能夠表征其逡逑主要信息的參數(shù),分類識別則利用提取出來的特征進(jìn)行訓(xùn)練和建立噪聲信號模型,逡逑再將測試噪聲的特征與模型進(jìn)行匹配識別,輸出測試特征所屬的噪聲類別[1()1]。逡逑聲信號、I邐.邋I邋4?土燈+日而識別11相似性度量識別結(jié)果、逡逑邐H預(yù)處■邐特征提。掊澹J狡ヅ洌┻姡掊义线?!模式匹配庫逡逑圖2.1聲音識別基本原理逡逑聲信號特征的提取是城市環(huán)境噪聲識別最重要的一部分,理想的特征能夠保逡逑留聲信號中重要的聲學(xué)信息,對于同一類聲信號的特征應(yīng)當(dāng)差距較小,具有相同逡逑的分布特性,而對于不同類的聲信號特征具有明顯的區(qū)分度。同時優(yōu)秀的聲信號逡逑特征應(yīng)當(dāng)不受噪聲、環(huán)境和聲音衰減等因素的影響。逡逑目前針對聲信號特征提取方式主要是基于手工制作的時域,頻域特征。在時逡逑域特征方面,主要是基于聲信號的一些數(shù)學(xué)統(tǒng)計,如幅值、過零率、信號的能量逡逑等;在頻域特征方面
【參考文獻(xiàn)】
相關(guān)期刊論文 前3條
1 莊福振;羅平;何清;史忠植;;遷移學(xué)習(xí)研究進(jìn)展[J];軟件學(xué)報;2015年01期
2 賀玲玲;周元;;基于改進(jìn)MFCC的異常聲音識別算法[J];重慶工商大學(xué)學(xué)報(自然科學(xué)版);2012年02期
3 馬元鋒;陳克安;王娜;鄭文;;聽覺模型輸出譜特征在聲目標(biāo)識別中的應(yīng)用[J];聲學(xué)學(xué)報(中文版);2009年02期
本文編號:2738320
本文鏈接:http://sikaile.net/kejilunwen/xinxigongchenglunwen/2738320.html
最近更新
教材專著