天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁(yè) > 科技論文 > 信息工程論文 >

聲信號(hào)時(shí)頻紋理表征與識(shí)別技術(shù)研究

發(fā)布時(shí)間:2021-08-27 03:29
  聲信號(hào)是重要的信息載體,通過(guò)聲信號(hào)來(lái)感知環(huán)境信息是機(jī)器聽覺領(lǐng)域中重要的研究?jī)?nèi)容之一。由于聲信號(hào)識(shí)別技術(shù)具有設(shè)備體積小、硬件成本低、工作過(guò)程中不受地形、角度和光線等條件限制優(yōu)點(diǎn)。因此,聲信號(hào)識(shí)別技術(shù)在安全監(jiān)管、醫(yī)療監(jiān)護(hù)、生態(tài)系統(tǒng)調(diào)查以及反恐防暴等領(lǐng)域均具有廣闊的發(fā)展前景。本文主要從聲信號(hào)的時(shí)頻紋理表征以及識(shí)別技術(shù)兩方面展開研究,論文的主要內(nèi)容如下:本文研究了音頻識(shí)別技術(shù)原理以及國(guó)內(nèi)外研究現(xiàn)狀,并根據(jù)本文研究對(duì)象的特點(diǎn)確立了聲信號(hào)識(shí)別技術(shù)的總體方案。首先,通過(guò)梅爾濾波器組以及Gammatone濾波器組等,仿人耳聽覺特性的濾波器組獲取聲信號(hào)的時(shí)頻紋理特征。針對(duì)單一時(shí)頻紋理特征無(wú)法完全表征聲信號(hào)在時(shí)頻域上演變過(guò)程的問題,進(jìn)一步提取了聲信號(hào)時(shí)頻紋理特征在時(shí)域以及頻域上的一階差分特征,獲取了聲信號(hào)能量在時(shí)頻域上的變化信息。并將三種特征結(jié)合起來(lái)形成了一種聲信號(hào)的多維時(shí)頻紋理特征,這種多維特征能夠更加有效地為識(shí)別模型提供不同類別聲信號(hào)間時(shí)頻特點(diǎn)的差異。其次,設(shè)計(jì)了用于提取聲信號(hào)高層次特征的卷積神經(jīng)網(wǎng)絡(luò)模型,針對(duì)時(shí)頻紋理特征維度信息不同的特點(diǎn),采用分離卷積的方式提取時(shí)頻紋理特征不同維度的高層次特征,構(gòu)建... 

【文章來(lái)源】:西南科技大學(xué)四川省

【文章頁(yè)數(shù)】:72 頁(yè)

【學(xué)位級(jí)別】:碩士

【部分圖文】:

聲信號(hào)時(shí)頻紋理表征與識(shí)別技術(shù)研究


聲信號(hào)分類示意圖

頻譜,基本流,信號(hào)


西南科技大學(xué)碩士學(xué)位論文62聲信號(hào)識(shí)別的理論研究2.1聲信號(hào)識(shí)別的基本原理如圖2-1所示,為聲信號(hào)識(shí)別的基本流程。聲信號(hào)識(shí)別的本質(zhì)是一個(gè)分類問題,屬于模式識(shí)別范疇。主要的識(shí)別過(guò)程可以分為兩個(gè)階段,第一個(gè)階段為訓(xùn)練階段,首先,獲取聲信號(hào)的時(shí)頻紋理特征信息,這種特征最好能夠表征不同聲信號(hào)各自的時(shí)頻特點(diǎn),從而達(dá)到易于區(qū)分不同目標(biāo)聲信號(hào)的目的;然后,使用獲取到的聲信號(hào)特征輸入識(shí)別模型進(jìn)行訓(xùn)練,讓模型能夠?qū)W習(xí)到不同聲信號(hào)各自的特點(diǎn),并使模型的參數(shù)達(dá)到最優(yōu)。第二個(gè)階段為測(cè)試階段,用訓(xùn)練完成的識(shí)別模型對(duì)聲信號(hào)進(jìn)行識(shí)別,得到最終的識(shí)別結(jié)果。圖2-1聲信號(hào)識(shí)別的基本流程本文在算法研究階段所使用的數(shù)據(jù)集主要為ESC數(shù)據(jù)集,ESC數(shù)據(jù)集主要包含ESC-50與ESC-10兩個(gè)數(shù)據(jù)集。ESC-50主要包含50類不同的聲信號(hào),由2000個(gè)音頻文件組成,每個(gè)音頻文件的長(zhǎng)度為5秒,主要分為5個(gè)大類:動(dòng)物聲、自然環(huán)境聲、非語(yǔ)音的人聲信號(hào)、室內(nèi)聲以及室外聲。ESC-10為ESC-50的子集,其中包含400個(gè)音頻,可分為10類:狗叫聲、雨聲、海浪聲、嬰兒哭泣聲、時(shí)鐘嘀嗒聲、噴嚏聲、直升機(jī)聲、電鋸聲、公雞叫聲以及火焰燃燒的爆裂聲。在進(jìn)行分類識(shí)別的過(guò)程中,僅對(duì)單一類別的聲源信號(hào)進(jìn)行識(shí)別,對(duì)于多類聲源產(chǎn)生的聲信號(hào)的混合識(shí)別情況并未進(jìn)行研究。如圖2-2(a)所示,為狗叫聲的頻譜,從中可看出其頻率成分主要集中在10kHz以下,狗叫聲的能量分布主要在5kHz以內(nèi)。如圖2-2(b)和2-2(c)所示,為雨聲與海浪聲的頻譜,二者在頻率成分在頻域內(nèi)的分布十分相似,與白噪聲相同都是布滿整個(gè)頻域,只是在頻域的不同頻段內(nèi)的幅度變化有所不同。如圖2-2(d)所示,嬰兒哭聲在頻域內(nèi)的分布主要集中在兩個(gè)部分,第一部分為6kHz~8kHz,第二部分為12kHz~15kHz。適中嘀嗒聲的頻?

頻譜,數(shù)據(jù)集中,頻譜,信號(hào)


2聲信號(hào)識(shí)別的理論研究7(a)狗叫聲(b)雨聲(c)海浪聲(d)嬰兒哭泣聲(e)時(shí)鐘嘀嗒聲(f)噴嚏聲圖2-2ESC數(shù)據(jù)集中6種聲信號(hào)的頻譜基于傳統(tǒng)機(jī)器學(xué)習(xí)算法的聲信號(hào)識(shí)別需要人工定義特征,然后對(duì)提取到的特征進(jìn)行人為的編碼與處理。雖然這種方式取得了一定的成果,但在定義特征的過(guò)程中需要大量的專家經(jīng)驗(yàn)以及實(shí)驗(yàn),需要耗費(fèi)大量的時(shí)間與精力。并且在此過(guò)程中還可能丟失關(guān)鍵信息而造成識(shí)別性能差的情況。對(duì)于一些差異較小的目標(biāo),想通過(guò)人工提取出具有區(qū)分度的特征更是困難重重。而現(xiàn)階段的深度學(xué)習(xí)算法可以通過(guò)多層次的線性與非線性運(yùn)算,提取出不同目標(biāo)的特征信息,并通過(guò)學(xué)習(xí)這些關(guān)鍵的特征信息用于區(qū)分不同的目標(biāo)。在使用深度學(xué)習(xí)網(wǎng)絡(luò)建立的識(shí)別模型之前,需要通過(guò)大量的數(shù)據(jù)進(jìn)行模型訓(xùn)練,通過(guò)這種方式達(dá)到使

【參考文獻(xiàn)】:
期刊論文
[1]Deep ESC網(wǎng)絡(luò)的環(huán)境聲分類方法研究[J]. 陰法明,王詩(shī)佳,趙力.  聲學(xué)技術(shù). 2019(05)
[2]低信噪比下公共場(chǎng)所異常聲音聲學(xué)特征提取[J]. 李偉紅,王偉冰,龔衛(wèi)國(guó).  聲學(xué)學(xué)報(bào). 2019(05)
[3]基于梅爾倒譜系數(shù)、深層卷積和Bagging的環(huán)境音分類方法[J]. 王天銳,鮑騫月,秦品樂.  計(jì)算機(jī)應(yīng)用. 2019(12)
[4]一種時(shí)頻平滑的深度神經(jīng)網(wǎng)絡(luò)語(yǔ)音增強(qiáng)方法[J]. 袁文浩,梁春燕,婁迎曦,房超,王志強(qiáng).  西安電子科技大學(xué)學(xué)報(bào). 2019(04)
[5]基于特征遷移的多物種鳥聲識(shí)別方法[J]. 劉昊天,姜海燕,舒欣,徐彥,伍艷蓮,郭小清.  數(shù)據(jù)采集與處理. 2017(06)
[6]基于深度學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)的孤立詞語(yǔ)音識(shí)別的研究[J]. 王山海,景新幸,楊海燕.  計(jì)算機(jī)應(yīng)用研究. 2015(08)
[7]基于Gammatone濾波器組的說(shuō)話人識(shí)別算法研究[J]. 茅正沖,王正創(chuàng),王丹.  計(jì)算機(jī)工程與應(yīng)用. 2015(01)
[8]深度學(xué)習(xí)研究綜述[J]. 孫志軍,薛磊,許陽(yáng)明,王正.  計(jì)算機(jī)應(yīng)用研究. 2012(08)
[9]公共場(chǎng)所典型異常聲音的特征提取[J]. 欒少文,龔衛(wèi)國(guó).  計(jì)算機(jī)工程. 2010(07)
[10]基于MFCC和短時(shí)能量混合的異常聲音識(shí)別算法[J]. 呂霄云,王宏霞.  計(jì)算機(jī)應(yīng)用. 2010(03)

博士論文
[1]復(fù)雜音頻的事件檢測(cè)與分類中的關(guān)鍵問題研究[D]. 冷嚴(yán).北京郵電大學(xué) 2012

碩士論文
[1]基于聲譜圖的音頻事件檢測(cè)特征提取研究[D]. 李英杰.北京郵電大學(xué) 2017



本文編號(hào):3365555

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/xinxigongchenglunwen/3365555.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶f69f1***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com