天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁(yè) > 科技論文 > 自動(dòng)化論文 >

基于卷積神經(jīng)網(wǎng)絡(luò)的聲音分類方法研究

發(fā)布時(shí)間:2022-01-05 12:11
  聲音分類是多媒體信息處理中的基礎(chǔ)性研究工作,是聲音數(shù)據(jù)結(jié)構(gòu)化的核心技術(shù),在信號(hào)處理、語(yǔ)音識(shí)別等領(lǐng)域都有著重要的研究意義,眾多領(lǐng)域?qū)τ诟咝阅艿穆曇舴诸愊到y(tǒng)有著迫切的需求。近年來(lái),隨著深度學(xué)習(xí)技術(shù)的發(fā)展,深度神經(jīng)網(wǎng)絡(luò)與音頻數(shù)據(jù)處理分析的結(jié)合成為了新的研究熱點(diǎn),尤其是具有代表性的卷積神經(jīng)網(wǎng)絡(luò)在聲音分類任務(wù)上取得了顯著成效。本文基于卷積神經(jīng)網(wǎng)絡(luò)模型對(duì)聲音分類方法進(jìn)行研究。首先,本文針對(duì)現(xiàn)有方法難以從音頻數(shù)據(jù)中提取強(qiáng)區(qū)分度特征的問(wèn)題,提出了一種帶特征融合機(jī)制的多尺度時(shí)域卷積網(wǎng)絡(luò)模型(WaveMsNet)。我們分析了卷積神經(jīng)網(wǎng)絡(luò)在波形信號(hào)提取中存在的兩難問(wèn)題,即無(wú)法使卷積核分布在全頻帶上的同時(shí)提高特征頻率分別率,在這種問(wèn)題下,我們通過(guò)網(wǎng)絡(luò)提取的特征總是不能很好的表達(dá)音頻信息,為此我們提出一種多尺度時(shí)域卷積操作用于增加特征的區(qū)分度。同時(shí)我們還提出了一種特征融合方法,將網(wǎng)絡(luò)提取的波形特征和二維時(shí)頻特征在同一個(gè)網(wǎng)絡(luò)中進(jìn)行有效融合。在聲音分類公開數(shù)據(jù)集ESC-10和ESC-50上,多尺度時(shí)域卷積操作可以使分類準(zhǔn)確度平均提升1.95%和2.82%,在加入特征融合方法以后我們?nèi)〉昧吮戎肮ぷ鞲叩姆诸愋阅堋F?.. 

【文章來(lái)源】:國(guó)防科技大學(xué)湖南省 211工程院校 985工程院校

【文章頁(yè)數(shù)】:73 頁(yè)

【學(xué)位級(jí)別】:碩士

【部分圖文】:

基于卷積神經(jīng)網(wǎng)絡(luò)的聲音分類方法研究


圖2.4?LSTM和GRU網(wǎng)絡(luò)結(jié)構(gòu)??

模型圖,雙隨機(jī)過(guò)程,隱馬爾科夫模型,分類器


國(guó)防科技太學(xué)研究生院碩士學(xué)位論文??練模型,即如何更新模型參數(shù)。問(wèn)題(1)可以由前向算法或者后向算法解決,問(wèn)??題(2)是典型的狀態(tài)空間搜索問(wèn)題,經(jīng)典的算法有Viterbi、A*和Beam?Search等??算法,他們都利用了動(dòng)態(tài)規(guī)劃的思想;問(wèn)題(3)是統(tǒng)計(jì)學(xué)習(xí)過(guò)程,經(jīng)典算法包括??Baum-Welch、梯度算法等。??

特征圖,卷積,二維,特征圖


)??convolutionaL?Layer??i—I ̄1 ̄t—l ̄L-4—J—?80?filters?(1x3)??、、'?\?\?*??no?dropout?...?max-pooling??(1x3,?stride?1x3)??_〇u_?-—???????fs〇rLsd??dropout?50%?-?,?CD???fully?connected??(5000?ReLUs)??C^)?output?layer??l'r?(#?of?classes)??圖2.6用于聲會(huì)分類的二維卷積神經(jīng)網(wǎng)絡(luò)示例??值得注意的是,在上面的方法中雖然使用了二維特征圖作為特征,但是和??RGB圖像是有E別的,時(shí)頻特征一般是單通道的,無(wú)需考慮色彩、明晴等因素。??Shahiri等人[44]將生成的頻譜圖完全當(dāng)做圖像來(lái)處理,文中完全采用計(jì)算機(jī)視覺(jué)中??對(duì)待圖片的方式來(lái)使用AlexNet、VGG等網(wǎng)絡(luò)結(jié)構(gòu)對(duì)音頻進(jìn)行分類,還對(duì)比了使??用不同顏色(Color?Map)的頻譜圖對(duì)于分類性能的影響。??2.4.2膨脹卷積模型??y(i,?...?1〇)?'?i?i?i?I?i?I?i?i?1?y{i.…,1〇)?'?i?i?i?????t??口?□口???;■?————??:corv3,1?afe?b?■■?j?conv3,1-D2?r-^-|?—j^i??.?:'nn…n.?:'[=zr.?va:?D'?"'?卜?i?r?i?i?i.?..i?丨■?i?i?i?i?t?i??CNN?pool^Z?K?l\?!?CNN!?pool2,1?KN\??丨二-廣丁上―廣「-丟i.?■?i

【參考文獻(xiàn)】:
期刊論文
[1]基于高斯混合模型的自然環(huán)境聲音的識(shí)別[J]. 余清清,李應(yīng),李勇.  計(jì)算機(jī)工程與應(yīng)用. 2011(25)
[2]基于隱馬爾可夫模型的音頻自動(dòng)分類[J]. 盧堅(jiān),陳毅松,孫正興,張福炎.  軟件學(xué)報(bào). 2002(08)



本文編號(hào):3570326

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/zidonghuakongzhilunwen/3570326.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶c025e***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com