天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁 > 科技論文 > 自動(dòng)化論文 >

聲音事件分類與檢測的半監(jiān)督學(xué)習(xí)方法研究

發(fā)布時(shí)間:2021-01-20 20:27
  聲音事件檢測是對(duì)一段音頻檢測包含的聲音事件和發(fā)生位置的技術(shù),聲音事件分類則只需獲得事件類別信息。這一技術(shù)是獲取周圍環(huán)境信息不可缺少的手段,特別在某些特定環(huán)境,例如黑暗環(huán)境,有著獨(dú)特的優(yōu)勢。近年來,隨著Google發(fā)布大型音頻事件數(shù)據(jù)集AudioSet,聲音事件檢測使用神經(jīng)網(wǎng)絡(luò)變成了可能,越來越多的研究者開始關(guān)注這一方向,聲音事件檢測的發(fā)展迎來了新局面。但是,不可否認(rèn),聲音事件檢測還面臨許多困難。一方面,聲音事件的復(fù)雜多變,甚至?xí)霈F(xiàn)同一時(shí)刻發(fā)生多個(gè)事件的情況,這無疑對(duì)檢測系統(tǒng)提出了很高的要求。另一方面,具有完善標(biāo)簽的數(shù)據(jù)集代價(jià)昂貴,很難獲得,AudioSet是只含有事件類別的弱標(biāo)簽數(shù)據(jù)集,利用這樣的數(shù)據(jù)甚至是無標(biāo)簽數(shù)據(jù)得到可用的檢測系統(tǒng)也是一項(xiàng)極具挑戰(zhàn)性的任務(wù)。如今聲音事件檢測技術(shù)還出初步發(fā)展階段,距離真正實(shí)用的成熟系統(tǒng)還有許多問題亟待解決。本文主要針對(duì)上述兩個(gè)難點(diǎn)進(jìn)行研究,首先搭建基于卷積循環(huán)神經(jīng)網(wǎng)絡(luò)(Convolutional Recurrent Neural Network,CRNN)的聲音事件分類與檢測系統(tǒng),該系統(tǒng)使用弱標(biāo)簽數(shù)據(jù)進(jìn)行訓(xùn)練。在此基礎(chǔ)上,為提取更加具有區(qū)分性的特征引... 

【文章來源】:中國科學(xué)技術(shù)大學(xué)安徽省 211工程院校 985工程院校

【文章頁數(shù)】:64 頁

【學(xué)位級(jí)別】:碩士

【部分圖文】:

聲音事件分類與檢測的半監(jiān)督學(xué)習(xí)方法研究


圖1.2聲音事件分類與檢測系統(tǒng)流程??

激活函數(shù)


??x?_?-x??tanh(jc)?=?—?(2.2)??ex?+e'x??ReLU(jc)?=?max(jc,0)??sigm?tanh?ReLU??2i??2.??2.?-T.??1?.一?」?1?—?1?/??_,?/??〇?o?〇?????y??-1?-1?—^?-1??-2????????**2?????-?-???-2??"-—??????-2-1012?-2-1012?-2-1012??圖2.1常用激活函數(shù)??10??

動(dòng)量,卷積,神經(jīng)網(wǎng)絡(luò)


?第2章聲音事件分類與檢測研宄理論基礎(chǔ)???度下降算法,減少網(wǎng)絡(luò)學(xué)習(xí)的震蕩效應(yīng),收斂速度快,收斂性更好。??圖2.2內(nèi)斯特洛特動(dòng)量??2.?1.2卷積神經(jīng)網(wǎng)絡(luò)??卷積神經(jīng)網(wǎng)絡(luò)是深度學(xué)習(xí)領(lǐng)域性能強(qiáng)大的網(wǎng)絡(luò)之一,在物體檢測,語音識(shí)??別等領(lǐng)域大放異彩,取得許多令人矚目的成就。1962年,Hubei以及Wiesel[59]??通過對(duì)貓的視覺系統(tǒng)研宄提出視網(wǎng)膜是通過多層次感受野激發(fā)將視覺信息傳遞??到大腦,基于此提出感受野的概念,這對(duì)卷積神經(jīng)網(wǎng)絡(luò)的出現(xiàn)有著重要的意義。??1980年,日本研究者Fukushima[60]依據(jù)此研宄理論提出神經(jīng)認(rèn)知機(jī),將視覺系??統(tǒng)模型化,被認(rèn)為是早期卷積神經(jīng)網(wǎng)絡(luò)。到上世紀(jì)九十年代,深度學(xué)習(xí)三巨頭??之一YanLeCUn[61]提出LeNet,其是對(duì)手寫字元識(shí)別分類的卷積神經(jīng)網(wǎng)絡(luò),正??確率高達(dá)98°/。,在美國金融領(lǐng)域中成功投入使用,用來識(shí)別美國,加拿大約10%??的支票。Yan?LeCun也被稱為是卷積神經(jīng)網(wǎng)絡(luò)之父,為卷積神經(jīng)網(wǎng)絡(luò)爆發(fā)式的??研究與應(yīng)用奠定基矗進(jìn)入新世紀(jì),出現(xiàn)了?AlexNet[62],VGG[63],??GoogleNet[64],?ResNet[65],?DenseNet[66]等一系列基于卷積神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu),??極大地促進(jìn)其商業(yè)化應(yīng)用,走入人們的生活。??C3:?f.?maps?16@10x10??INP丨丨T?C1:?feature?maps?S4:f.?maps?16@5x5??32x32?一'?f|L???w????圓111?,.....―…麗??i?Fuil?connection?Gaussian?connections??Convolutio


本文編號(hào):2989731

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/zidonghuakongzhilunwen/2989731.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶4c5ca***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com