面向聲音事件的特征提取與識(shí)別方法研究
發(fā)布時(shí)間:2021-01-22 13:17
由特定物理事件引起的聲波可以稱為聲音事件。對(duì)聲音事件的特征提取和識(shí)別,可以幫助我們確定聲音事件的類型,獲取環(huán)境信息,從而指導(dǎo)生產(chǎn)和生活。聲音事件識(shí)別過程分為特征提取和分類識(shí)別兩個(gè)部分,現(xiàn)在主流的特征提取方法以傳統(tǒng)語音特征為主,對(duì)聲音事件的特征提取缺乏針對(duì)性。此外,由于聲音事件受環(huán)境因素影響大,傳統(tǒng)的分類器或分類算法難以對(duì)復(fù)雜的聲音事件進(jìn)行特征挖掘,在分類問題中表現(xiàn)一般;谏窠(jīng)網(wǎng)絡(luò)的分類模型效果較好,然而對(duì)訓(xùn)練樣本的數(shù)量要求很高,難以在有限的數(shù)據(jù)集支撐下獲得良好的識(shí)別效果。為此,本文在對(duì)聲音特征提取與分類器設(shè)計(jì)的研究基礎(chǔ)上,提出將樣本擴(kuò)增和數(shù)據(jù)增強(qiáng)方法同時(shí)應(yīng)用到聲音事件識(shí)別中,為聲音事件分類識(shí)別研究提供一種新的方法。本文選取生活環(huán)境中常見的動(dòng)物的聲音、自然聲景和水聲、人類的非語音聲、室內(nèi)或家庭聲音、戶外或城市噪音等5大類50小類非語音聲音事件為主要研究對(duì)象,使用音頻錄音文件作為聲音數(shù)據(jù)集。本文在聲音事件識(shí)別基本原理的基礎(chǔ)上,設(shè)計(jì)了基于諧波分量和沖激分量分解的多種特征組合的特征表示方法,樣本擴(kuò)增和數(shù)據(jù)增強(qiáng)方法,以及基于殘差神經(jīng)網(wǎng)絡(luò)的聲音事件識(shí)別總體方案。首先對(duì)單通道音頻文件進(jìn)行諧波分量和...
【文章來源】: 李陽 電子科技大學(xué)
【文章頁數(shù)】:85 頁
【學(xué)位級(jí)別】:碩士
【部分圖文】:
原始音頻、諧波分量、沖激分量的時(shí)域圖
電子科技大學(xué)碩士學(xué)位論文22圖3-2原始音頻、諧波分量、沖激分量的時(shí)域圖圖3-3原始音頻、諧波分量、沖激分量的梅爾譜圖圖3-2和圖3-3分別為原始音頻經(jīng)HPSS后的時(shí)域圖和梅爾譜圖?梢钥吹浇(jīng)
電子科技大學(xué)碩士學(xué)位論文26圖3-6快速傅里葉變換點(diǎn)數(shù)為1024時(shí)的特征譜圖圖3-7快速傅里葉變換點(diǎn)數(shù)為2048時(shí)的特征譜圖可以看到,選取不同的窗長,在梅爾譜圖及其一階和二階差分圖的特征細(xì)節(jié)上有所區(qū)別,二者有共同之處,也存在信息的互補(bǔ)。
本文編號(hào):2993294
【文章來源】: 李陽 電子科技大學(xué)
【文章頁數(shù)】:85 頁
【學(xué)位級(jí)別】:碩士
【部分圖文】:
原始音頻、諧波分量、沖激分量的時(shí)域圖
電子科技大學(xué)碩士學(xué)位論文22圖3-2原始音頻、諧波分量、沖激分量的時(shí)域圖圖3-3原始音頻、諧波分量、沖激分量的梅爾譜圖圖3-2和圖3-3分別為原始音頻經(jīng)HPSS后的時(shí)域圖和梅爾譜圖?梢钥吹浇(jīng)
電子科技大學(xué)碩士學(xué)位論文26圖3-6快速傅里葉變換點(diǎn)數(shù)為1024時(shí)的特征譜圖圖3-7快速傅里葉變換點(diǎn)數(shù)為2048時(shí)的特征譜圖可以看到,選取不同的窗長,在梅爾譜圖及其一階和二階差分圖的特征細(xì)節(jié)上有所區(qū)別,二者有共同之處,也存在信息的互補(bǔ)。
本文編號(hào):2993294
本文鏈接:http://sikaile.net/kejilunwen/xinxigongchenglunwen/2993294.html
最近更新
教材專著