基于小波包分解的MFCC在復雜環(huán)境聲音識別中的應用
發(fā)布時間:2021-06-16 09:25
在現(xiàn)今,人工智能的發(fā)展越來越快,聲音識別作為其中的一種技術自然也是逐漸成熟。但在復雜場景中會存在噪聲干擾而導致識別難度加大,而在這些場景(例如城市)中的聲音一般包含著許多信息,如何對于這部分聲音進行識別便成一個需要被克服的問題。在復雜場景下,面對形形色色的聲音更是對傳統(tǒng)聲音識別模型的一個極大的挑戰(zhàn)。本文采用了google的聲學數據集中存在的孩童玩鬧聲、狗吠聲、海浪聲、鳴笛聲、鏈鋸聲以及電鉆聲進行了識別分類,本文主要采用模板匹配法,以預處理、特征提取、模型分類識別的步驟進行聲音識別,其中預處理方面將通信技術中的能量檢測技術引入聲音識別領域;特征提取方面提出了一種基于小波包分解的MFCC特征提取方法;模型分類方面改良了卷積神經網絡模型針對一維的聲音信號的特征圖輸入方法,減少計算時間。本文主要做了以下工作:(1)在預處理方面,以聲音信號中的信號特性,對比信號檢測中的單節(jié)點頻譜感知算法中的單節(jié)點頻譜感知技術、匹配濾波檢測以及能量檢測,包括并不限于三者之間的難易程度、簡單程度以及優(yōu)缺點,最終采用能量檢測來進行預處理。能量檢測預處理方法將聲音當成信號處理,首先將目標信號輸入濾波器中,對通過濾波器的...
【文章來源】:南寧師范大學廣西壯族自治區(qū)
【文章頁數】:58 頁
【學位級別】:碩士
【部分圖文】:
ROC 特性曲線
具象地描述也就是本曲線與十字坐標軸所圍成地圖形面積大小,在指結論:好的識別方法需要盡量提高檢測概率的同時讓虛警概率和漏檢此需要做的就是在具體環(huán)境當中找到曲線上的一點使得其虛警概率較概率。
圖 2-6 自適應的能量檢測流程圖2.3 本章小結章介紹了在通信技術中的單節(jié)點頻譜感知技術,并注意介紹了其中的三種技術:檢測、匹配濾波檢測、能量檢測,并且逐一介紹了這三種的方法的檢測流程以及
【參考文獻】:
期刊論文
[1]基于多隨機森林的低信噪比聲音事件檢測[J]. 李應,印佳麗. 電子學報. 2018(11)
[2]基于卷積神經網絡的聲音場景識別[J]. 陳秋菊. 信息與電腦(理論版). 2018(18)
[3]淺析認知無線電的頻譜感知技術[J]. 張俊強. 現(xiàn)代信息科技. 2018(05)
[4]基于人耳掩蔽特性的語音增強數字助聽器研究[J]. 朱慧敏. 國外電子測量技術. 2018(05)
[5]基于聲紋識別技術的Android設備聲音功能自動化測試系統(tǒng)[J]. 李嘉偉,胡海龍,林志賢. 信息技術與網絡安全. 2018(05)
[6]基于BP神經網絡的音樂分類模型[J]. 劉明星. 現(xiàn)代電子技術. 2018(05)
[7]結合語音融合特征和隨機森林的構音障礙識別[J]. 李東,張雪英,段淑斐,閆密密. 西安電子科技大學學報. 2018(03)
[8]基于去噪技術的DSP語音識別系統(tǒng)設計[J]. 韋高梧,馮祖勇. 傳感器與微系統(tǒng). 2017(01)
[9]噪音環(huán)境下基于時-頻特征的生態(tài)環(huán)境聲音的分類(英文)[J]. 余清清. 計算機與數字工程. 2017(01)
[10]人工耳蝸的環(huán)境聲識別研究[J]. 張曉薇,孟慶林,唐國芳,鄭能恒,李霞. 聲學學報. 2016(06)
碩士論文
[1]噪聲環(huán)境下說話人識別的魯棒性研究[D]. 張洪冉.南京郵電大學 2018
[2]基于卷積神經網絡的歌唱語音識別[D]. 吳興銓.西南科技大學 2018
[3]基于聽覺特性卷積神經網絡的音樂分類方法研究[D]. 李增.華南理工大學 2018
[4]基于卷積神經網絡的異常音頻事件檢測的研究[D]. 胡濤.安徽大學 2018
[5]噪聲環(huán)境下基于深度學習的語音識別研究[D]. 李翔.武漢工程大學 2017
[6]說話人聲紋識別的算法研究[D]. 李灣灣.浙江大學 2017
[7]基于聲音信號處理的農業(yè)蟲害識別系統(tǒng)[D]. 賈琪.山東大學 2016
[8]小波去噪和概率神經網絡在發(fā)動機聲信號識別中的應用[D]. 闞磊.重慶大學 2016
[9]行車噪聲環(huán)境下的快速聲學事件檢測方法研究[D]. 朱強華.哈爾濱工業(yè)大學 2014
[10]復雜環(huán)境下高效端點檢測算法研究及應用[D]. 雷文鈿.廈門大學 2014
本文編號:3232817
【文章來源】:南寧師范大學廣西壯族自治區(qū)
【文章頁數】:58 頁
【學位級別】:碩士
【部分圖文】:
ROC 特性曲線
具象地描述也就是本曲線與十字坐標軸所圍成地圖形面積大小,在指結論:好的識別方法需要盡量提高檢測概率的同時讓虛警概率和漏檢此需要做的就是在具體環(huán)境當中找到曲線上的一點使得其虛警概率較概率。
圖 2-6 自適應的能量檢測流程圖2.3 本章小結章介紹了在通信技術中的單節(jié)點頻譜感知技術,并注意介紹了其中的三種技術:檢測、匹配濾波檢測、能量檢測,并且逐一介紹了這三種的方法的檢測流程以及
【參考文獻】:
期刊論文
[1]基于多隨機森林的低信噪比聲音事件檢測[J]. 李應,印佳麗. 電子學報. 2018(11)
[2]基于卷積神經網絡的聲音場景識別[J]. 陳秋菊. 信息與電腦(理論版). 2018(18)
[3]淺析認知無線電的頻譜感知技術[J]. 張俊強. 現(xiàn)代信息科技. 2018(05)
[4]基于人耳掩蔽特性的語音增強數字助聽器研究[J]. 朱慧敏. 國外電子測量技術. 2018(05)
[5]基于聲紋識別技術的Android設備聲音功能自動化測試系統(tǒng)[J]. 李嘉偉,胡海龍,林志賢. 信息技術與網絡安全. 2018(05)
[6]基于BP神經網絡的音樂分類模型[J]. 劉明星. 現(xiàn)代電子技術. 2018(05)
[7]結合語音融合特征和隨機森林的構音障礙識別[J]. 李東,張雪英,段淑斐,閆密密. 西安電子科技大學學報. 2018(03)
[8]基于去噪技術的DSP語音識別系統(tǒng)設計[J]. 韋高梧,馮祖勇. 傳感器與微系統(tǒng). 2017(01)
[9]噪音環(huán)境下基于時-頻特征的生態(tài)環(huán)境聲音的分類(英文)[J]. 余清清. 計算機與數字工程. 2017(01)
[10]人工耳蝸的環(huán)境聲識別研究[J]. 張曉薇,孟慶林,唐國芳,鄭能恒,李霞. 聲學學報. 2016(06)
碩士論文
[1]噪聲環(huán)境下說話人識別的魯棒性研究[D]. 張洪冉.南京郵電大學 2018
[2]基于卷積神經網絡的歌唱語音識別[D]. 吳興銓.西南科技大學 2018
[3]基于聽覺特性卷積神經網絡的音樂分類方法研究[D]. 李增.華南理工大學 2018
[4]基于卷積神經網絡的異常音頻事件檢測的研究[D]. 胡濤.安徽大學 2018
[5]噪聲環(huán)境下基于深度學習的語音識別研究[D]. 李翔.武漢工程大學 2017
[6]說話人聲紋識別的算法研究[D]. 李灣灣.浙江大學 2017
[7]基于聲音信號處理的農業(yè)蟲害識別系統(tǒng)[D]. 賈琪.山東大學 2016
[8]小波去噪和概率神經網絡在發(fā)動機聲信號識別中的應用[D]. 闞磊.重慶大學 2016
[9]行車噪聲環(huán)境下的快速聲學事件檢測方法研究[D]. 朱強華.哈爾濱工業(yè)大學 2014
[10]復雜環(huán)境下高效端點檢測算法研究及應用[D]. 雷文鈿.廈門大學 2014
本文編號:3232817
本文鏈接:http://sikaile.net/kejilunwen/xinxigongchenglunwen/3232817.html
最近更新
教材專著