基于神經(jīng)網(wǎng)絡(luò)的多通道語音端點(diǎn)檢測方法研究
發(fā)布時間:2021-09-17 19:55
語音端點(diǎn)檢測是語音信號處理中非常重要的一項預(yù)處理技術(shù),它的目標(biāo)是從語音信號中判斷出來語音部分和非語音部分,便于后續(xù)的語音信號處理的工作,比如語音識別、說話人識別。隨著人工智能研究領(lǐng)域的火熱,人機(jī)交互的頻繁,語音識別作為語音信號處理中十分重要的一項工作,有著非常廣闊的應(yīng)用前景,所以語音端點(diǎn)檢測技術(shù)的提高也被眾多研究者所重視,作為語音識別系統(tǒng)的第一步,語音端點(diǎn)檢測工作的效果是至關(guān)重要的。本文詳細(xì)介紹并實(shí)現(xiàn)了雙門限法、方差法和譜熵法這幾種最具代表性的傳統(tǒng)語音端點(diǎn)檢測算法。這些傳統(tǒng)信號處理方法,在較高信噪比的情況下,通過調(diào)整參數(shù)和閾值的辦法,可以得到很好的端點(diǎn)檢測效果,但通過實(shí)驗發(fā)現(xiàn),在不同類型的噪聲環(huán)境下,總體的魯棒性較差。針對以上問題,本文采用了深度神經(jīng)網(wǎng)絡(luò)和卷積神經(jīng)網(wǎng)絡(luò)作為分類模型,并結(jié)合麥克風(fēng)陣列采集到的多通道語音信號,分別將單通道、雙通道、五通道的語音信號提取特征之后作為分類模型的輸入,進(jìn)行了對比實(shí)驗。實(shí)驗所采用的是CHIME3語音數(shù)據(jù)集,噪聲環(huán)境分別是生活中常見的公交車,咖啡館,人行道和街區(qū)四個場景。通過對比實(shí)驗結(jié)果表明,將麥克風(fēng)陣列采集到的多通道語音信號作為輸入時可以有效的提升深...
【文章來源】:內(nèi)蒙古大學(xué)內(nèi)蒙古自治區(qū) 211工程院校
【文章頁數(shù)】:55 頁
【學(xué)位級別】:碩士
【部分圖文】:
漢明窗示意圖
圖2.2雙門限法實(shí)驗結(jié)果圖
方差法實(shí)驗結(jié)果圖
【參考文獻(xiàn)】:
期刊論文
[1]基于深度學(xué)習(xí)語音分離技術(shù)的研究現(xiàn)狀與進(jìn)展[J]. 劉文舉,聶帥,梁山,張學(xué)良. 自動化學(xué)報. 2016(06)
[2]改進(jìn)共振峰提取的語音端點(diǎn)檢測[J]. 宮朝輝,刁麓弘. 計算機(jī)輔助設(shè)計與圖形學(xué)學(xué)報. 2013(08)
[3]語音端點(diǎn)檢測技術(shù)研究進(jìn)展[J]. 韓立華,王博,段淑鳳. 計算機(jī)應(yīng)用研究. 2010(04)
[4]一種改進(jìn)的基于子帶譜熵的語音激活檢測方法[J]. 宋喆,張德民,張?zhí)祢U. 重慶郵電大學(xué)學(xué)報(自然科學(xué)版). 2009(06)
[5]支持向量機(jī)在語音激活檢測中的應(yīng)用研究[J]. 董恩清,趙鶴鳴,周亞同,張曉娣. 通信學(xué)報. 2003(03)
[6]一種語音段起止端點(diǎn)檢測新方法[J]. 李祖鵬,姚佩陽. 電訊技術(shù). 2000(03)
[7]噪聲環(huán)境中基于HMM模型的語音信號端點(diǎn)檢測方法[J]. 朱杰,韋曉東. 上海交通大學(xué)學(xué)報. 1998(10)
碩士論文
[1]數(shù)字助聽器中語音增強(qiáng)算法的研究[D]. 李斌.南京郵電大學(xué) 2017
[2]基于卷積神經(jīng)網(wǎng)絡(luò)的語音分離方法研究與實(shí)現(xiàn)[D]. 楊冰晴.內(nèi)蒙古大學(xué) 2017
[3]基于深度學(xué)習(xí)的單通道語音分離[D]. 李號.內(nèi)蒙古大學(xué) 2017
[4]語音端點(diǎn)檢測方法研究[D]. 張超.大連理工大學(xué) 2016
[5]基于卷積神經(jīng)網(wǎng)絡(luò)的語音端點(diǎn)檢測方法研究[D]. 王海旭.內(nèi)蒙古大學(xué) 2015
[6]麥克風(fēng)陣列語音增強(qiáng)算法的研究與DSP實(shí)現(xiàn)[D]. 王波.大連理工大學(xué) 2007
本文編號:3399394
【文章來源】:內(nèi)蒙古大學(xué)內(nèi)蒙古自治區(qū) 211工程院校
【文章頁數(shù)】:55 頁
【學(xué)位級別】:碩士
【部分圖文】:
漢明窗示意圖
圖2.2雙門限法實(shí)驗結(jié)果圖
方差法實(shí)驗結(jié)果圖
【參考文獻(xiàn)】:
期刊論文
[1]基于深度學(xué)習(xí)語音分離技術(shù)的研究現(xiàn)狀與進(jìn)展[J]. 劉文舉,聶帥,梁山,張學(xué)良. 自動化學(xué)報. 2016(06)
[2]改進(jìn)共振峰提取的語音端點(diǎn)檢測[J]. 宮朝輝,刁麓弘. 計算機(jī)輔助設(shè)計與圖形學(xué)學(xué)報. 2013(08)
[3]語音端點(diǎn)檢測技術(shù)研究進(jìn)展[J]. 韓立華,王博,段淑鳳. 計算機(jī)應(yīng)用研究. 2010(04)
[4]一種改進(jìn)的基于子帶譜熵的語音激活檢測方法[J]. 宋喆,張德民,張?zhí)祢U. 重慶郵電大學(xué)學(xué)報(自然科學(xué)版). 2009(06)
[5]支持向量機(jī)在語音激活檢測中的應(yīng)用研究[J]. 董恩清,趙鶴鳴,周亞同,張曉娣. 通信學(xué)報. 2003(03)
[6]一種語音段起止端點(diǎn)檢測新方法[J]. 李祖鵬,姚佩陽. 電訊技術(shù). 2000(03)
[7]噪聲環(huán)境中基于HMM模型的語音信號端點(diǎn)檢測方法[J]. 朱杰,韋曉東. 上海交通大學(xué)學(xué)報. 1998(10)
碩士論文
[1]數(shù)字助聽器中語音增強(qiáng)算法的研究[D]. 李斌.南京郵電大學(xué) 2017
[2]基于卷積神經(jīng)網(wǎng)絡(luò)的語音分離方法研究與實(shí)現(xiàn)[D]. 楊冰晴.內(nèi)蒙古大學(xué) 2017
[3]基于深度學(xué)習(xí)的單通道語音分離[D]. 李號.內(nèi)蒙古大學(xué) 2017
[4]語音端點(diǎn)檢測方法研究[D]. 張超.大連理工大學(xué) 2016
[5]基于卷積神經(jīng)網(wǎng)絡(luò)的語音端點(diǎn)檢測方法研究[D]. 王海旭.內(nèi)蒙古大學(xué) 2015
[6]麥克風(fēng)陣列語音增強(qiáng)算法的研究與DSP實(shí)現(xiàn)[D]. 王波.大連理工大學(xué) 2007
本文編號:3399394
本文鏈接:http://sikaile.net/kejilunwen/wltx/3399394.html
最近更新
教材專著