基于改進(jìn)語(yǔ)音特征與極限學(xué)習(xí)機(jī)的語(yǔ)音端點(diǎn)檢測(cè)
發(fā)布時(shí)間:2020-12-11 04:06
語(yǔ)音端點(diǎn)檢測(cè)(Voice Activity Detection,VAD),是指在給定語(yǔ)音信號(hào)幀中判別語(yǔ)音是否存在,魯棒的VAD有助于提高語(yǔ)音應(yīng)用的自動(dòng)化效率,例如語(yǔ)音增強(qiáng)、說話人識(shí)別、助聽器等.為了提高低信噪比下語(yǔ)音端點(diǎn)檢測(cè)的精度以及效率,提出了一種新的語(yǔ)音特征—低頻消噪能量(Low Frequency De-noising Energy,LFDE),將其應(yīng)用于VAD中,并利用LFDE與現(xiàn)有的聲學(xué)特征(梅爾頻率倒譜參數(shù)、共振峰頻率)結(jié)合訓(xùn)練極限學(xué)習(xí)機(jī)(Extreme Learning Machine, ELM)分類器.仿真實(shí)驗(yàn)發(fā)現(xiàn),端點(diǎn)檢測(cè)的精度與效率都有提高.
【文章來源】:微電子學(xué)與計(jì)算機(jī). 2020年03期 第37-41頁(yè) 北大核心
【文章頁(yè)數(shù)】:5 頁(yè)
【部分圖文】:
原始語(yǔ)音信號(hào)與具有5dB信噪比的噪聲語(yǔ)音信號(hào)波形
圖1 原始語(yǔ)音信號(hào)與具有5dB信噪比的噪聲語(yǔ)音信號(hào)波形使用移動(dòng)平均濾波器過濾之后,從LF對(duì)數(shù)能量譜減去HF平均對(duì)數(shù)能量譜,可以得到圖3,圖3中語(yǔ)音的起點(diǎn)與終點(diǎn)可以清晰地得出(閾值設(shè)置為0.05).
使用移動(dòng)平均濾波器過濾之后,從LF對(duì)數(shù)能量譜減去HF平均對(duì)數(shù)能量譜,可以得到圖3,圖3中語(yǔ)音的起點(diǎn)與終點(diǎn)可以清晰地得出(閾值設(shè)置為0.05).為了進(jìn)一步驗(yàn)證提出的特征對(duì)于VAD的效用,在圖1原始語(yǔ)音信號(hào)中添加了不同水平的噪聲,信噪比分別為15 dB、10 dB、3 dB和0 dB,測(cè)試結(jié)果如圖4所示,結(jié)果表明對(duì)于不同的低信噪比語(yǔ)音信號(hào),VAD結(jié)果幾乎相同,而當(dāng)信噪比小于5 dB時(shí),LFDE需要相應(yīng)的閾值來進(jìn)一步確定端點(diǎn),此時(shí)閾值設(shè)置為0.5,該方法性能良好.
【參考文獻(xiàn)】:
期刊論文
[1]基于Teager能量算子和經(jīng)驗(yàn)?zāi)B(tài)分解的語(yǔ)音端點(diǎn)檢測(cè)算法[J]. 沈希忠,鄭曉修. 電子與信息學(xué)報(bào). 2018(07)
[2]基于多特征融合與動(dòng)態(tài)閾值的語(yǔ)音端點(diǎn)檢測(cè)方法[J]. 朱春利,李昕. 計(jì)算機(jī)工程. 2019(02)
[3]基于共振峰諧波能量的語(yǔ)音端點(diǎn)檢測(cè)[J]. 劉紅星,戴蓓蒨,陸偉. 清華大學(xué)學(xué)報(bào)(自然科學(xué)版). 2008(S1)
本文編號(hào):2909879
【文章來源】:微電子學(xué)與計(jì)算機(jī). 2020年03期 第37-41頁(yè) 北大核心
【文章頁(yè)數(shù)】:5 頁(yè)
【部分圖文】:
原始語(yǔ)音信號(hào)與具有5dB信噪比的噪聲語(yǔ)音信號(hào)波形
圖1 原始語(yǔ)音信號(hào)與具有5dB信噪比的噪聲語(yǔ)音信號(hào)波形使用移動(dòng)平均濾波器過濾之后,從LF對(duì)數(shù)能量譜減去HF平均對(duì)數(shù)能量譜,可以得到圖3,圖3中語(yǔ)音的起點(diǎn)與終點(diǎn)可以清晰地得出(閾值設(shè)置為0.05).
使用移動(dòng)平均濾波器過濾之后,從LF對(duì)數(shù)能量譜減去HF平均對(duì)數(shù)能量譜,可以得到圖3,圖3中語(yǔ)音的起點(diǎn)與終點(diǎn)可以清晰地得出(閾值設(shè)置為0.05).為了進(jìn)一步驗(yàn)證提出的特征對(duì)于VAD的效用,在圖1原始語(yǔ)音信號(hào)中添加了不同水平的噪聲,信噪比分別為15 dB、10 dB、3 dB和0 dB,測(cè)試結(jié)果如圖4所示,結(jié)果表明對(duì)于不同的低信噪比語(yǔ)音信號(hào),VAD結(jié)果幾乎相同,而當(dāng)信噪比小于5 dB時(shí),LFDE需要相應(yīng)的閾值來進(jìn)一步確定端點(diǎn),此時(shí)閾值設(shè)置為0.5,該方法性能良好.
【參考文獻(xiàn)】:
期刊論文
[1]基于Teager能量算子和經(jīng)驗(yàn)?zāi)B(tài)分解的語(yǔ)音端點(diǎn)檢測(cè)算法[J]. 沈希忠,鄭曉修. 電子與信息學(xué)報(bào). 2018(07)
[2]基于多特征融合與動(dòng)態(tài)閾值的語(yǔ)音端點(diǎn)檢測(cè)方法[J]. 朱春利,李昕. 計(jì)算機(jī)工程. 2019(02)
[3]基于共振峰諧波能量的語(yǔ)音端點(diǎn)檢測(cè)[J]. 劉紅星,戴蓓蒨,陸偉. 清華大學(xué)學(xué)報(bào)(自然科學(xué)版). 2008(S1)
本文編號(hào):2909879
本文鏈接:http://sikaile.net/kejilunwen/wltx/2909879.html
最近更新
教材專著