噪聲環(huán)境下的VAD檢測方法的研究
本文關(guān)鍵詞: 語音端點(diǎn)檢測 信噪比 倒譜距離 降噪自編碼器 出處:《新疆大學(xué)》2017年碩士論文 論文類型:學(xué)位論文
【摘要】:語音端點(diǎn)檢測(Voice Activity Detection,VAD)主要指的是檢測一段語音信號的起始點(diǎn)和終止點(diǎn),以便于分離有效的語音信號和無用的語音信號或者噪音信號,使得后續(xù)的處理更加有效率。它應(yīng)用非常廣泛,常用于語音識別系統(tǒng)、語音增強(qiáng)、語音編碼等任務(wù)上。當(dāng)前端點(diǎn)檢測的研究主要有兩個方向,其一就是通過閾值來進(jìn)行檢測,常用的方法有基于短時能量過零率的檢測、基于信息熵的檢測等。而另一種檢測方法是基于模式識別的檢測,常用的方法有常見的有基于隱馬爾科夫模型(Hidden Markov Model,HMM)的檢測、基于支持向量機(jī)的檢測等。語音端點(diǎn)檢測的檢測結(jié)果好壞對后續(xù)的語音處理起著決定性的作用。本文的研究主要是基于噪聲環(huán)境下的端點(diǎn)檢測方法的研究,由于在低信噪比下的傳統(tǒng)的檢測方法都存在檢測率不高的問題,因此本文首先對語音進(jìn)行預(yù)處理,實(shí)現(xiàn)語音的有效去噪,然后通過傳統(tǒng)的基于倒譜距離的檢測方法來進(jìn)行檢測,在降噪的過程中,本文應(yīng)用了最近幾年的研究熱點(diǎn)深度學(xué)習(xí)的知識,提出了將深度學(xué)習(xí)下的降噪自編碼器用于語音去噪,并取得了一定的效果。由于噪聲與語音信號之間的復(fù)雜關(guān)系,并且在我們的生活中,聲音常常受到的是加性噪聲的影響,因此本文重點(diǎn)研究了語音信號在不同噪聲不同信噪比下的檢測性能,實(shí)驗(yàn)選取了NOISE92噪聲庫中Factory、volvo以及white三種噪聲以及純凈語音庫TIMIT中部分語音數(shù)據(jù),同時合成不同噪聲類型下不同信噪比的帶噪語音,在實(shí)驗(yàn)中,合成了包含信噪比為-10d B到10d B之間的五種帶噪數(shù)據(jù),然后通過梯度下降法(gradient descent)來訓(xùn)練降噪自編碼器(Denoising Autoencoder,DAE),來實(shí)現(xiàn)對加噪之后的語音信號的重構(gòu),使其與原始純凈語音信號的誤差最小,從而實(shí)現(xiàn)降噪的目的,進(jìn)而通過倒譜距離的檢測方法來實(shí)現(xiàn)語音端點(diǎn)的檢測,從而提高低信噪比下端點(diǎn)檢測的正確率。實(shí)驗(yàn)結(jié)果表明,特別是在低信噪比條件下傳統(tǒng)的端點(diǎn)檢測方法正確率都是急劇下降,但是將本文提出的方法用于語音端點(diǎn)檢測時,其語音信號的檢測正確率明顯得到提升,尤其是在0dB以下的低信噪比情況下,相比傳統(tǒng)的檢測算法,其檢測正確率更高。
[Abstract]:Voice Activity Detection (VAD) mainly refers to the starting point and the terminating point of detecting a segment of speech signal. In order to separate the effective speech signal from the useless speech signal or noise signal, it makes the subsequent processing more efficient. It is widely used in speech recognition system and speech enhancement. In speech coding and other tasks, the current research on endpoint detection has two main directions, one is to detect by threshold, and the commonly used methods are based on short-time energy zero-crossing rate detection. Another detection method is based on pattern recognition, and the common methods are Hidden Markov Model based on Hidden Markov Model. HMM-). The detection results of speech endpoint detection play a decisive role in the subsequent speech processing based on support vector machine. The research of this paper is mainly based on the noise environment of endpoint detection methods. Because the detection rate is not high in the traditional detection methods under low SNR, the speech is preprocessed in this paper to achieve effective speech denoising. Then the traditional detection method based on cepstrum distance is used to detect. In the process of noise reduction, this paper applies the knowledge of hot spot depth learning in recent years. In this paper, the denoising self-encoder based on deep learning is applied to speech denoising, and some results are obtained. Because of the complex relationship between noise and speech signal, and in our daily life. The sound is often affected by additive noise, so this paper focuses on the detection performance of speech signals under different noise and different SNR. The Factory in the NOISE92 noise database is selected in the experiment. Three kinds of noises, volvo and white, as well as some speech data in pure speech corpus TIMIT, are synthesized with different signal-to-noise ratio (SNR) under different noise types. Five kinds of noisy data are synthesized with signal-to-noise ratio (SNR) of -10dB to 10dB. Then the noise reduction self-encoder is trained by gradient descent method (Denoising Autocoderdai). To realize the reconstruction of the speech signal after adding noise, so that the error between the speech signal and the original pure speech signal is minimized, so as to achieve the purpose of noise reduction, and then to realize the detection of speech endpoints through the detection method of cepstrum distance. The experimental results show that the accuracy of the traditional endpoint detection methods is decreased sharply, especially in the low SNR condition. However, when the proposed method is used in speech endpoint detection, the detection accuracy of speech signal is obviously improved, especially in the case of low SNR below 0 dB, compared with the traditional detection algorithm. The correct rate of detection is higher.
【學(xué)位授予單位】:新疆大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2017
【分類號】:TN912.3
【相似文獻(xiàn)】
相關(guān)期刊論文 前10條
1 趙果;潘世永;;端點(diǎn)檢測在嵌入式聲控?fù)芴柶髦械膽?yīng)用[J];兵工自動化;2007年02期
2 王亞濤,樸春俊,權(quán)花紫;強(qiáng)噪音情況下的多種端點(diǎn)檢測方法研究[J];信息技術(shù);2005年02期
3 鄺航宇,張軍,韋崗;一種基于檢測元音的孤立詞端點(diǎn)檢測算法[J];電聲技術(shù);2005年03期
4 方杰;李英;錢紅;;一種連續(xù)詞端點(diǎn)檢測的改進(jìn)方法[J];電聲技術(shù);2006年08期
5 李晉;王玲;;一種改進(jìn)的孤立詞端點(diǎn)檢測方法[J];計(jì)算機(jī)工程與應(yīng)用;2006年30期
6 何清波;孔凡讓;王建平;劉永斌;;基于獨(dú)立分量分析特征提取的帶噪信號端點(diǎn)檢測[J];數(shù)據(jù)采集與處理;2007年01期
7 董胡;錢盛友;;一種基于小波和時頻分解的端點(diǎn)檢測方法[J];微計(jì)算機(jī)信息;2007年30期
8 李亦佳;趙淳;;嵌入式平臺的復(fù)雜環(huán)境下端點(diǎn)檢測[J];電腦編程技巧與維護(hù);2008年17期
9 周娜;趙振東;張瑩;;背景噪聲下的端點(diǎn)檢測算法的研究[J];通信技術(shù);2008年07期
10 張亞歌;張?zhí)?夏川;;噪聲評估在端點(diǎn)檢測中的應(yīng)用[J];計(jì)算機(jī)技術(shù)與發(fā)展;2010年09期
相關(guān)會議論文 前8條
1 賈川;張健;陳振標(biāo);徐波;;噪聲環(huán)境下的端點(diǎn)檢測算法研究[A];第六屆全國人機(jī)語音通訊學(xué)術(shù)會議論文集[C];2001年
2 王卓;李鵬;蘇牧;徐波;;噪音環(huán)境下基于高階譜的端點(diǎn)檢測算法[A];第七屆全國人機(jī)語音通訊學(xué)術(shù)會議(NCMMSC7)論文集[C];2003年
3 王月;屈百達(dá);李金寶;蔣純剛;;一種改進(jìn)的基于頻帶方差的端點(diǎn)檢測算法[A];2007中國控制與決策學(xué)術(shù)年會論文集[C];2007年
4 尹巧萍;吳海寧;趙力;;含噪語音信號端點(diǎn)檢測方法的研究[A];2008’促進(jìn)中西部發(fā)展聲學(xué)學(xué)術(shù)交流會論文集[C];2008年
5 尹洪兵;秦斌;張凡;黃云森;;一種基于能量-過零率比的端點(diǎn)檢測方法[A];計(jì)算機(jī)技術(shù)與應(yīng)用進(jìn)展——全國第17屆計(jì)算機(jī)科學(xué)與技術(shù)應(yīng)用(CACIS)學(xué)術(shù)會議論文集(上冊)[C];2006年
6 國雁萌;潘接林;顏永紅;韓疆;張建平;;基于子帶能量的自適應(yīng)端點(diǎn)檢測[A];第七屆全國人機(jī)語音通訊學(xué)術(shù)會議(NCMMSC7)論文集[C];2003年
7 李曼曼;楊鴻武;洪寧;楊碩;劉亞麗;;基于EMD的帶噪語音端點(diǎn)檢測[A];第十一屆全國人機(jī)語音通訊學(xué)術(shù)會議論文集(一)[C];2011年
8 朱杰;韋曉東;;采用HMM模型方法進(jìn)行語音信號的端點(diǎn)檢測[A];1999年中國神經(jīng)網(wǎng)絡(luò)與信號處理學(xué)術(shù)會議論文集[C];1999年
相關(guān)重要報紙文章 前1條
1 中國科學(xué)院聲學(xué)研究所研究員 俞鐵城;語音的端點(diǎn)檢測和系統(tǒng)的打斷功能[N];通信產(chǎn)業(yè)報;2005年
相關(guān)博士學(xué)位論文 前1條
1 周文君;艦船VDR人聲識別技術(shù)研究[D];哈爾濱工程大學(xué);2009年
相關(guān)碩士學(xué)位論文 前10條
1 楊喜敬;帶噪漢、彝語孤立詞的端點(diǎn)檢測方法對比研究[D];昆明理工大學(xué);2015年
2 邢立釗;語音信號端點(diǎn)檢測算法的研究[D];鄭州大學(xué);2016年
3 沈蓉;智能門禁系統(tǒng)聲紋識別中端點(diǎn)檢測算法研究[D];西安科技大學(xué);2015年
4 吳品奇;音符識別算法研究[D];湖北工業(yè)大學(xué);2016年
5 張?jiān)妔,
本文編號:1465413
本文鏈接:http://sikaile.net/kejilunwen/xinxigongchenglunwen/1465413.html