復(fù)雜噪聲環(huán)境下語(yǔ)音端點(diǎn)的檢測(cè)算法的研究
本文選題:語(yǔ)音端點(diǎn)檢測(cè) + 語(yǔ)音增強(qiáng)。 參考:《東華大學(xué)》2016年碩士論文
【摘要】:語(yǔ)音端點(diǎn)檢測(cè)是語(yǔ)音分析、語(yǔ)音合成和語(yǔ)音識(shí)別中的一個(gè)必要環(huán)節(jié)。盡管語(yǔ)音端點(diǎn)檢測(cè)技術(shù)在安靜的環(huán)境中已經(jīng)達(dá)到了令人鼓舞的準(zhǔn)確率,但是在實(shí)際應(yīng)用時(shí)由于噪聲的引入和環(huán)境的改變通常會(huì)使系統(tǒng)性能顯著下降。語(yǔ)音端點(diǎn)檢測(cè)技術(shù)要走向?qū)嵱?就必須克服魯棒性問(wèn)題,因此低信噪比噪聲環(huán)境下的語(yǔ)音端點(diǎn)檢測(cè)技術(shù)的意義非常重要。本文以應(yīng)用型語(yǔ)音端點(diǎn)檢測(cè)技術(shù)為目標(biāo),以系統(tǒng)魯棒性為研究重點(diǎn),對(duì)噪聲環(huán)境下的孤立詞和連續(xù)語(yǔ)句的端點(diǎn)檢測(cè)的各個(gè)方面都做了深入的研究。通過(guò)對(duì)魯棒性語(yǔ)音端點(diǎn)檢測(cè)的系統(tǒng)研究和實(shí)驗(yàn),本文形成了一套完整的復(fù)雜噪聲環(huán)境下的語(yǔ)音端點(diǎn)的檢測(cè)研究體系,包括了語(yǔ)音數(shù)據(jù)庫(kù)的建立、自適應(yīng)濾波算法、基于分類標(biāo)準(zhǔn)的延遲分割策略等,并在此基礎(chǔ)上構(gòu)建了一套完整的語(yǔ)音端點(diǎn)檢測(cè)系統(tǒng)。其具體的研究成果包括以下幾個(gè)方面:⑴端點(diǎn)檢測(cè)實(shí)驗(yàn)系統(tǒng)深入研究語(yǔ)音信號(hào)數(shù)學(xué)模型和不同語(yǔ)音信號(hào)的特征值及提取,收集到了TIMIT標(biāo)準(zhǔn)純凈語(yǔ)音庫(kù)和NOISEX-92標(biāo)準(zhǔn)噪聲庫(kù),給出了噪聲的度量標(biāo)準(zhǔn),建立了混噪語(yǔ)音平臺(tái),保證了后期實(shí)驗(yàn)的可重復(fù)性。⑵語(yǔ)音增強(qiáng)算法針對(duì)常規(guī)的自適應(yīng)濾波算法在收斂速度和穩(wěn)定精度以及計(jì)算復(fù)雜度上不可協(xié)調(diào)性,引入了歐式搜索算法,對(duì)算法做了多處改進(jìn),降低計(jì)算精度,大大改善了收斂速度和穩(wěn)定性,經(jīng)過(guò)對(duì)比實(shí)驗(yàn)驗(yàn)證其性能接近RLS算法,而其計(jì)算量卻小很多。在MOS和SNR評(píng)價(jià)方法中,也獲得了較高的表現(xiàn)。⑶端點(diǎn)檢測(cè)算法詳細(xì)地分析了常用的雙門(mén)限端點(diǎn)檢測(cè)方法、基于譜熵的端點(diǎn)檢測(cè)算法和基于分形理論的端點(diǎn)檢測(cè)算法。引入了排列熵,一種作為非線性動(dòng)力學(xué)參數(shù)能夠很好的表示出語(yǔ)音信號(hào)的非線性特征。提出了一種延遲分割策略:以能頻比為特征參數(shù)確定粗端點(diǎn),并在此基礎(chǔ)上使用排列熵差分算法確定精確端點(diǎn),以精確端點(diǎn)為起始點(diǎn)分割語(yǔ)音信號(hào),對(duì)所得到的語(yǔ)音片段信號(hào)按照分類標(biāo)準(zhǔn)消除噪聲信號(hào)帶來(lái)的錯(cuò)誤分割。⑷系統(tǒng)實(shí)現(xiàn)利用Matlab GUI工具實(shí)現(xiàn)整個(gè)端點(diǎn)檢測(cè)系統(tǒng)界面,利用第二章的語(yǔ)音數(shù)據(jù)庫(kù)開(kāi)展端點(diǎn)檢測(cè)不同方法的對(duì)比試驗(yàn)。實(shí)驗(yàn)表明文中提出的方法比基于常規(guī)的雙門(mén)限、譜熵的方法有更好的檢測(cè)效果,特別是在低信噪比的情況下,基本能達(dá)到基于分形的方法效果。但是加上濾波效果后文中的方案的效果遠(yuǎn)超其他方法。同時(shí)由于排列熵算法的簡(jiǎn)單易實(shí)現(xiàn),算法的實(shí)時(shí)性表現(xiàn)非常好,其計(jì)算的復(fù)雜度遠(yuǎn)小于分形方法。
[Abstract]:Speech endpoint detection is a necessary link in speech analysis, speech synthesis and speech recognition. Although the speech endpoint detection technology has achieved encouraging accuracy in quiet environments, the performance of the system usually decreases significantly due to the introduction of noise and the change of environment in practical applications. If the speech endpoint detection technology is to be practical, it must overcome the problem of robustness, so the significance of speech endpoint detection in low SNR noise environment is very important. In this paper, the application of speech endpoint detection technology as the target, system robustness as the focus of the study, isolated words and continuous sentences in noisy environment of all aspects of endpoint detection have been deeply studied. Through the systematic research and experiment of robust speech endpoint detection, a complete research system of speech endpoint detection in complex noise environment is formed, including the establishment of speech database and adaptive filtering algorithm. A complete speech endpoint detection system is constructed on the basis of delay segmentation strategy based on classification standard. The concrete research results include the following aspects: 1: 1 Endpoint Detection experiment system deeply studies the mathematical model of speech signal and the characteristic value and extraction of different speech signal, collects the pure speech database of TIMIT standard and the noise database of NOISEX-92 standard. In this paper, the noise measurement criterion is given, and the speech mixing platform is established, which ensures that the repeatable .2 speech enhancement algorithm in the later experiment can not coordinate the convergence speed, stability accuracy and computational complexity of the conventional adaptive filtering algorithm in view of the convergence rate, stability accuracy and computational complexity of the conventional adaptive filtering algorithm. The Euclidean search algorithm is introduced. The algorithm is improved in many ways to reduce the accuracy and improve the convergence speed and stability. The performance of the Euclidean search algorithm is close to that of the RLS algorithm, but the computational complexity is much smaller than that of the Euclidean search algorithm. Among the evaluation methods of MOS and SNR, a high performance 3 endpoint detection algorithm is obtained. The commonly used double threshold endpoint detection methods, the spectral entropy based endpoint detection algorithm and the fractal theory based endpoint detection algorithm are analyzed in detail. The permutation entropy is introduced. As a nonlinear dynamic parameter, the nonlinear characteristic of speech signal can be well expressed. In this paper, a delay segmentation strategy is proposed, in which the coarse endpoints are determined with the energy / frequency ratio as the characteristic parameters, and the accurate endpoints are determined by the permutation entropy difference algorithm, and the speech signals are segmented with the precise endpoints as the starting point. Using Matlab GUI tool to realize the interface of the whole endpoint detection system, the error segmentation of the speech segment signal is eliminated according to the classification standard. The comparison experiment of different methods of endpoint detection is carried out by using the voice database in Chapter 2. Experiments show that the proposed method is more effective than the conventional two-threshold method, especially in the case of low signal-to-noise ratio (SNR). But the effect of the scheme after the filtering effect is far higher than other methods. Because the permutation entropy algorithm is simple and easy to realize, the real-time performance of the algorithm is very good, and the complexity of the algorithm is much less than that of fractal method.
【學(xué)位授予單位】:東華大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2016
【分類號(hào)】:TN912.3
【相似文獻(xiàn)】
相關(guān)期刊論文 前10條
1 陳鳳翥;;基于熵的語(yǔ)音端點(diǎn)檢測(cè)方法探討[J];技術(shù)與市場(chǎng);2008年09期
2 雷鳴;李學(xué)仁;李果;;飛機(jī)艙音背景聲下的魯棒語(yǔ)音端點(diǎn)檢測(cè)[J];振動(dòng)與沖擊;2008年10期
3 韓立華;王博;段淑鳳;;語(yǔ)音端點(diǎn)檢測(cè)技術(shù)研究進(jìn)展[J];計(jì)算機(jī)應(yīng)用研究;2010年04期
4 果永振,何遵文;一種多特征語(yǔ)音端點(diǎn)檢測(cè)算法及實(shí)現(xiàn)[J];通信技術(shù);2003年01期
5 劉鵬,王作英;多模式語(yǔ)音端點(diǎn)檢測(cè)[J];清華大學(xué)學(xué)報(bào)(自然科學(xué)版);2005年07期
6 劉曉明,覃勝,劉宗行,江澤佳;語(yǔ)音端點(diǎn)檢測(cè)的仿真研究[J];系統(tǒng)仿真學(xué)報(bào);2005年08期
7 茹海峰,殷業(yè);基于與圖像相結(jié)合的語(yǔ)音端點(diǎn)檢測(cè)方法研究[J];儀器儀表學(xué)報(bào);2005年S1期
8 張?jiān)?韓子丹;戴志強(qiáng);;普通話孤立詞語(yǔ)音端點(diǎn)檢測(cè)的分形維方法研究[J];中國(guó)傳媒大學(xué)學(xué)報(bào)(自然科學(xué)版);2006年01期
9 趙高峰;張雪英;侯雪梅;;一種基于小波系數(shù)方差的語(yǔ)音端點(diǎn)檢測(cè)方法[J];太原理工大學(xué)學(xué)報(bào);2006年05期
10 沈亞強(qiáng);;低信噪比下基于短時(shí)分形維數(shù)的語(yǔ)音端點(diǎn)檢測(cè)[J];儀器儀表學(xué)報(bào);2006年S3期
相關(guān)會(huì)議論文 前10條
1 王明;劉好新;張歆奕;;一種基于時(shí)頻方差和的語(yǔ)音端點(diǎn)檢測(cè)方法研究[A];教育部中南地區(qū)高等學(xué)校電子電氣基礎(chǔ)課教學(xué)研究會(huì)第二十屆學(xué)術(shù)年會(huì)會(huì)議論文集(下冊(cè))[C];2010年
2 楊雅婷;馬博;王磊;吐?tīng)柡椤の崴韭?李曉;;基于聲頻特征的維吾爾語(yǔ)語(yǔ)音端點(diǎn)檢測(cè)方法[A];第五屆全國(guó)青年計(jì)算語(yǔ)言學(xué)研討會(huì)論文集[C];2010年
3 李軍;張兆寧;王旭芳;;一種強(qiáng)噪聲背景下的語(yǔ)音端點(diǎn)檢測(cè)方法[A];全國(guó)第二屆信號(hào)處理與應(yīng)用學(xué)術(shù)會(huì)議?痆C];2008年
4 茹海峰;殷業(yè);;基于與圖像相結(jié)合的語(yǔ)音端點(diǎn)檢測(cè)方法研究[A];第三屆全國(guó)信息獲取與處理學(xué)術(shù)會(huì)議論文集[C];2005年
5 張曉雷;吳及;呂萍;;基于支持向量機(jī)與多觀測(cè)復(fù)合特征矢量的語(yǔ)音端點(diǎn)檢測(cè)[A];第十一屆全國(guó)人機(jī)語(yǔ)音通訊學(xué)術(shù)會(huì)議論文集(二)[C];2011年
6 張曉雷;吳及;呂萍;;基于支持向量機(jī)與多觀測(cè)復(fù)合特征矢量的語(yǔ)音端點(diǎn)檢測(cè)[A];第十一屆全國(guó)人機(jī)語(yǔ)音通訊學(xué)術(shù)會(huì)議論文集(一)[C];2011年
7 劉婕;高鴻斌;王潔;;噪聲環(huán)境下基于關(guān)聯(lián)維的語(yǔ)音端點(diǎn)檢測(cè)(英文)[A];計(jì)算機(jī)技術(shù)與應(yīng)用進(jìn)展·2007——全國(guó)第18屆計(jì)算機(jī)技術(shù)與應(yīng)用(CACIS)學(xué)術(shù)會(huì)議論文集[C];2007年
8 李建民;方棣棠;;語(yǔ)音端點(diǎn)檢測(cè)中門(mén)限閾值的自動(dòng)確定及音節(jié)切割的新判據(jù)[A];第一屆全國(guó)語(yǔ)言識(shí)別學(xué)術(shù)報(bào)告與展示會(huì)論文集[C];1990年
9 蔣純綱;屈百達(dá);李金寶;王月;;基于小波變換后的分形理論的語(yǔ)音端點(diǎn)檢測(cè)[A];2007中國(guó)控制與決策學(xué)術(shù)年會(huì)論文集[C];2007年
10 國(guó)雅萌;付強(qiáng);;復(fù)雜噪聲環(huán)境中的語(yǔ)音端點(diǎn)檢測(cè)[A];第八屆全國(guó)人機(jī)語(yǔ)音通訊學(xué)術(shù)會(huì)議論文集[C];2005年
相關(guān)碩士學(xué)位論文 前10條
1 王海旭;基于卷積神經(jīng)網(wǎng)絡(luò)的語(yǔ)音端點(diǎn)檢測(cè)方法研究[D];內(nèi)蒙古大學(xué);2015年
2 張松軼;語(yǔ)音端點(diǎn)檢測(cè)技術(shù)及在應(yīng)急通信中的應(yīng)用[D];西安電子科技大學(xué);2009年
3 熊威;復(fù)雜噪聲環(huán)境下語(yǔ)音端點(diǎn)的檢測(cè)算法的研究[D];東華大學(xué);2016年
4 劉洋;基于神經(jīng)網(wǎng)絡(luò)的語(yǔ)音端點(diǎn)檢測(cè)方法研究[D];大連理工大學(xué);2010年
5 趙麗霞;噪聲環(huán)境下基于特征的語(yǔ)音端點(diǎn)檢測(cè)研究[D];湖南大學(xué);2010年
6 夏敏磊;語(yǔ)音端點(diǎn)檢測(cè)技術(shù)研究[D];浙江大學(xué);2005年
7 趙高峰;基于小波分析的語(yǔ)音端點(diǎn)檢測(cè)算法研究[D];太原理工大學(xué);2006年
8 喬峰;基于信息熵和神經(jīng)網(wǎng)絡(luò)的語(yǔ)音端點(diǎn)檢測(cè)算法研究[D];太原理工大學(xué);2007年
9 韓韜;基于強(qiáng)背景噪聲下的語(yǔ)音端點(diǎn)檢測(cè)算法及實(shí)現(xiàn)[D];湖南大學(xué);2007年
10 張鐵威;基于小波分析與神經(jīng)網(wǎng)絡(luò)的語(yǔ)音端點(diǎn)檢測(cè)研究[D];大連理工大學(xué);2008年
,本文編號(hào):1858835
本文鏈接:http://sikaile.net/kejilunwen/xinxigongchenglunwen/1858835.html