改進(jìn)的參數(shù)自適應(yīng)的維納濾波語(yǔ)音增強(qiáng)算法
本文選題:語(yǔ)音增強(qiáng) + 參數(shù)自適應(yīng); 參考:《太原理工大學(xué)》2017年碩士論文
【摘要】:近年來(lái),隨著信息技術(shù)的發(fā)展,助聽(tīng)器的技術(shù)已日漸成熟,使用智能手機(jī)進(jìn)行語(yǔ)音通信已經(jīng)成為了人們生活中的必需品,人機(jī)交互也逐漸進(jìn)入了人們的視野,語(yǔ)音已經(jīng)成為了日常生活中不可或缺的一部分,所以,對(duì)語(yǔ)音進(jìn)行處理成為了迫在眉睫的事情。然而現(xiàn)實(shí)生活中,在進(jìn)行語(yǔ)音處理時(shí),噪聲卻無(wú)處不在,紛繁復(fù)雜的噪聲成為了處理語(yǔ)音過(guò)程中最大的障礙。過(guò)去幾十年,如何將純凈語(yǔ)音從含噪語(yǔ)音中分離出來(lái)一直是各個(gè)研究者研究的重點(diǎn),直至今日,語(yǔ)音增強(qiáng)依然是一個(gè)十分活躍的領(lǐng)域。傳統(tǒng)的語(yǔ)音增強(qiáng)算法包括譜減法,維納濾波算法,子空間法,最小均方誤差法等。當(dāng)進(jìn)行語(yǔ)音增強(qiáng)時(shí),這些傳統(tǒng)的算法都沒(méi)有考慮到不同的噪聲對(duì)語(yǔ)音信號(hào)產(chǎn)生的不同影響。實(shí)際上,語(yǔ)音增強(qiáng)過(guò)程中包括語(yǔ)音估計(jì)和噪聲估計(jì)兩個(gè)重要的階段,在進(jìn)行噪聲估計(jì)時(shí),不同的噪聲頻譜特征不盡相同。本文在此理論基礎(chǔ)上提出了根據(jù)不同噪聲進(jìn)行參數(shù)自適應(yīng)的語(yǔ)音增強(qiáng)算法。首先,介紹了語(yǔ)音和噪聲的相關(guān)理論,包括語(yǔ)音和噪聲的主要特征,含噪語(yǔ)音的信號(hào)模型及噪聲評(píng)估算法。對(duì)近年來(lái)的語(yǔ)音增強(qiáng)算法進(jìn)行歸納總結(jié)與比較分析,并對(duì)經(jīng)典的語(yǔ)言增強(qiáng)算法進(jìn)行仿真實(shí)驗(yàn),分析得出經(jīng)典算法普遍存在的問(wèn)題——同一種語(yǔ)音增強(qiáng)算法不能對(duì)所有的噪聲類型都起到作用。其次,若要使得語(yǔ)音增強(qiáng)算法針對(duì)不同的噪聲做出不同的處理,就要對(duì)噪聲進(jìn)行準(zhǔn)確的分類。為了能夠?qū)υ肼曔M(jìn)行準(zhǔn)確的分類,本文在對(duì)經(jīng)典的分類算法進(jìn)行了歸納總結(jié)后,闡述了這些分類算法在大數(shù)據(jù)的處理方面存在的問(wèn)題,進(jìn)而提出了本文所使用的分類算法——基于深度置信網(wǎng)絡(luò)的噪聲分類算法(Deep belief networks),并對(duì)此算法的分類過(guò)程進(jìn)行了詳細(xì)的介紹,對(duì)其分類的準(zhǔn)確性進(jìn)行了仿真實(shí)驗(yàn)并將其與人工神經(jīng)網(wǎng)絡(luò)算法的分類準(zhǔn)確性進(jìn)行了對(duì)比,結(jié)果表明:本文提出的分類算法具有較高的分類準(zhǔn)確性。第三,由于基于先驗(yàn)信噪比的維納濾波語(yǔ)音增強(qiáng)算法能夠較大程度的提高語(yǔ)言的質(zhì)量并且含有較少的音樂(lè)噪聲,所以本文對(duì)基于先驗(yàn)信噪比的維納濾波語(yǔ)音增強(qiáng)算法進(jìn)行了詳細(xì)的推導(dǎo)與分析,并對(duì)其進(jìn)行了相應(yīng)的仿真實(shí)驗(yàn),得出此算法不能提高所有噪聲類型干擾下的語(yǔ)音質(zhì)量,即而提出了本文的算法——基于噪聲分類的參數(shù)自適應(yīng)維納濾波語(yǔ)音增強(qiáng)算法。本文選用了聲音活動(dòng)檢測(cè)(VAD)法對(duì)噪聲功率譜進(jìn)行估計(jì),并將其與維納濾波算法結(jié)合得到不同噪聲條件下的最優(yōu)的參數(shù)組合。將此最優(yōu)參數(shù)組合應(yīng)用到之前使用深度置信網(wǎng)絡(luò)算法進(jìn)行分類后得到的噪聲種類中去,并對(duì)先驗(yàn)信噪比的高估部分進(jìn)行修正,最終得到本文提出的語(yǔ)音增強(qiáng)算法。最后,對(duì)提出的算法進(jìn)行實(shí)驗(yàn)仿真,將其與經(jīng)典的基于先驗(yàn)信噪比的維納濾波算法進(jìn)行比較,評(píng)估算法包括質(zhì)量評(píng)估和可懂度評(píng)估,質(zhì)量評(píng)估選用語(yǔ)音質(zhì)量感知評(píng)估(PESQ),可懂度評(píng)估選用標(biāo)準(zhǔn)化協(xié)方差法(NCM)。在實(shí)驗(yàn)的最后對(duì)未知的噪聲也進(jìn)行了仿真實(shí)驗(yàn)分析,將未知噪聲使用本文提出的分類算法匹配到已知噪聲中,根據(jù)匹配的類型選用最優(yōu)的參數(shù)組合進(jìn)行語(yǔ)音增強(qiáng),來(lái)證明本文提出的算法具有普遍適用性。結(jié)果表明,本文提出的算法能在不降低低信噪比語(yǔ)音可懂度的同時(shí)提高語(yǔ)音的質(zhì)量,并且對(duì)未知噪聲具有普遍適用性。
[Abstract]:In recent years, with the development of information technology, the technology of hearing aids has matured. The use of smart phone for voice communication has become a necessity in people's life. Human-computer interaction has gradually entered people's field of vision. Voice has become an indispensable part of daily life. Therefore, the processing of voice has become a pressing problem. In the real life, however, in the real life, noise is ubiquitous in the process of speech processing, and the complex noise has become the biggest obstacle in the process of speech processing. In the past few decades, how to separate the pure voice from the noisy speech has been the focus of the researchers. Until today, the speech enhancement is still a one. The traditional speech enhancement algorithms include spectral subtraction, Wiener filtering, subspace, minimum mean square error, etc. when speech enhancement, these traditional algorithms do not take into account the different effects of different noise on speech signals. In fact, speech enhancement includes speech estimation and noise. Two important stages are estimated. In the process of noise estimation, different noise spectrum features are different. Based on this theory, a speech enhancement algorithm based on the adaptive parameters of different noises is proposed. First, the correlation theory of speech and noise, including the main features of sound and noise, and the signal mode of noisy speech, is introduced. Type and noise evaluation algorithms. The speech enhancement algorithms in recent years are summarized and compared, and the classical language enhancement algorithms are simulated and analyzed. The common problems of the classical algorithms are analyzed. The same speech enhancement algorithm can not play a role in all noise types. Secondly, if the speech enhancement is made, the speech enhancement is made. In order to classify the noise accurately in order to make different noises for different noises. In order to classify the noise accurately, after summarizing the classical classification algorithms, this paper expounds the problems existing in the processing of large data by these classification algorithms, and then puts forward the classification calculation used in this paper. Method - Deep belief networks based on deep confidence network, and the classification process of the algorithm is introduced in detail, and the accuracy of the classification is simulated and compared with the classification accuracy of artificial neural network algorithm. The results show that the classification algorithm proposed in this paper is higher. Third, because the Wiener filtering speech enhancement algorithm based on the prior signal-to-noise ratio can greatly improve the quality of the language and contains less music noise, this paper makes a detailed deduction and analysis of the Wiener filtering speech enhancement algorithm based on the prior signal-to-noise ratio, and carries out the corresponding simulation. It is concluded that this algorithm can not improve the speech quality under all noise types. That is, the algorithm, the adaptive Wiener filtering speech enhancement algorithm based on the noise classification, is proposed. The sound activity detection (VAD) method is used to estimate the noise power spectrum, and it is combined with the Wiener filtering algorithm. The optimal combination of parameters under the same noise condition is used to apply the optimal parameter combination to the kind of noise classification obtained before using the depth confidence network algorithm, and to modify the overestimation part of the prior signal to noise ratio. Finally, the speech enhancement algorithm proposed in this paper is obtained. Finally, the proposed algorithm is simulated by experiments. Compared with the classical Wiener filtering algorithm based on the prior signal to noise ratio, the evaluation algorithm includes the quality evaluation and the intelligibility evaluation, the quality evaluation selects the speech quality perception assessment (PESQ), the intelligibility evaluation selects the standardized covariance method (NCM). The simulation experiments are carried out at the end of the experiment. The unknown noise is also analyzed. It is proved that the algorithm proposed in this paper is universally applicable. The results show that the algorithm proposed in this paper can improve the quality of speech at the same time without reducing the speech intelligibility of low signal to noise ratio and to the unknown. Noise is universally applicable.
【學(xué)位授予單位】:太原理工大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2017
【分類號(hào)】:TN912.35
【相似文獻(xiàn)】
相關(guān)期刊論文 前10條
1 李倩,王讓定,陳金兒;基于改進(jìn)閾值的小波域語(yǔ)音增強(qiáng)算法[J];寧波大學(xué)學(xué)報(bào)(理工版);2005年03期
2 胡光銳,虞曉;基于二階前向結(jié)構(gòu)和信息最大理論的語(yǔ)音增強(qiáng)算法[J];上海交通大學(xué)學(xué)報(bào);2000年07期
3 姚峰英,張敏;用于語(yǔ)音增強(qiáng)的高頻信噪比度量[J];聲學(xué)學(xué)報(bào);2002年05期
4 彭煊,劉金福,王炳錫;基于獨(dú)立分量分析的語(yǔ)音增強(qiáng)[J];信號(hào)處理;2002年05期
5 王金明,張雄偉;一種基于自適應(yīng)模糊濾波的語(yǔ)音增強(qiáng)方法[J];解放軍理工大學(xué)學(xué)報(bào)(自然科學(xué)版);2003年01期
6 楊匯軍,鄭海英,王立紅;語(yǔ)音增強(qiáng)方法的研究[J];遼寧工學(xué)院學(xué)報(bào);2003年05期
7 徐爽,韓芳芳,鄭德忠;基于閾值的小波域語(yǔ)音增強(qiáng)新算法[J];傳感技術(shù)學(xué)報(bào);2004年01期
8 孫新德;一種改進(jìn)的語(yǔ)音增強(qiáng)方法及實(shí)現(xiàn)[J];鄭州航空工業(yè)管理學(xué)院學(xué)報(bào)(社會(huì)科學(xué)版);2005年04期
9 錢國(guó)青;趙鶴鳴;;基于改進(jìn)譜減算法的語(yǔ)音增強(qiáng)新方法[J];計(jì)算機(jī)工程與應(yīng)用;2005年35期
10 王晶,傅豐林,張運(yùn)偉;語(yǔ)音增強(qiáng)算法綜述[J];聲學(xué)與電子工程;2005年01期
相關(guān)會(huì)議論文 前10條
1 陳凱;俞蒙槐;胡上序;付強(qiáng);;語(yǔ)音增強(qiáng)系統(tǒng)性能評(píng)測(cè)方法綜述[A];第四屆全國(guó)人機(jī)語(yǔ)音通訊學(xué)術(shù)會(huì)議論文集[C];1996年
2 王建波;林本浩;田春明;劉睿;;語(yǔ)音增強(qiáng)及其相關(guān)技術(shù)研究[A];2009通信理論與技術(shù)新發(fā)展——第十四屆全國(guó)青年通信學(xué)術(shù)會(huì)議論文集[C];2009年
3 徐舒;孫洪;;基于融合迭代的語(yǔ)音增強(qiáng)方法[A];第十四屆全國(guó)信號(hào)處理學(xué)術(shù)年會(huì)(CCSP-2009)論文集[C];2009年
4 牛剛;任新智;吳國(guó)慶;;諧波能量匯集度在語(yǔ)音增強(qiáng)中的應(yīng)用[A];第六屆全國(guó)信息獲取與處理學(xué)術(shù)會(huì)議論文集(2)[C];2008年
5 國(guó)雁萌;;一種極低信噪比條件下的語(yǔ)音增強(qiáng)方法[A];第六屆全國(guó)人機(jī)語(yǔ)音通訊學(xué)術(shù)會(huì)議論文集[C];2001年
6 江峰;李曉東;;適用于抑制非平穩(wěn)背景噪聲的語(yǔ)音增強(qiáng)算法[A];中國(guó)聲學(xué)學(xué)會(huì)2003年青年學(xué)術(shù)會(huì)議[CYCA'03]論文集[C];2003年
7 閻兆立;杜利民;;維納后濾波語(yǔ)音增強(qiáng)算法研究[A];中國(guó)聲學(xué)學(xué)會(huì)2005年青年學(xué)術(shù)會(huì)議[CYCA'05]論文集[C];2005年
8 劉淑華;胡強(qiáng);覃團(tuán)發(fā);萬(wàn)海斌;;語(yǔ)音增強(qiáng)算法的研究[A];2005通信理論與技術(shù)新進(jìn)展——第十屆全國(guó)青年通信學(xué)術(shù)會(huì)議論文集[C];2005年
9 魏臻;張景達(dá);陸陽(yáng);;嵌入式系統(tǒng)中語(yǔ)音增強(qiáng)改進(jìn)算法的研究[A];2007'中國(guó)儀器儀表與測(cè)控技術(shù)交流大會(huì)論文集(一)[C];2007年
10 楊威明;;基于閾值的小波變換語(yǔ)音增強(qiáng)方法[A];2007北京地區(qū)高校研究生學(xué)術(shù)交流會(huì)通信與信息技術(shù)會(huì)議論文集(上冊(cè))[C];2008年
相關(guān)博士學(xué)位論文 前10條
1 張龍;有監(jiān)督學(xué)習(xí)條件下的單通道語(yǔ)音增強(qiáng)算法研究[D];中國(guó)科學(xué)技術(shù)大學(xué);2017年
2 歐世峰;變換域語(yǔ)音增強(qiáng)算法的研究[D];吉林大學(xué);2008年
3 尹偉;基于模型的語(yǔ)音增強(qiáng)方法及質(zhì)量評(píng)估研究[D];武漢大學(xué);2009年
4 王海艷;基于統(tǒng)計(jì)模型的語(yǔ)音增強(qiáng)算法研究[D];吉林大學(xué);2011年
5 方瑜;語(yǔ)音增強(qiáng)相關(guān)問(wèn)題研究[D];北京郵電大學(xué);2012年
6 姚峰英;語(yǔ)音增強(qiáng)系統(tǒng)的研究與實(shí)現(xiàn)[D];中國(guó)科學(xué)院上海冶金研究所;2001年
7 夏丙寅;面向移動(dòng)通信的單通道語(yǔ)音增強(qiáng)方法研究[D];北京工業(yè)大學(xué);2014年
8 徐勇;基于深層神經(jīng)網(wǎng)絡(luò)的語(yǔ)音增強(qiáng)方法研究[D];中國(guó)科學(xué)技術(shù)大學(xué);2015年
9 陶智;低信噪比環(huán)境下語(yǔ)音增強(qiáng)的研究[D];蘇州大學(xué);2011年
10 王娜;基于小波變換與約束方差噪聲譜估計(jì)的語(yǔ)音增強(qiáng)算法研究[D];燕山大學(xué);2011年
相關(guān)碩士學(xué)位論文 前10條
1 肖佩霖;雙通道語(yǔ)音增強(qiáng)系統(tǒng)設(shè)計(jì)與實(shí)現(xiàn)[D];哈爾濱工業(yè)大學(xué);2011年
2 陳成斌;針對(duì)于家居環(huán)境的語(yǔ)音增強(qiáng)系統(tǒng)的研究與開(kāi)發(fā)[D];華南理工大學(xué);2015年
3 魏有權(quán);基于噪聲估計(jì)的語(yǔ)音增強(qiáng)算法研究[D];昆明理工大學(xué);2015年
4 胡勇;麥克風(fēng)陣列語(yǔ)音增強(qiáng)算法研究[D];電子科技大學(xué);2014年
5 曹后斌;有色背景噪聲環(huán)境下語(yǔ)音增強(qiáng)系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)[D];電子科技大學(xué);2014年
6 馬小惠;陣列語(yǔ)音增強(qiáng)在車載環(huán)境中的應(yīng)用[D];大連理工大學(xué);2015年
7 李達(dá);無(wú)線聲學(xué)傳感器網(wǎng)絡(luò)中分布式語(yǔ)音增強(qiáng)方法研究[D];大連理工大學(xué);2015年
8 高珍珍;基于梅爾頻譜域HMM的語(yǔ)音增強(qiáng)方法研究[D];北京工業(yè)大學(xué);2015年
9 宋環(huán)宇;全數(shù)字助聽(tīng)器語(yǔ)音增強(qiáng)算法研究[D];哈爾濱工業(yè)大學(xué);2014年
10 王永杰;基于麥克風(fēng)陣列的語(yǔ)音增強(qiáng)算法研究[D];西安電子科技大學(xué);2014年
,本文編號(hào):1785102
本文鏈接:http://sikaile.net/kejilunwen/zidonghuakongzhilunwen/1785102.html