基于字典學(xué)習(xí)的語(yǔ)音增強(qiáng)算法研究
本文選題:語(yǔ)音增強(qiáng) + 稀疏表示。 參考:《大連海事大學(xué)》2016年碩士論文
【摘要】:在語(yǔ)音通信過(guò)程中,語(yǔ)音信號(hào)的傳遞無(wú)可避免的會(huì)受到噪聲的干擾。強(qiáng)噪聲背景下會(huì)對(duì)語(yǔ)音造成嚴(yán)重破壞,不但影響語(yǔ)義辨識(shí)降低通信效率,而且長(zhǎng)時(shí)間的含噪語(yǔ)音還會(huì)影響人的聽(tīng)覺(jué)和情緒,所以需要在接收端預(yù)先加入語(yǔ)音增強(qiáng)環(huán)節(jié)來(lái)改善通信質(zhì)量。語(yǔ)音增強(qiáng)廣泛應(yīng)用于人機(jī)交互系統(tǒng)中,比如人機(jī)對(duì)話、實(shí)時(shí)翻譯、智能家居等。語(yǔ)音增強(qiáng)作為數(shù)字信號(hào)處理研究的一個(gè)重要方向,其主要作用是削弱噪聲,提高語(yǔ)音的清晰度和可懂度。現(xiàn)有的語(yǔ)音增強(qiáng)算法面臨的難題是在強(qiáng)噪聲背景下提取出的語(yǔ)音仍會(huì)在非語(yǔ)音段留下噪聲,為語(yǔ)音識(shí)別和信息傳遞工作帶來(lái)困難。為了解決上述問(wèn)題,本文主要工作如下:1、對(duì)經(jīng)典語(yǔ)音增強(qiáng)算法中的譜減法進(jìn)行改進(jìn),針對(duì)語(yǔ)音活性檢測(cè)環(huán)節(jié),使用短時(shí)自相關(guān)函數(shù)和頻譜子帶方差設(shè)置二級(jí)判決閾值,對(duì)噪聲譜的估計(jì)更加準(zhǔn)確,實(shí)驗(yàn)表明,信噪比和語(yǔ)音質(zhì)量感知兩個(gè)評(píng)價(jià)指標(biāo)都有所提升。2、字典學(xué)習(xí)算法研究。從信號(hào)表示的角度入手,引入稀疏表示模型,根據(jù)稀疏表示后的語(yǔ)音和噪聲呈現(xiàn)出的不同特性進(jìn)行去噪。字典學(xué)習(xí)算法主要包括兩部分,系數(shù)追蹤算法和字典訓(xùn)練過(guò)程。引入的LS-OMP追蹤算法對(duì)系數(shù)更新環(huán)節(jié)進(jìn)行了優(yōu)化,通過(guò)實(shí)驗(yàn)驗(yàn)證,算法運(yùn)行速度有所提升;同時(shí)對(duì)字典參數(shù)的最優(yōu)選擇進(jìn)行討論。3、對(duì)改進(jìn)后的字典學(xué)習(xí)算法和經(jīng)典語(yǔ)音增強(qiáng)算法進(jìn)行比較總結(jié),實(shí)驗(yàn)結(jié)果表明,本文提出的算法對(duì)非語(yǔ)音段噪聲有較好的抑制作用,從而提高了語(yǔ)音質(zhì)量。
[Abstract]:In the process of speech communication, the transmission of speech signal is inevitably disturbed by noise. Under the strong noise background, it will cause serious damage to the speech, which not only affects the semantic identification and reduces the communication efficiency, but also affects the human hearing and emotion for a long time. In order to improve the communication quality, voice enhancement is needed in the receiver. Speech enhancement is widely used in human-computer interaction systems, such as man-machine dialogue, real-time translation, smart home and so on. Speech enhancement is an important research direction in digital signal processing. Its main function is to weaken noise and improve the clarity and intelligibility of speech. The existing speech enhancement algorithms are faced with the problem that the speech extracted from the strong noise background will still leave noise in the non-speech segment, which makes it difficult for speech recognition and information transmission. In order to solve the above problems, the main work of this paper is as follows: 1. To improve the spectral subtraction in the classical speech enhancement algorithm, the second level decision threshold is set by using the short time autocorrelation function and the variance of the spectrum subband for the detection of speech activity. The estimation of noise spectrum is more accurate. The experimental results show that both SNR and speech quality perception are improved. 2. Dictionary learning algorithm is studied. From the point of view of signal representation, a sparse representation model is introduced, and denoising is carried out according to the different characteristics of speech and noise after sparse representation. Dictionary learning algorithm includes two parts: coefficient tracking algorithm and dictionary training process. The LS-OMP tracking algorithm is introduced to optimize the updating of the coefficients. The experimental results show that the speed of the algorithm is improved. At the same time, the optimal selection of dictionary parameters is discussed, and the improved dictionary learning algorithm and classical speech enhancement algorithm are compared and summarized. The experimental results show that the proposed algorithm has a better suppression effect on non-speech segment noise. Thus, the speech quality is improved.
【學(xué)位授予單位】:大連海事大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2016
【分類號(hào)】:TN912.3
【相似文獻(xiàn)】
相關(guān)期刊論文 前10條
1 胡光銳,虞曉;基于二階前向結(jié)構(gòu)和信息最大理論的語(yǔ)音增強(qiáng)算法[J];上海交通大學(xué)學(xué)報(bào);2000年07期
2 姚峰英,張敏;用于語(yǔ)音增強(qiáng)的高頻信噪比度量[J];聲學(xué)學(xué)報(bào);2002年05期
3 彭煊,劉金福,王炳錫;基于獨(dú)立分量分析的語(yǔ)音增強(qiáng)[J];信號(hào)處理;2002年05期
4 王金明,張雄偉;一種基于自適應(yīng)模糊濾波的語(yǔ)音增強(qiáng)方法[J];解放軍理工大學(xué)學(xué)報(bào)(自然科學(xué)版);2003年01期
5 楊匯軍,鄭海英,王立紅;語(yǔ)音增強(qiáng)方法的研究[J];遼寧工學(xué)院學(xué)報(bào);2003年05期
6 徐爽,韓芳芳,鄭德忠;基于閾值的小波域語(yǔ)音增強(qiáng)新算法[J];傳感技術(shù)學(xué)報(bào);2004年01期
7 孫新德;一種改進(jìn)的語(yǔ)音增強(qiáng)方法及實(shí)現(xiàn)[J];鄭州航空工業(yè)管理學(xué)院學(xué)報(bào)(社會(huì)科學(xué)版);2005年04期
8 錢國(guó)青;趙鶴鳴;;基于改進(jìn)譜減算法的語(yǔ)音增強(qiáng)新方法[J];計(jì)算機(jī)工程與應(yīng)用;2005年35期
9 王晶,傅豐林,張運(yùn)偉;語(yǔ)音增強(qiáng)算法綜述[J];聲學(xué)與電子工程;2005年01期
10 楊毅;楊宇;余達(dá)太;;語(yǔ)音增強(qiáng)及其消噪能力研究[J];微電子學(xué)與計(jì)算機(jī);2006年07期
相關(guān)會(huì)議論文 前10條
1 陳凱;俞蒙槐;胡上序;付強(qiáng);;語(yǔ)音增強(qiáng)系統(tǒng)性能評(píng)測(cè)方法綜述[A];第四屆全國(guó)人機(jī)語(yǔ)音通訊學(xué)術(shù)會(huì)議論文集[C];1996年
2 王建波;林本浩;田春明;劉睿;;語(yǔ)音增強(qiáng)及其相關(guān)技術(shù)研究[A];2009通信理論與技術(shù)新發(fā)展——第十四屆全國(guó)青年通信學(xué)術(shù)會(huì)議論文集[C];2009年
3 徐舒;孫洪;;基于融合迭代的語(yǔ)音增強(qiáng)方法[A];第十四屆全國(guó)信號(hào)處理學(xué)術(shù)年會(huì)(CCSP-2009)論文集[C];2009年
4 牛剛;任新智;吳國(guó)慶;;諧波能量匯集度在語(yǔ)音增強(qiáng)中的應(yīng)用[A];第六屆全國(guó)信息獲取與處理學(xué)術(shù)會(huì)議論文集(2)[C];2008年
5 國(guó)雁萌;;一種極低信噪比條件下的語(yǔ)音增強(qiáng)方法[A];第六屆全國(guó)人機(jī)語(yǔ)音通訊學(xué)術(shù)會(huì)議論文集[C];2001年
6 江峰;李曉東;;適用于抑制非平穩(wěn)背景噪聲的語(yǔ)音增強(qiáng)算法[A];中國(guó)聲學(xué)學(xué)會(huì)2003年青年學(xué)術(shù)會(huì)議[CYCA'03]論文集[C];2003年
7 閻兆立;杜利民;;維納后濾波語(yǔ)音增強(qiáng)算法研究[A];中國(guó)聲學(xué)學(xué)會(huì)2005年青年學(xué)術(shù)會(huì)議[CYCA'05]論文集[C];2005年
8 劉淑華;胡強(qiáng);覃團(tuán)發(fā);萬(wàn)海斌;;語(yǔ)音增強(qiáng)算法的研究[A];2005通信理論與技術(shù)新進(jìn)展——第十屆全國(guó)青年通信學(xué)術(shù)會(huì)議論文集[C];2005年
9 魏臻;張景達(dá);陸陽(yáng);;嵌入式系統(tǒng)中語(yǔ)音增強(qiáng)改進(jìn)算法的研究[A];2007'中國(guó)儀器儀表與測(cè)控技術(shù)交流大會(huì)論文集(一)[C];2007年
10 楊威明;;基于閾值的小波變換語(yǔ)音增強(qiáng)方法[A];2007北京地區(qū)高校研究生學(xué)術(shù)交流會(huì)通信與信息技術(shù)會(huì)議論文集(上冊(cè))[C];2008年
相關(guān)博士學(xué)位論文 前10條
1 歐世峰;變換域語(yǔ)音增強(qiáng)算法的研究[D];吉林大學(xué);2008年
2 尹偉;基于模型的語(yǔ)音增強(qiáng)方法及質(zhì)量評(píng)估研究[D];武漢大學(xué);2009年
3 王海艷;基于統(tǒng)計(jì)模型的語(yǔ)音增強(qiáng)算法研究[D];吉林大學(xué);2011年
4 方瑜;語(yǔ)音增強(qiáng)相關(guān)問(wèn)題研究[D];北京郵電大學(xué);2012年
5 姚峰英;語(yǔ)音增強(qiáng)系統(tǒng)的研究與實(shí)現(xiàn)[D];中國(guó)科學(xué)院上海冶金研究所;2001年
6 夏丙寅;面向移動(dòng)通信的單通道語(yǔ)音增強(qiáng)方法研究[D];北京工業(yè)大學(xué);2014年
7 徐勇;基于深層神經(jīng)網(wǎng)絡(luò)的語(yǔ)音增強(qiáng)方法研究[D];中國(guó)科學(xué)技術(shù)大學(xué);2015年
8 陶智;低信噪比環(huán)境下語(yǔ)音增強(qiáng)的研究[D];蘇州大學(xué);2011年
9 王娜;基于小波變換與約束方差噪聲譜估計(jì)的語(yǔ)音增強(qiáng)算法研究[D];燕山大學(xué);2011年
10 趙彥平;基于稀疏表示的語(yǔ)音增強(qiáng)方法研究[D];吉林大學(xué);2014年
相關(guān)碩士學(xué)位論文 前10條
1 肖佩霖;雙通道語(yǔ)音增強(qiáng)系統(tǒng)設(shè)計(jì)與實(shí)現(xiàn)[D];哈爾濱工業(yè)大學(xué);2011年
2 陳成斌;針對(duì)于家居環(huán)境的語(yǔ)音增強(qiáng)系統(tǒng)的研究與開(kāi)發(fā)[D];華南理工大學(xué);2015年
3 魏有權(quán);基于噪聲估計(jì)的語(yǔ)音增強(qiáng)算法研究[D];昆明理工大學(xué);2015年
4 胡勇;麥克風(fēng)陣列語(yǔ)音增強(qiáng)算法研究[D];電子科技大學(xué);2014年
5 曹后斌;有色背景噪聲環(huán)境下語(yǔ)音增強(qiáng)系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)[D];電子科技大學(xué);2014年
6 馬小惠;陣列語(yǔ)音增強(qiáng)在車載環(huán)境中的應(yīng)用[D];大連理工大學(xué);2015年
7 李達(dá);無(wú)線聲學(xué)傳感器網(wǎng)絡(luò)中分布式語(yǔ)音增強(qiáng)方法研究[D];大連理工大學(xué);2015年
8 高珍珍;基于梅爾頻譜域HMM的語(yǔ)音增強(qiáng)方法研究[D];北京工業(yè)大學(xué);2015年
9 宋環(huán)宇;全數(shù)字助聽(tīng)器語(yǔ)音增強(qiáng)算法研究[D];哈爾濱工業(yè)大學(xué);2014年
10 王永杰;基于麥克風(fēng)陣列的語(yǔ)音增強(qiáng)算法研究[D];西安電子科技大學(xué);2014年
,本文編號(hào):1886324
本文鏈接:http://sikaile.net/kejilunwen/xinxigongchenglunwen/1886324.html