基于字典學(xué)習(xí)的語音增強算法研究
本文選題:語音增強 + 稀疏表示 ; 參考:《大連海事大學(xué)》2016年碩士論文
【摘要】:在語音通信過程中,語音信號的傳遞無可避免的會受到噪聲的干擾。強噪聲背景下會對語音造成嚴重破壞,不但影響語義辨識降低通信效率,而且長時間的含噪語音還會影響人的聽覺和情緒,所以需要在接收端預(yù)先加入語音增強環(huán)節(jié)來改善通信質(zhì)量。語音增強廣泛應(yīng)用于人機交互系統(tǒng)中,比如人機對話、實時翻譯、智能家居等。語音增強作為數(shù)字信號處理研究的一個重要方向,其主要作用是削弱噪聲,提高語音的清晰度和可懂度。現(xiàn)有的語音增強算法面臨的難題是在強噪聲背景下提取出的語音仍會在非語音段留下噪聲,為語音識別和信息傳遞工作帶來困難。為了解決上述問題,本文主要工作如下:1、對經(jīng)典語音增強算法中的譜減法進行改進,針對語音活性檢測環(huán)節(jié),使用短時自相關(guān)函數(shù)和頻譜子帶方差設(shè)置二級判決閾值,對噪聲譜的估計更加準確,實驗表明,信噪比和語音質(zhì)量感知兩個評價指標都有所提升。2、字典學(xué)習(xí)算法研究。從信號表示的角度入手,引入稀疏表示模型,根據(jù)稀疏表示后的語音和噪聲呈現(xiàn)出的不同特性進行去噪。字典學(xué)習(xí)算法主要包括兩部分,系數(shù)追蹤算法和字典訓(xùn)練過程。引入的LS-OMP追蹤算法對系數(shù)更新環(huán)節(jié)進行了優(yōu)化,通過實驗驗證,算法運行速度有所提升;同時對字典參數(shù)的最優(yōu)選擇進行討論。3、對改進后的字典學(xué)習(xí)算法和經(jīng)典語音增強算法進行比較總結(jié),實驗結(jié)果表明,本文提出的算法對非語音段噪聲有較好的抑制作用,從而提高了語音質(zhì)量。
[Abstract]:In the process of speech communication, the transmission of speech signal is inevitably disturbed by noise. Under the strong noise background, it will cause serious damage to the speech, which not only affects the semantic identification and reduces the communication efficiency, but also affects the human hearing and emotion for a long time. In order to improve the communication quality, voice enhancement is needed in the receiver. Speech enhancement is widely used in human-computer interaction systems, such as man-machine dialogue, real-time translation, smart home and so on. Speech enhancement is an important research direction in digital signal processing. Its main function is to weaken noise and improve the clarity and intelligibility of speech. The existing speech enhancement algorithms are faced with the problem that the speech extracted from the strong noise background will still leave noise in the non-speech segment, which makes it difficult for speech recognition and information transmission. In order to solve the above problems, the main work of this paper is as follows: 1. To improve the spectral subtraction in the classical speech enhancement algorithm, the second level decision threshold is set by using the short time autocorrelation function and the variance of the spectrum subband for the detection of speech activity. The estimation of noise spectrum is more accurate. The experimental results show that both SNR and speech quality perception are improved. 2. Dictionary learning algorithm is studied. From the point of view of signal representation, a sparse representation model is introduced, and denoising is carried out according to the different characteristics of speech and noise after sparse representation. Dictionary learning algorithm includes two parts: coefficient tracking algorithm and dictionary training process. The LS-OMP tracking algorithm is introduced to optimize the updating of the coefficients. The experimental results show that the speed of the algorithm is improved. At the same time, the optimal selection of dictionary parameters is discussed, and the improved dictionary learning algorithm and classical speech enhancement algorithm are compared and summarized. The experimental results show that the proposed algorithm has a better suppression effect on non-speech segment noise. Thus, the speech quality is improved.
【學(xué)位授予單位】:大連海事大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2016
【分類號】:TN912.3
【相似文獻】
相關(guān)期刊論文 前10條
1 胡光銳,虞曉;基于二階前向結(jié)構(gòu)和信息最大理論的語音增強算法[J];上海交通大學(xué)學(xué)報;2000年07期
2 姚峰英,張敏;用于語音增強的高頻信噪比度量[J];聲學(xué)學(xué)報;2002年05期
3 彭煊,劉金福,王炳錫;基于獨立分量分析的語音增強[J];信號處理;2002年05期
4 王金明,張雄偉;一種基于自適應(yīng)模糊濾波的語音增強方法[J];解放軍理工大學(xué)學(xué)報(自然科學(xué)版);2003年01期
5 楊匯軍,鄭海英,王立紅;語音增強方法的研究[J];遼寧工學(xué)院學(xué)報;2003年05期
6 徐爽,韓芳芳,鄭德忠;基于閾值的小波域語音增強新算法[J];傳感技術(shù)學(xué)報;2004年01期
7 孫新德;一種改進的語音增強方法及實現(xiàn)[J];鄭州航空工業(yè)管理學(xué)院學(xué)報(社會科學(xué)版);2005年04期
8 錢國青;趙鶴鳴;;基于改進譜減算法的語音增強新方法[J];計算機工程與應(yīng)用;2005年35期
9 王晶,傅豐林,張運偉;語音增強算法綜述[J];聲學(xué)與電子工程;2005年01期
10 楊毅;楊宇;余達太;;語音增強及其消噪能力研究[J];微電子學(xué)與計算機;2006年07期
相關(guān)會議論文 前10條
1 陳凱;俞蒙槐;胡上序;付強;;語音增強系統(tǒng)性能評測方法綜述[A];第四屆全國人機語音通訊學(xué)術(shù)會議論文集[C];1996年
2 王建波;林本浩;田春明;劉睿;;語音增強及其相關(guān)技術(shù)研究[A];2009通信理論與技術(shù)新發(fā)展——第十四屆全國青年通信學(xué)術(shù)會議論文集[C];2009年
3 徐舒;孫洪;;基于融合迭代的語音增強方法[A];第十四屆全國信號處理學(xué)術(shù)年會(CCSP-2009)論文集[C];2009年
4 牛剛;任新智;吳國慶;;諧波能量匯集度在語音增強中的應(yīng)用[A];第六屆全國信息獲取與處理學(xué)術(shù)會議論文集(2)[C];2008年
5 國雁萌;;一種極低信噪比條件下的語音增強方法[A];第六屆全國人機語音通訊學(xué)術(shù)會議論文集[C];2001年
6 江峰;李曉東;;適用于抑制非平穩(wěn)背景噪聲的語音增強算法[A];中國聲學(xué)學(xué)會2003年青年學(xué)術(shù)會議[CYCA'03]論文集[C];2003年
7 閻兆立;杜利民;;維納后濾波語音增強算法研究[A];中國聲學(xué)學(xué)會2005年青年學(xué)術(shù)會議[CYCA'05]論文集[C];2005年
8 劉淑華;胡強;覃團發(fā);萬海斌;;語音增強算法的研究[A];2005通信理論與技術(shù)新進展——第十屆全國青年通信學(xué)術(shù)會議論文集[C];2005年
9 魏臻;張景達;陸陽;;嵌入式系統(tǒng)中語音增強改進算法的研究[A];2007'中國儀器儀表與測控技術(shù)交流大會論文集(一)[C];2007年
10 楊威明;;基于閾值的小波變換語音增強方法[A];2007北京地區(qū)高校研究生學(xué)術(shù)交流會通信與信息技術(shù)會議論文集(上冊)[C];2008年
相關(guān)博士學(xué)位論文 前10條
1 歐世峰;變換域語音增強算法的研究[D];吉林大學(xué);2008年
2 尹偉;基于模型的語音增強方法及質(zhì)量評估研究[D];武漢大學(xué);2009年
3 王海艷;基于統(tǒng)計模型的語音增強算法研究[D];吉林大學(xué);2011年
4 方瑜;語音增強相關(guān)問題研究[D];北京郵電大學(xué);2012年
5 姚峰英;語音增強系統(tǒng)的研究與實現(xiàn)[D];中國科學(xué)院上海冶金研究所;2001年
6 夏丙寅;面向移動通信的單通道語音增強方法研究[D];北京工業(yè)大學(xué);2014年
7 徐勇;基于深層神經(jīng)網(wǎng)絡(luò)的語音增強方法研究[D];中國科學(xué)技術(shù)大學(xué);2015年
8 陶智;低信噪比環(huán)境下語音增強的研究[D];蘇州大學(xué);2011年
9 王娜;基于小波變換與約束方差噪聲譜估計的語音增強算法研究[D];燕山大學(xué);2011年
10 趙彥平;基于稀疏表示的語音增強方法研究[D];吉林大學(xué);2014年
相關(guān)碩士學(xué)位論文 前10條
1 肖佩霖;雙通道語音增強系統(tǒng)設(shè)計與實現(xiàn)[D];哈爾濱工業(yè)大學(xué);2011年
2 陳成斌;針對于家居環(huán)境的語音增強系統(tǒng)的研究與開發(fā)[D];華南理工大學(xué);2015年
3 魏有權(quán);基于噪聲估計的語音增強算法研究[D];昆明理工大學(xué);2015年
4 胡勇;麥克風(fēng)陣列語音增強算法研究[D];電子科技大學(xué);2014年
5 曹后斌;有色背景噪聲環(huán)境下語音增強系統(tǒng)的設(shè)計與實現(xiàn)[D];電子科技大學(xué);2014年
6 馬小惠;陣列語音增強在車載環(huán)境中的應(yīng)用[D];大連理工大學(xué);2015年
7 李達;無線聲學(xué)傳感器網(wǎng)絡(luò)中分布式語音增強方法研究[D];大連理工大學(xué);2015年
8 高珍珍;基于梅爾頻譜域HMM的語音增強方法研究[D];北京工業(yè)大學(xué);2015年
9 宋環(huán)宇;全數(shù)字助聽器語音增強算法研究[D];哈爾濱工業(yè)大學(xué);2014年
10 王永杰;基于麥克風(fēng)陣列的語音增強算法研究[D];西安電子科技大學(xué);2014年
,本文編號:1886324
本文鏈接:http://sikaile.net/kejilunwen/xinxigongchenglunwen/1886324.html