天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當前位置:主頁 > 科技論文 > 信息工程論文 >

心理聲學研究及其在語音增強上的應用

發(fā)布時間:2018-03-04 10:03

  本文選題:波動強度 切入點:心理聲學掩蔽 出處:《南京師范大學》2017年碩士論文 論文類型:學位論文


【摘要】:心理聲學主要研究人耳對聲音信號的處理過程,建立聲音的物理性質(zhì)與其在聽覺產(chǎn)生的主觀感覺之間的聯(lián)系,從而得到相應的心理聲學模型,最終在科學研究和工程實踐中加以應用。本文主要研究心理聲學的掩蔽效應、頻帶劃分以及參量模型,并給出了一種新的計算心理聲學波動強度的參量模型。在此基礎上,本文將心理聲學掩蔽效應以及頻帶劃分應用到了單通道語音增強上,給出了兩種基于心理聲學的單通道語音增強改進算法:基于心理聲學掩蔽的單通道語音增強改進算法以及基于心理聲學等矩形帶寬(ERB)尺度劃分的多子帶譜減改進算法。心理聲學波動強度與粗糙度一樣,是一種基本的心理聲學聽覺感知。一個重要的區(qū)別在于波動強度反映了聲音信號更慢的振幅波動。本文給出了一種新的基于ERB的波動強度計算模型。通過在ERB尺度上劃分75個濾波通道,并且將每個通道的廣義調(diào)制度(GMD)加權、濾波以及求和得到最終的波動強度值。新算法給出了一種新的將每個ERB中的GMD轉(zhuǎn)變成特性波動強度的方式。另外,新算法給出了用ERB尺度替代Bark尺度。比較基于ERB尺度劃分的新算法和基于Bark尺度劃分的新算法可以發(fā)現(xiàn),基于ERB尺度劃分的新算法降低RMSE值到73%并且提高相關系數(shù)值到17%。另外,本文還給出了關于為何在最終計算特性波動強度時需要加權的原因。實驗仿真結(jié)果表明,與已有的Zwicker波動強度模型[1]相比較,本文的波動強度模型能夠降低RMSE值超過90%并且提高相關系數(shù)值高達23%。因此,本文的波動強度模型所計算得到的結(jié)果與主觀測試結(jié)果更加吻合。在心理聲學理論研究的基礎上,本文給出了基于聽覺掩蔽效應和頻帶劃分的兩種單通道語音增強改進算法。本文首先實現(xiàn)了 Virag提出的基于心理聲學掩蔽的單通道語音增強算法[2],然后通過改進Virag算法中的頻域掩蔽模型并引入時域掩蔽模型,得到改進后的算法。在改進的算法中,根據(jù)頻域掩蔽模型和時域掩蔽模型計算得到噪聲掩蔽閾,進而調(diào)節(jié)譜減參數(shù)以得到噪聲降低、語音失真和殘留音樂噪聲這三者在人耳聽覺上的最好折中。另外,本文還給出了一個基于心理聲學ERB尺度劃分多子帶譜減改進算法,即根據(jù)ERB尺度先將帶噪信號的頻譜劃分成多個子帶,然后在不同的子帶中分別進行單通道語音增強算法處理。仿真結(jié)果表明,改進的算法在客觀評價指標和主觀聽音測試方面均優(yōu)于用于比較的單通道語音增強算法。
[Abstract]:Psychoacoustics mainly studies the processing process of sound signal in human ear, and establishes the relationship between the physical properties of sound and the subjective feeling produced by hearing, and obtains the corresponding psychoacoustical model. Finally, it is applied in scientific research and engineering practice. This paper mainly studies the masking effect, frequency band division and parametric model of psychoacoustics, and gives a new parametric model to calculate the intensity of psychoacoustics fluctuation. In this paper, the psychoacoustic masking effect and band division are applied to single channel speech enhancement. In this paper, we present two improved single-channel speech enhancement algorithms based on psychoacoustics: an improved speech enhancement algorithm based on psychoacoustics masking and an improved multi-subband spectral subtraction based on the scale partition of rectangular bandwidth (ERB) of psychoacoustics. Algorithm. The intensity of psychoacoustic fluctuation is the same as roughness. An important difference is that the wave intensity reflects the slower amplitude fluctuation of sound signal. This paper presents a new calculation model of wave intensity based on ERB. Dividing 75 filtering channels in degrees, And the generalized modulation scheme of each channel is weighted, filtered and summed to obtain the final wave intensity value. The new algorithm gives a new way to transform the GMD in each ERB into characteristic fluctuation intensity. Compared with the new algorithm based on ERB scale and Bark scale partition, it is found that the new algorithm based on ERB scale partition reduces RMSE value to 73% and increases correlation coefficient value to 17%. In this paper, the reasons why we need weighting in the final calculation of characteristic fluctuation intensity are also given. The experimental results show that compared with the existing Zwicker wave intensity model [1], The wave intensity model in this paper can reduce the RMSE value by more than 90% and increase the correlation coefficient by 23. Therefore, the results calculated by the volatility intensity model in this paper are in better agreement with the subjective test results. In this paper, we present two improved single-channel speech enhancement algorithms based on auditory masking effect and band division. Firstly, we implement a single channel speech enhancement algorithm based on psychoacoustic masking proposed by Virag [2]. The frequency domain masking model in Virag algorithm and the time domain masking model are introduced. In the improved algorithm, the noise masking threshold is calculated according to the frequency-domain masking model and the time-domain masking model, and then the spectral subtraction parameters are adjusted to obtain the noise reduction. Speech distortion and residual music noise are the best compromise in human hearing. In addition, an improved algorithm based on psychoacoustics ERB scale is presented to subtract the multi-subband spectrum. According to the ERB scale, the spectrum of the noisy signal is divided into several sub-bands, and then the single-channel speech enhancement algorithm is processed in different sub-bands. The simulation results show that, The improved algorithm is superior to the single channel speech enhancement algorithm in objective evaluation index and subjective audition test.
【學位授予單位】:南京師范大學
【學位級別】:碩士
【學位授予年份】:2017
【分類號】:TN912.3

【相似文獻】

相關期刊論文 前10條

1 李倩,王讓定,陳金兒;基于改進閾值的小波域語音增強算法[J];寧波大學學報(理工版);2005年03期

2 胡光銳,虞曉;基于二階前向結(jié)構(gòu)和信息最大理論的語音增強算法[J];上海交通大學學報;2000年07期

3 姚峰英,張敏;用于語音增強的高頻信噪比度量[J];聲學學報;2002年05期

4 彭煊,劉金福,王炳錫;基于獨立分量分析的語音增強[J];信號處理;2002年05期

5 王金明,張雄偉;一種基于自適應模糊濾波的語音增強方法[J];解放軍理工大學學報(自然科學版);2003年01期

6 楊匯軍,鄭海英,王立紅;語音增強方法的研究[J];遼寧工學院學報;2003年05期

7 徐爽,韓芳芳,鄭德忠;基于閾值的小波域語音增強新算法[J];傳感技術學報;2004年01期

8 孫新德;一種改進的語音增強方法及實現(xiàn)[J];鄭州航空工業(yè)管理學院學報(社會科學版);2005年04期

9 錢國青;趙鶴鳴;;基于改進譜減算法的語音增強新方法[J];計算機工程與應用;2005年35期

10 王晶,傅豐林,張運偉;語音增強算法綜述[J];聲學與電子工程;2005年01期

相關會議論文 前10條

1 陳凱;俞蒙槐;胡上序;付強;;語音增強系統(tǒng)性能評測方法綜述[A];第四屆全國人機語音通訊學術會議論文集[C];1996年

2 王建波;林本浩;田春明;劉睿;;語音增強及其相關技術研究[A];2009通信理論與技術新發(fā)展——第十四屆全國青年通信學術會議論文集[C];2009年

3 徐舒;孫洪;;基于融合迭代的語音增強方法[A];第十四屆全國信號處理學術年會(CCSP-2009)論文集[C];2009年

4 牛剛;任新智;吳國慶;;諧波能量匯集度在語音增強中的應用[A];第六屆全國信息獲取與處理學術會議論文集(2)[C];2008年

5 國雁萌;;一種極低信噪比條件下的語音增強方法[A];第六屆全國人機語音通訊學術會議論文集[C];2001年

6 江峰;李曉東;;適用于抑制非平穩(wěn)背景噪聲的語音增強算法[A];中國聲學學會2003年青年學術會議[CYCA'03]論文集[C];2003年

7 閻兆立;杜利民;;維納后濾波語音增強算法研究[A];中國聲學學會2005年青年學術會議[CYCA'05]論文集[C];2005年

8 劉淑華;胡強;覃團發(fā);萬海斌;;語音增強算法的研究[A];2005通信理論與技術新進展——第十屆全國青年通信學術會議論文集[C];2005年

9 魏臻;張景達;陸陽;;嵌入式系統(tǒng)中語音增強改進算法的研究[A];2007'中國儀器儀表與測控技術交流大會論文集(一)[C];2007年

10 楊威明;;基于閾值的小波變換語音增強方法[A];2007北京地區(qū)高校研究生學術交流會通信與信息技術會議論文集(上冊)[C];2008年

相關博士學位論文 前10條

1 張龍;有監(jiān)督學習條件下的單通道語音增強算法研究[D];中國科學技術大學;2017年

2 歐世峰;變換域語音增強算法的研究[D];吉林大學;2008年

3 尹偉;基于模型的語音增強方法及質(zhì)量評估研究[D];武漢大學;2009年

4 王海艷;基于統(tǒng)計模型的語音增強算法研究[D];吉林大學;2011年

5 方瑜;語音增強相關問題研究[D];北京郵電大學;2012年

6 姚峰英;語音增強系統(tǒng)的研究與實現(xiàn)[D];中國科學院上海冶金研究所;2001年

7 夏丙寅;面向移動通信的單通道語音增強方法研究[D];北京工業(yè)大學;2014年

8 徐勇;基于深層神經(jīng)網(wǎng)絡的語音增強方法研究[D];中國科學技術大學;2015年

9 陶智;低信噪比環(huán)境下語音增強的研究[D];蘇州大學;2011年

10 王娜;基于小波變換與約束方差噪聲譜估計的語音增強算法研究[D];燕山大學;2011年

相關碩士學位論文 前10條

1 周挺挺;心理聲學研究及其在語音增強上的應用[D];南京師范大學;2017年

2 肖佩霖;雙通道語音增強系統(tǒng)設計與實現(xiàn)[D];哈爾濱工業(yè)大學;2011年

3 陳成斌;針對于家居環(huán)境的語音增強系統(tǒng)的研究與開發(fā)[D];華南理工大學;2015年

4 魏有權;基于噪聲估計的語音增強算法研究[D];昆明理工大學;2015年

5 胡勇;麥克風陣列語音增強算法研究[D];電子科技大學;2014年

6 曹后斌;有色背景噪聲環(huán)境下語音增強系統(tǒng)的設計與實現(xiàn)[D];電子科技大學;2014年

7 馬小惠;陣列語音增強在車載環(huán)境中的應用[D];大連理工大學;2015年

8 李達;無線聲學傳感器網(wǎng)絡中分布式語音增強方法研究[D];大連理工大學;2015年

9 高珍珍;基于梅爾頻譜域HMM的語音增強方法研究[D];北京工業(yè)大學;2015年

10 宋環(huán)宇;全數(shù)字助聽器語音增強算法研究[D];哈爾濱工業(yè)大學;2014年



本文編號:1565172

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/xinxigongchenglunwen/1565172.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權申明:資料由用戶b0179***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com