當(dāng)前位置：主頁 > 科技論文 > 網(wǎng)絡(luò)通信論文 >

面向語音增強的序貫隱馬爾可夫模型時頻語音存在概率估計

發(fā)布時間：2019-02-18 15:19

【摘要】：語音存在概率的估計是語音增強的核心技術(shù)之一,針對傳統(tǒng)的存在概率估計方法是啟發(fā)式的,沒有把存在概率的估計統(tǒng)一到一個理論框架之中,不能保證估計最優(yōu),提出了一種基于序貫隱馬爾可夫模型(SHMM)的存在概率估計方法,在每一子帶上構(gòu)建一個SHMM模型描述對數(shù)功率譜包絡(luò)的時間序列,把譜包絡(luò)序列看作一個在語音和噪聲狀態(tài)之間轉(zhuǎn)移的動態(tài)一階馬爾可夫鏈,采用單高斯函數(shù)構(gòu)建每一狀態(tài)的概率模型,語音狀態(tài)的后驗概率即為語音信號的存在概率。為了滿足算法實時性要求,SHMM參數(shù)估計簡化為一階回歸過程,根據(jù)極大似然準(zhǔn)則逐幀更新模型參數(shù)。實驗表明:SHMM所描述的時序相關(guān)性對存在概率的估計起到關(guān)鍵作用,它優(yōu)于一般的啟發(fā)式估計方法;SHMM算法的語音增強分段信噪比(SegSNR)和對數(shù)譜失真(LSD)性能優(yōu)于經(jīng)典的改進型最小統(tǒng)計量控制遞歸平均(IMCRA)算法。
[Abstract]:The estimation of speech existential probability is one of the core techniques of speech enhancement. The traditional estimation method is heuristic and can not guarantee the optimal estimation without unifying the estimation of existential probability into a theoretical framework. In this paper, a method of estimating the existence probability of (SHMM) based on sequential hidden Markov model is proposed. A SHMM model is constructed on each subband to describe the time series of the logarithmic power spectrum envelope. The spectral envelope sequence is regarded as a dynamic first-order Markov chain which transfers between speech and noise state. The probabilistic model of each state is constructed by using single Gao Si function. The posteriori probability of speech state is the existence probability of speech signal. In order to meet the real-time requirements of the algorithm, the SHMM parameter estimation is simplified as a first-order regression process, and the model parameters are updated frame by frame according to the maximum likelihood criterion. The experiments show that the temporal correlation described by SHMM plays a key role in the estimation of the existence probability, and it is superior to the general heuristic estimation method. The performance of speech enhancement segmented signal-to-noise ratio (SegSNR) and logarithmic spectral distortion (LSD) of SHMM algorithm is superior to that of the classical modified minimum statistic control recursive average (IMCRA) algorithm.
【作者單位】：北京理工大學(xué)多元信息系統(tǒng)實驗室;江西理工大學(xué)信息工程學(xué)院;中國科學(xué)院聲學(xué)研究所
【基金】：國家重點基礎(chǔ)研究發(fā)展計劃(2013CB329302) 國家自然科學(xué)基金(61271426,10925419,90920302,61072124,11074275,11161140319,91120001) 中國科學(xué)院戰(zhàn)略性先導(dǎo)科技專項(面向感知中國的新一代信息技術(shù)研究,XDA06030100,XDA06030500) 國家863計劃(2012AA012503) 中國科學(xué)院重點部署項目(KGZD-EW-103-2) 江西省教育廳科技項目(GJJ13426)資助
【分類號】：TN912.3

【相似文獻】

相關(guān)期刊論文前10條

1 李沖泥,胡光銳;一種改進的子波域語音增強方法[J];通信學(xué)報;1999年04期

2 馬曉紅,殷福亮,陸曉燕,王曉寧;基于小波變換的傳聲器陣列語音增強方法[J];大連理工大學(xué)學(xué)報;2003年04期

3 徐爽,韓芳芳,鄭德忠;基于閾值的小波域語音增強新算法[J];傳感技術(shù)學(xué)報;2004年01期

4 鄒采榮;陳國明;趙力;;基于泄漏約束的DF-GSC語音增強(英文)[J];Journal of Southeast University(English Edition);2007年04期

5 彭煊,劉金福,王炳錫;基于獨立分量分析的語音增強[J];信號處理;2002年05期

6 沈亞強;基于多分辨率子波變換的自適應(yīng)濾波語音增強方法[J];浙江工商職業(yè)技術(shù)學(xué)院學(xué)報;2003年04期

7 錢永玲;面向NGN的三重播放——7302 ISAM語音增強型接入平臺[J];通訊世界;2005年11期

8 李楠;;一種小波變換與維納濾波結(jié)合的語音抗噪研究[J];電聲技術(shù);2007年05期

9 張麗艷;殷福亮;;一種改進的奇異值分解語音增強方法[J];電子與信息學(xué)報;2008年02期

10 徐巖,楊靜,王維漢;基于譜相減改進算法的語音增強研究[J];鐵道學(xué)報;2004年01期

相關(guān)會議論文前10條

1 周小星;王安娜;孫紅英;楊鴻武;;基于壓縮感知過程的語音增強[A];第十一屆全國人機語音通訊學(xué)術(shù)會議論文集（二）[C];2011年

2 陶智;趙鶴鳴;;Bark子波變換在語音增強中的應(yīng)用[A];現(xiàn)代通信理論與信號處理進展——2003年通信理論與信號處理年會論文集[C];2003年

3 歐貴文;柯登峰;;基于噪音估計和參數(shù)估計的優(yōu)化語音增強算法[A];第七屆全國人機語音通訊學(xué)術(shù)會議（NCMMSC7）論文集[C];2003年

4 國雁萌;;一種極低信噪比條件下的語音增強方法[A];第六屆全國人機語音通訊學(xué)術(shù)會議論文集[C];2001年

5 江峰;李曉東;;適用于抑制非平穩(wěn)背景噪聲的語音增強算法[A];中國聲學(xué)學(xué)會2003年青年學(xué)術(shù)會議[CYCA'03]論文集[C];2003年

6 王安娜;周小星;孫紅英;楊鴻武;;基于壓縮感知過程的語音增強新算法[A];第十一屆全國人機語音通訊學(xué)術(shù)會議論文集（一）[C];2011年

7 吳亞棟;吳旭輝;;一種基于自相關(guān)域動態(tài)噪聲估計方式的語音增強法[A];第六屆全國人機語音通訊學(xué)術(shù)會議論文集[C];2001年

8 丁沛;曹志剛;;基于語音增強失真補償?shù)目乖肼曊Z音識別技術(shù)[A];第七屆全國人機語音通訊學(xué)術(shù)會議（NCMMSC7）論文集[C];2003年

9 閻兆立;杜利民;;維納后濾波語音增強算法研究[A];中國聲學(xué)學(xué)會2005年青年學(xué)術(shù)會議[CYCA'05]論文集[C];2005年

10 趙亞麗;付中華;謝磊;張健;張艷寧;;雙麥克風(fēng)語音增強和雜混模型訓(xùn)練相結(jié)合的頑健說話人確認[A];第十一屆全國人機語音通訊學(xué)術(shù)會議論文集（一）[C];2011年

相關(guān)重要報紙文章前7條

1 ;打造三重播放接入平臺[N];中國電子報;2005年

2 ;7302 ISAM面向NGN支持三重播放[N];通信產(chǎn)業(yè)報;2005年

3 王向東欒煥博林守勛錢躍良;語音識別:抗噪音能力有待加強[N];計算機世界;2006年

4 耿青濤;提高無線語音質(zhì)量實現(xiàn)語音增值服務(wù)[N];中國計算機報;2003年

5 ;StudioSound：高性能的語音質(zhì)量[N];通信產(chǎn)業(yè)報;2003年

6 ;其它網(wǎng)絡(luò)編輯選擇獎獲獎產(chǎn)品展示[N];中國計算機報;2002年

7 ;NMS Sonata Ⅲ/Studio Sound級語音增強系統(tǒng)話音更清晰[N];中國計算機報;2003年

相關(guān)博士學(xué)位論文前10條

1 尹偉;基于模型的語音增強方法及質(zhì)量評估研究[D];武漢大學(xué);2009年

2 陶智;低信噪比環(huán)境下語音增強的研究[D];蘇州大學(xué);2011年

3 趙彥平;基于稀疏表示的語音增強方法研究[D];吉林大學(xué);2014年

4 方瑜;語音增強相關(guān)問題研究[D];北京郵電大學(xué);2012年

5 袁文浩;基于噪聲估計的語音增強方法研究[D];華東理工大學(xué);2013年

6 王娜;基于小波變換與約束方差噪聲譜估計的語音增強算法研究[D];燕山大學(xué);2011年

7 王海艷;基于統(tǒng)計模型的語音增強算法研究[D];吉林大學(xué);2011年

8 姚峰英;語音增強系統(tǒng)的研究與實現(xiàn)[D];中國科學(xué)院上海冶金研究所;2001年

9 申麗然;Hilbert-Huang變換及其在含噪語音信號處理中的應(yīng)用研究[D];哈爾濱工程大學(xué);2006年

10 崔瑋瑋;基于麥克風(fēng)陣列的聲源定位與語音增強方法研究[D];清華大學(xué);2009年

相關(guān)碩士學(xué)位論文前10條

1 鄔鑫鋒;基于短時譜估計的語音增強研究[D];湘潭大學(xué);2010年

2 陶智;基于人耳聽覺掩蔽效應(yīng)的語音增強的研究[D];蘇州大學(xué);2003年

3 孔祥波;基于短時幅度譜估計的語音增強方法研究[D];大連理工大學(xué);2000年

4 朱健華;語音增強方法的研究[D];大連理工大學(xué);2002年

5 武睿;數(shù)學(xué)形態(tài)學(xué)在語音增強中的應(yīng)用[D];河北工業(yè)大學(xué);2004年

6 段國和;戰(zhàn)場環(huán)境下的自適應(yīng)語音增強[D];西北工業(yè)大學(xué);2005年

7 王龍;基于DSP的語音增強系統(tǒng)的研究與設(shè)計[D];東華大學(xué);2011年

8 繆春波;語音增強及其相關(guān)技術(shù)的研究[D];大連理工大學(xué);2003年

9 董婧;基于語音增強及小波變換基音檢測的LPC-MBE低速語音編碼算法[D];吉林大學(xué);2004年

10 馮炎;基于噪聲估計和先驗信噪比估計的語音增強算法研究[D];西南交通大學(xué);2010年

，

本文編號：2425970

資料下載

論文發(fā)表

支付寶下載

Download by Alipay
微信下載

Download by Wechat
會員下載

Download by Member

本文鏈接：http://sikaile.net/kejilunwen/wltx/2425970.html

上一篇：認知無線網(wǎng)絡(luò)中的聯(lián)合頻譜檢測關(guān)鍵技術(shù)研究
下一篇：某高架機動相控陣雷達結(jié)構(gòu)總體設(shè)計與研究

論文發(fā)表

·知網(wǎng)|萬方|維普|龍源|省級|國家級|科技核心|北大核心|南大核心CSSCI|EI|SCI|SSCI|

天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

面向語音增強的序貫隱馬爾可夫模型時頻語音存在概率估計