天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁 > 科技論文 > 信息工程論文 >

一種基于混合MELP/CELP的4 kbit/s聲碼器

發(fā)布時間:2020-12-21 01:55
  利用混合激勵線性預(yù)測(mixed excitation linear prediction,MELP)算法和碼激勵線性預(yù)測(code excitation linear prediction,CELP)算法的優(yōu)點,提出了一種混合MELP/CELP語音編碼模型。編碼端對強濁音幀采用MELP編碼,對弱濁音幀和清音幀進行CELP編碼。MELP編碼器采用相位對齊技術(shù)提取強濁音幀的相位參數(shù),解決了合成語音與原始語音在時間上不同步的問題。對實現(xiàn)的4 kbit/s混合MELP/CELP聲碼器進行客觀MOS(mean opinion score)值和主觀DRT(diagnostic rhythm test)清晰度測試,結(jié)果表明,該聲碼器的合成語音具有較高的可懂度和清晰度。 

【文章來源】:重慶郵電大學(xué)學(xué)報(自然科學(xué)版). 2017年02期 北大核心

【文章頁數(shù)】:6 頁

【部分圖文】:

一種基于混合MELP/CELP的4 kbit/s聲碼器


混合MELP/CELP聲碼器編碼流程圖

流程圖,聲碼器,流程圖


1為混合MELP/CELP語音編碼流程框圖。編碼器輸入的是8kHz采樣、16bit均勻量化的語音信號,幀長為20ms。對經(jīng)過預(yù)處理后的語音幀進行線性預(yù)測分析,得到線性預(yù)測系數(shù)和殘差信號,殘差信號用于后續(xù)語音特征參數(shù)的提齲編碼端以語音幀的濁音強度值的大小來判定幀的類型,如果是強濁音幀,進行MELP編碼,若是弱濁音幀或清音幀則采用CELP編碼。在進行MELP編碼時,提取強濁音幀的相位參數(shù)以實現(xiàn)相位對齊[6]。語音特征參數(shù)量化編碼后形成比特流,最后加上指示該幀是MELP編碼還是CELP編碼的1bit模式判決位后打包輸出。圖2是混合MELP/CELP語音解碼流程框圖。接收端對接收到的比特流進行解碼,根據(jù)模式判決信息選擇相應(yīng)的MELP或CELP解碼算法。將解碼得到的參數(shù)生成MELP模型激勵源或CELP模型激勵源,通過線性預(yù)測合成濾波器后,重構(gòu)出語音信號。將重構(gòu)的語音信號進行后置濾波[7]得到最終的合成語音信號。圖1混合MELP/CELP聲碼器編碼流程圖Fig.1BlockdiagramofhybridMELP/CELPspeechcoding圖2混合MELP/CELP聲碼器解碼流程圖Fig.2BlockdiagramofhybridMELP/CELPspeechdecoding2相位對齊CELP編碼是以逼近原始語音波形為目的,在傳輸?shù)男畔⒅泻邢辔粎?shù),因此合成的語音波形與原始語音波形在時間上是同步的。而MELP提取的原始語音特征參數(shù)中沒有包含相位信息,導(dǎo)致了合成語音與原始語音在時間上不同步,表現(xiàn)出波形包絡(luò)不一致。因此,混合MELP/CELP聲碼器不能簡單地把解碼后合成的語音信號進行疊接,否則在聽覺上感覺會不自然,導(dǎo)致合成語音質(zhì)量下降。為了解決相位對齊問題,MELP編碼端需提取強濁音幀的相位參數(shù)。2.1相位參數(shù)的提取本文采用相關(guān)法來提取強濁音幀的相位參數(shù)。參與相關(guān)運算的一個信號是欲編碼的線性?

流程圖,聲碼器,流程圖


肕ELP編碼模型,對弱濁音幀和清音幀采用CELP編碼模型,并利用相位對齊技術(shù)解決了MELP在提取原始語音信號特征參數(shù)[5]時沒有考慮相位,造成合成語音與原始語音在時間上不同步的問題。為了與CELP聲碼器編碼幀長一致,把MELP的編碼幀長由22.5ms改為20ms,重新構(gòu)建了線譜對頻率(linespectrumfrequen-cy,LSF)、傅氏級數(shù)幅度語音特征參數(shù)的矢量量化碼本;旌螹ELP/CELP的4kbit/s聲碼器用C語言進行了實現(xiàn),經(jīng)測試,本文實現(xiàn)的4kbit/s聲碼器的合成語音具有較高的可懂度和清晰度。1混合MELP/CELP聲碼器編解碼結(jié)構(gòu)圖1為混合MELP/CELP語音編碼流程框圖。編碼器輸入的是8kHz采樣、16bit均勻量化的語音信號,幀長為20ms。對經(jīng)過預(yù)處理后的語音幀進行線性預(yù)測分析,得到線性預(yù)測系數(shù)和殘差信號,殘差信號用于后續(xù)語音特征參數(shù)的提齲編碼端以語音幀的濁音強度值的大小來判定幀的類型,如果是強濁音幀,進行MELP編碼,若是弱濁音幀或清音幀則采用CELP編碼。在進行MELP編碼時,提取強濁音幀的相位參數(shù)以實現(xiàn)相位對齊[6]。語音特征參數(shù)量化編碼后形成比特流,最后加上指示該幀是MELP編碼還是CELP編碼的1bit模式判決位后打包輸出。圖2是混合MELP/CELP語音解碼流程框圖。接收端對接收到的比特流進行解碼,根據(jù)模式判決信息選擇相應(yīng)的MELP或CELP解碼算法。將解碼得到的參數(shù)生成MELP模型激勵源或CELP模型激勵源,通過線性預(yù)測合成濾波器后,重構(gòu)出語音信號。將重構(gòu)的語音信號進行后置濾波[7]得到最終的合成語音信號。圖1混合MELP/CELP聲碼器編碼流程圖Fig.1BlockdiagramofhybridMELP/CELPspeechcoding圖2混合MELP/CELP聲碼器解碼流程圖Fig.2BlockdiagramofhybridMELP/CELPspeechdecoding2相位對齊CELP編碼是以逼

【參考文獻】:
博士論文
[1]低速率語音編碼算法研究[D]. 計哲.清華大學(xué) 2011

碩士論文
[1]混合激勵MVDR語音編碼技術(shù)研究[D]. 馬震.山東大學(xué) 2005



本文編號:2928964

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/xinxigongchenglunwen/2928964.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶c9109***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com