一種基于混合MELP/CELP的4 kbit/s聲碼器

發(fā)布時間：2020-12-21 01:55

　　利用混合激勵線性預測(mixed excitation linear prediction,MELP)算法和碼激勵線性預測(code excitation linear prediction,CELP)算法的優(yōu)點,提出了一種混合MELP/CELP語音編碼模型。編碼端對強濁音幀采用MELP編碼,對弱濁音幀和清音幀進行CELP編碼。MELP編碼器采用相位對齊技術(shù)提取強濁音幀的相位參數(shù),解決了合成語音與原始語音在時間上不同步的問題。對實現(xiàn)的4 kbit/s混合MELP/CELP聲碼器進行客觀MOS(mean opinion score)值和主觀DRT(diagnostic rhythm test)清晰度測試,結(jié)果表明,該聲碼器的合成語音具有較高的可懂度和清晰度。

【文章來源】：重慶郵電大學學報(自然科學版). 2017年02期北大核心

【文章頁數(shù)】：6 頁

【部分圖文】：

混合MELP/CELP聲碼器編碼流程圖

流程圖,聲碼器,流程圖

1為混合MELP/CELP語音編碼流程框圖。編碼器輸入的是8kHz采樣、16bit均勻量化的語音信號，幀長為20ms。對經(jīng)過預處理后的語音幀進行線性預測分析，得到線性預測系數(shù)和殘差信號，殘差信號用于后續(xù)語音特征參數(shù)的提齲編碼端以語音幀的濁音強度值的大小來判定幀的類型，如果是強濁音幀，進行MELP編碼，若是弱濁音幀或清音幀則采用CELP編碼。在進行MELP編碼時，提取強濁音幀的相位參數(shù)以實現(xiàn)相位對齊［6］。語音特征參數(shù)量化編碼后形成比特流，最后加上指示該幀是MELP編碼還是CELP編碼的1bit模式判決位后打包輸出。圖2是混合MELP/CELP語音解碼流程框圖。接收端對接收到的比特流進行解碼，根據(jù)模式判決信息選擇相應(yīng)的MELP或CELP解碼算法。將解碼得到的參數(shù)生成MELP模型激勵源或CELP模型激勵源，通過線性預測合成濾波器后，重構(gòu)出語音信號。將重構(gòu)的語音信號進行后置濾波［7］得到最終的合成語音信號。圖1混合MELP/CELP聲碼器編碼流程圖Fig．1BlockdiagramofhybridMELP/CELPspeechcoding圖2混合MELP/CELP聲碼器解碼流程圖Fig．2BlockdiagramofhybridMELP/CELPspeechdecoding2相位對齊CELP編碼是以逼近原始語音波形為目的，在傳輸?shù)男畔⒅泻邢辔粎?shù)，因此合成的語音波形與原始語音波形在時間上是同步的。而MELP提取的原始語音特征參數(shù)中沒有包含相位信息，導致了合成語音與原始語音在時間上不同步，表現(xiàn)出波形包絡(luò)不一致。因此，混合MELP/CELP聲碼器不能簡單地把解碼后合成的語音信號進行疊接，否則在聽覺上感覺會不自然，導致合成語音質(zhì)量下降。為了解決相位對齊問題，MELP編碼端需提取強濁音幀的相位參數(shù)。2．1相位參數(shù)的提取本文采用相關(guān)法來提取強濁音幀的相位參數(shù)。參與相關(guān)運算的一個信號是欲編碼的線性?

流程圖,聲碼器,流程圖

肕ELP編碼模型，對弱濁音幀和清音幀采用CELP編碼模型，并利用相位對齊技術(shù)解決了MELP在提取原始語音信號特征參數(shù)［5］時沒有考慮相位，造成合成語音與原始語音在時間上不同步的問題。為了與CELP聲碼器編碼幀長一致，把MELP的編碼幀長由22．5ms改為20ms，重新構(gòu)建了線譜對頻率(linespectrumfrequen-cy，LSF)、傅氏級數(shù)幅度語音特征參數(shù)的矢量量化碼本。混合MELP/CELP的4kbit/s聲碼器用C語言進行了實現(xiàn)，經(jīng)測試，本文實現(xiàn)的4kbit/s聲碼器的合成語音具有較高的可懂度和清晰度。1混合MELP/CELP聲碼器編解碼結(jié)構(gòu)圖1為混合MELP/CELP語音編碼流程框圖。編碼器輸入的是8kHz采樣、16bit均勻量化的語音信號，幀長為20ms。對經(jīng)過預處理后的語音幀進行線性預測分析，得到線性預測系數(shù)和殘差信號，殘差信號用于后續(xù)語音特征參數(shù)的提齲編碼端以語音幀的濁音強度值的大小來判定幀的類型，如果是強濁音幀，進行MELP編碼，若是弱濁音幀或清音幀則采用CELP編碼。在進行MELP編碼時，提取強濁音幀的相位參數(shù)以實現(xiàn)相位對齊［6］。語音特征參數(shù)量化編碼后形成比特流，最后加上指示該幀是MELP編碼還是CELP編碼的1bit模式判決位后打包輸出。圖2是混合MELP/CELP語音解碼流程框圖。接收端對接收到的比特流進行解碼，根據(jù)模式判決信息選擇相應(yīng)的MELP或CELP解碼算法。將解碼得到的參數(shù)生成MELP模型激勵源或CELP模型激勵源，通過線性預測合成濾波器后，重構(gòu)出語音信號。將重構(gòu)的語音信號進行后置濾波［7］得到最終的合成語音信號。圖1混合MELP/CELP聲碼器編碼流程圖Fig．1BlockdiagramofhybridMELP/CELPspeechcoding圖2混合MELP/CELP聲碼器解碼流程圖Fig．2BlockdiagramofhybridMELP/CELPspeechdecoding2相位對齊CELP編碼是以逼

【參考文獻】：
博士論文
[1]低速率語音編碼算法研究[D]. 計哲.清華大學 2011

碩士論文
[1]混合激勵MVDR語音編碼技術(shù)研究[D]. 馬震.山東大學 2005

本文編號：2928964

資料下載

論文發(fā)表

支付寶下載

Download by Alipay
微信下載

Download by Wechat
會員下載

Download by Member

本文鏈接：http://sikaile.net/kejilunwen/xinxigongchenglunwen/2928964.html

上一篇：全雙工能量受限中繼網(wǎng)絡(luò)的安全波束成形設(shè)計
下一篇：一種敵我識別輻射源暫態(tài)信號指紋特征提取方法

論文發(fā)表

·知網(wǎng)|萬方|維普|龍源|省級|國家級|科技核心|北大核心|南大核心CSSCI|EI|SCI|SSCI|

天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

一種基于混合MELP/CELP的4 kbit/s聲碼器