甚低速率語音編碼算法研究

發(fā)布時間：2020-04-17 00:25

【摘要】：近年來隨著數(shù)字化通信技術(shù)的高速發(fā)展,頻率資源越發(fā)寶貴。降低語音編碼速率可以提高信道的利用率和節(jié)約開銷,對實踐有極大的指導(dǎo)意義和實用價值。因此低速率語音編碼是未來語音編碼技術(shù)的重要發(fā)展方向之一�；旌霞罹€性預(yù)測算法是低速率語音編碼(MELP)算法中最具潛力的編碼器之一,它以線性預(yù)測模型為基礎(chǔ),結(jié)合多帶思想,新增五項關(guān)鍵技術(shù),使合成語音質(zhì)量明顯提升。本文以聯(lián)邦標準MELP為基礎(chǔ)研究對象。通過了解MELP算法的基本原理和實現(xiàn)方法,并進行系統(tǒng)的研究和分析,設(shè)計了一種0.6kb/s的甚低速率語音編解碼算法。同時詳細分析各個參數(shù)對合成語音質(zhì)量的影響,從清濁音判決和基音周期兩方面改進,以提高合成語音的質(zhì)量。0.6kb/s算法的實現(xiàn)是采用聯(lián)合幀的思想。本論文在MELP模型基礎(chǔ)上增加處理幀長到200個樣點,并將四幀組成一個超幀,以超幀為單位對參數(shù)進行量化傳輸,超幀共量化60bit。四個子幀的清濁狀態(tài)共有16種組合,根據(jù)它們出現(xiàn)的概率,我們劃分為四種模式或者兩大類,分別代表清音類和濁音類。根據(jù)不同的分類對提取的參數(shù)進行最優(yōu)的比特分配。清音類不傳輸基音周期,每個子幀的10個LSF參數(shù)均用一級矢量器量化為11比特。濁音類的超幀中的后三個子幀的基音周期進行均勻量化傳輸,第一子幀基音周期不傳輸。對于線譜頻率,只有第二子幀和第四子幀的LSF被傳輸和量化,每子幀LSF使用一級矢量器量化為11比特。增益是為了使合成語音與原信號幅度相匹配。分別從第二子幀和第四子幀提取兩個增益,將這四個增益組合一個四維矢量,用矢量量化器將這個矢量量化為10比特。其它的比特用來傳輸子帶清濁判決,其中第一子帶清濁判決必須傳輸。在解碼端,首先根據(jù)第一子帶的清濁判決情況進行模式判斷,然后再進行參數(shù)譯碼和插值恢復(fù)四組參數(shù)。超幀矢量量化方法使標準MELP編碼算法速率降低到0.6kb/s。測試結(jié)果表明,0.6kb/s的編碼算法合成語音質(zhì)量PESQ值為2.18,比標準算法PESQ值平均低了0.534,合成語音的可懂度高。提高合成語音質(zhì)量從清濁音判決和基音周期兩方面進行改進。首先在編碼端將增加一種語音判決,即過渡段。將清音誤判為濁音處理,對合成語音質(zhì)量影響不大,反之將濁音判為清音處理,音質(zhì)變差,因此采取自適應(yīng)窗提取過渡段線性預(yù)測系數(shù),使其提取的預(yù)測系數(shù)包含更多的濁音信息。其次在提取基音周期時,對輸入的語音信號進行上采樣,因為上采樣可以使數(shù)字信號更接近于原始模擬信號,使提取基音周期能更準確,因此能提高合成語音質(zhì)量。測試結(jié)果表明基音周期和過渡段線性預(yù)測分析的改進使MELP標準算法的PESQ值提升了0.061。
【學(xué)位授予單位】：西安電子科技大學(xué)
【學(xué)位級別】：碩士
【學(xué)位授予年份】：2014
【分類號】：TN912.3

【參考文獻】

相關(guān)期刊論文前1條

1 叢鍵;張知易;;一種600bps極低速率語音編碼算法[J];電子與信息學(xué)報;2007年02期

，

本文編號：2630221

資料下載

論文發(fā)表

支付寶下載

Download by Alipay
微信下載

Download by Wechat
會員下載

Download by Member

本文鏈接：http://sikaile.net/kejilunwen/wltx/2630221.html

上一篇：數(shù)字射頻存儲與處理系統(tǒng)的設(shè)計實現(xiàn)與實驗研究
下一篇：基于靜息態(tài)腦電的腦卒中患者大腦異�；顒友芯�

論文發(fā)表

·知網(wǎng)|萬方|維普|龍源|省級|國家級|科技核心|北大核心|南大核心CSSCI|EI|SCI|SSCI|

天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

甚低速率語音編碼算法研究