甚低速率語音編碼算法研究
發(fā)布時間:2020-04-17 00:25
【摘要】:近年來隨著數(shù)字化通信技術(shù)的高速發(fā)展,頻率資源越發(fā)寶貴。降低語音編碼速率可以提高信道的利用率和節(jié)約開銷,對實踐有極大的指導(dǎo)意義和實用價值。因此低速率語音編碼是未來語音編碼技術(shù)的重要發(fā)展方向之一;旌霞罹性預(yù)測算法是低速率語音編碼(MELP)算法中最具潛力的編碼器之一,它以線性預(yù)測模型為基礎(chǔ),結(jié)合多帶思想,新增五項關(guān)鍵技術(shù),使合成語音質(zhì)量明顯提升。本文以聯(lián)邦標(biāo)準(zhǔn)MELP為基礎(chǔ)研究對象。通過了解MELP算法的基本原理和實現(xiàn)方法,并進(jìn)行系統(tǒng)的研究和分析,設(shè)計了一種0.6kb/s的甚低速率語音編解碼算法。同時詳細(xì)分析各個參數(shù)對合成語音質(zhì)量的影響,從清濁音判決和基音周期兩方面改進(jìn),以提高合成語音的質(zhì)量。0.6kb/s算法的實現(xiàn)是采用聯(lián)合幀的思想。本論文在MELP模型基礎(chǔ)上增加處理幀長到200個樣點,并將四幀組成一個超幀,以超幀為單位對參數(shù)進(jìn)行量化傳輸,超幀共量化60bit。四個子幀的清濁狀態(tài)共有16種組合,根據(jù)它們出現(xiàn)的概率,我們劃分為四種模式或者兩大類,分別代表清音類和濁音類。根據(jù)不同的分類對提取的參數(shù)進(jìn)行最優(yōu)的比特分配。清音類不傳輸基音周期,每個子幀的10個LSF參數(shù)均用一級矢量器量化為11比特。濁音類的超幀中的后三個子幀的基音周期進(jìn)行均勻量化傳輸,第一子幀基音周期不傳輸。對于線譜頻率,只有第二子幀和第四子幀的LSF被傳輸和量化,每子幀LSF使用一級矢量器量化為11比特。增益是為了使合成語音與原信號幅度相匹配。分別從第二子幀和第四子幀提取兩個增益,將這四個增益組合一個四維矢量,用矢量量化器將這個矢量量化為10比特。其它的比特用來傳輸子帶清濁判決,其中第一子帶清濁判決必須傳輸。在解碼端,首先根據(jù)第一子帶的清濁判決情況進(jìn)行模式判斷,然后再進(jìn)行參數(shù)譯碼和插值恢復(fù)四組參數(shù)。超幀矢量量化方法使標(biāo)準(zhǔn)MELP編碼算法速率降低到0.6kb/s。測試結(jié)果表明,0.6kb/s的編碼算法合成語音質(zhì)量PESQ值為2.18,比標(biāo)準(zhǔn)算法PESQ值平均低了0.534,合成語音的可懂度高。提高合成語音質(zhì)量從清濁音判決和基音周期兩方面進(jìn)行改進(jìn)。首先在編碼端將增加一種語音判決,即過渡段。將清音誤判為濁音處理,對合成語音質(zhì)量影響不大,反之將濁音判為清音處理,音質(zhì)變差,因此采取自適應(yīng)窗提取過渡段線性預(yù)測系數(shù),使其提取的預(yù)測系數(shù)包含更多的濁音信息。其次在提取基音周期時,對輸入的語音信號進(jìn)行上采樣,因為上采樣可以使數(shù)字信號更接近于原始模擬信號,使提取基音周期能更準(zhǔn)確,因此能提高合成語音質(zhì)量。測試結(jié)果表明基音周期和過渡段線性預(yù)測分析的改進(jìn)使MELP標(biāo)準(zhǔn)算法的PESQ值提升了0.061。
【學(xué)位授予單位】:西安電子科技大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2014
【分類號】:TN912.3
本文編號:2630221
【學(xué)位授予單位】:西安電子科技大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2014
【分類號】:TN912.3
【參考文獻(xiàn)】
相關(guān)期刊論文 前1條
1 叢鍵;張知易;;一種600bps極低速率語音編碼算法[J];電子與信息學(xué)報;2007年02期
,本文編號:2630221
本文鏈接:http://sikaile.net/kejilunwen/wltx/2630221.html
最近更新
教材專著