基于MELP的低速率聲碼器矢量量化技術研究
本文關鍵詞:基于MELP的低速率聲碼器矢量量化技術研究,由筆耕文化傳播整理發(fā)布。
【摘要】:隨著通信技術的發(fā)展,圖像、數(shù)據(jù)等非語音信息在信息傳遞中所占比例越來越高,但語音通信仍然是目前大多數(shù)通信系統(tǒng)的主要功能。在陸地蜂窩移動通信和衛(wèi)星移動通信系統(tǒng)中,語音通信量的高速增長與有限的無線頻帶資源的矛盾越來越突出。高質(zhì)量低速率語音編碼器的應用成為提高頻帶資源利用率,增大通信系統(tǒng)容量的主要方法之一,高效的語音編解碼算法是近年來研究的重點和熱點。矢量量化作為一種高效的數(shù)據(jù)壓縮技術,由于其壓縮比大且解碼簡單在語音編碼領域中起著非常重要的作用,矢量量化性能的好壞直接影響著合成語音質(zhì)量的高低。因此,本文深入學習了矢量量化技術的基本原理,研究了粒子群算法和混沌算法的特性,結合它們在尋優(yōu)求解過程中的特點,針對傳統(tǒng)矢量量化碼書設計算法的不足,提出了一種基于混沌粒子群的碼書設計改進算法。采用該算法設計出了語音特征參數(shù)線譜對頻率(Linear Spectrum Frequency,LSF)矢量量化碼書,并應用到標準2.4kbps混合激勵線性預測(Mixed Excited Linear Predictive,MELP)聲碼器中。通過與LBG(Linde Buzo Gray)和粒子群碼書設計算法的比較,使用本文算法設計的碼書,聲碼器的合成語音平均譜失真最低,說明了采用混沌粒子群碼書設計算法設計出的碼書具有良好量化性能。本文研究了2.4kbps MELP聲碼器編解碼流程及關鍵算法原理,在此基礎上充分利用語音幀間的相關性,采用多幀聯(lián)合量化技術,進一步降低了語音編碼器的輸出碼率,實現(xiàn)了一個1.2kbps低速率聲碼器。利用本文提出的基于混沌粒子群的碼書設計算法生成了殘差諧波幅度、線譜對頻率矢量量化碼書。通過客觀平均意見得分(Mean Opinion Score,MOS)和判斷韻字測試(Diagnostic Rhyme Test,DRT)兩個指標對該聲碼器的合成語音質(zhì)量進行測試,結果表明本文設計的1.2kbps聲碼器的合成語音具有較高的清晰度和可懂度,也說明了本文提出的矢量量化碼書設計改進算法具有較廣泛的應用前景。
【關鍵詞】:矢量量化 混合激勵線性預測 多幀聯(lián)合量化 碼書設計
【學位授予單位】:重慶郵電大學
【學位級別】:碩士
【學位授予年份】:2016
【分類號】:TN912.3;TP18
【目錄】:
- 摘要3-4
- abstract4-9
- 第1章 緒論9-16
- 1.1 研究背景和意義9-10
- 1.2 研究現(xiàn)狀10-12
- 1.2.1 低速率語音編碼技術研究現(xiàn)狀10-11
- 1.2.2 矢量量化技術研究現(xiàn)狀11-12
- 1.3 語音編碼的性能評價12-15
- 1.3.1 語音質(zhì)量12-14
- 1.3.2 系統(tǒng)開銷14-15
- 1.4 論文的研究工作及章節(jié)安排15-16
- 第2章 MELP聲碼器相關理論16-29
- 2.1 低速率語音編碼基礎16-18
- 2.1.1 語音信號的特性16-17
- 2.1.2 MELP聲碼器模型17-18
- 2.2 語音特征參數(shù)的提取18-25
- 2.2.1 基音周期的計算18-20
- 2.2.2 帶通清/濁音強度分析20-21
- 2.2.3 線性預測分析21-22
- 2.2.4 增益的計算22
- 2.2.5 殘差諧波幅度的計算22
- 2.2.6 MELP聲碼器比特分配及參數(shù)量化22-25
- 2.3 MELP聲碼器解碼原理25-28
- 2.3.1 基音周期解碼及糾錯25
- 2.3.2 噪聲衰減25-26
- 2.3.3 混合激勵生成26-27
- 2.3.4 語音合成27-28
- 2.4 本章小結28-29
- 第3章 基于混沌粒子群算法的矢量量化29-45
- 3.1 矢量量化的相關理論29-32
- 3.1.1 矢量量化的定義29-30
- 3.1.2 矢量量化的失真測度及客觀評價指標30-31
- 3.1.3 矢量量化的特點31-32
- 3.2 典型矢量量化器及碼書設計算法32-36
- 3.2.1 矢量量化器32-34
- 3.2.2 LBG算法34-36
- 3.3 混沌粒子群碼書設計算法36-41
- 3.3.1 粒子群算法概述36-39
- 3.3.2 混沌粒子群碼書設計算法39-41
- 3.4 軟件仿真實現(xiàn)與性能評價41-44
- 3.4.1 譜失真42-43
- 3.4.2 客觀MOS分評價43-44
- 3.5 本章小結44-45
- 第4章 1.2kbps MELP聲碼器的設計45-58
- 4.1 編碼器的設計45-51
- 4.1.1 語音特征參數(shù)提取及量化45-48
- 4.1.2 糾錯編碼48-49
- 4.1.3 比特分配方案及發(fā)送順序49-51
- 4.2 解碼器的設計51-52
- 4.3 聲碼器的性能測試52-57
- 4.3.1 合成語音時域波形圖和語譜圖對比52-55
- 4.3.2 客觀MOS分測試55-56
- 4.3.3 主觀DRT測試56-57
- 4.4 本章小結57-58
- 第5章 總結與展望58-60
- 5.1 論文總結58-59
- 5.2 后續(xù)研究工作59-60
- 參考文獻60-64
- 附錄A DRT發(fā)音字表實例64-65
- 附錄B DRT記錄表實例65-66
- 附錄C 漢語清晰度診斷押韻測試計分規(guī)則66-70
- 致謝70-71
- 攻讀碩士學位期間從事的科研工作及取得的成果71
【參考文獻】
中國期刊全文數(shù)據(jù)庫 前10條
1 曾鎮(zhèn)城;郁文賢;;一種基于MELP的300bps聲碼器設計[J];信息技術;2014年10期
2 楊淑瑩;劉旭鵬;陶沖;劉婷婷;;基于免疫貓群優(yōu)化算法的矢量量化的碼書設計及語音識別[J];模式識別與人工智能;2014年07期
3 郭艷菊;陳雷;陳國鷹;;基于改進人工蜂群的圖像矢量量化碼書設計算法[J];計算機應用;2013年09期
4 孔令夷;;混沌遺傳算法尋優(yōu)有約束旅行商路徑[J];微電子學與計算機;2013年08期
5 石喬林;韋凱;吳輝;;一種基于MELP模型600bps聲碼器的設計[J];電子與封裝;2012年10期
6 李殷;李飛;;基于量子粒子群優(yōu)化算法的矢量量化碼書設計[J];電視技術;2012年17期
7 胥小波;鄭康鋒;李丹;武斌;楊義先;;新的混沌粒子群優(yōu)化算法[J];通信學報;2012年01期
8 馮曉榮;劉曉明;田雨;;改進的MELP低速率語音編碼器[J];計算機工程與應用;2011年29期
9 張濤;于鳳萍;張海;韓笑青;;一種基于模糊聚類的矢量量化碼書生成算法[J];天津大學學報;2011年02期
10 戴懷宇,曹志剛;語音增強IMBE聲碼器研究[J];通信學報;1998年04期
本文關鍵詞:基于MELP的低速率聲碼器矢量量化技術研究,由筆耕文化傳播整理發(fā)布。
,本文編號:438198
本文鏈接:http://sikaile.net/kejilunwen/zidonghuakongzhilunwen/438198.html