基于壓縮感知的語音數(shù)字編碼技術(shù)研究
發(fā)布時(shí)間:2017-04-25 18:07
本文關(guān)鍵詞:基于壓縮感知的語音數(shù)字編碼技術(shù)研究,,由筆耕文化傳播整理發(fā)布。
【摘要】:“大數(shù)據(jù)”(Big Data)時(shí)代的到來帶來了飛速增長的信息量和信息處理任務(wù)。傳統(tǒng)的奈奎斯特采樣定理提出的最低采樣速率在面對超寬帶信號或冗余度較高的信號時(shí),不僅在采樣端處理任務(wù)復(fù)雜,而且在后續(xù)的存儲和壓縮時(shí)對系統(tǒng)資源造成了浪費(fèi)。壓縮感知技術(shù)近年來由于可以實(shí)現(xiàn)對信號在采樣過程中同時(shí)壓縮,受到信號處理領(lǐng)域的廣泛關(guān)注。對于完整的數(shù)字語音處理系統(tǒng)而言,采樣后的量化編碼也是一個(gè)重要的環(huán)節(jié)。然而,目前壓縮感知理論還處于研究的起步階段,對壓縮采樣后的觀測序列處理技術(shù)如編碼的研究還很少涉及。壓縮感知技術(shù)作為一種可以代替奈氏采樣的信號采樣技術(shù),而編碼是壓縮感知從理論走向?qū)嶋H應(yīng)用的必要前提。在這樣的背景下,本文以壓縮感知為基礎(chǔ),研究語音信號壓縮感知觀測序列的數(shù)字編碼技術(shù)。論文的主要工作和創(chuàng)新點(diǎn)歸納如下:(1)經(jīng)典的基于奈氏采樣語音壓縮編碼技術(shù)中,基于模型的編碼得到廣泛應(yīng)用。受到傳統(tǒng)語音模型中正弦模型的啟發(fā),本文首先對一種利用正弦原子構(gòu)造的字典和正交匹配追蹤算法對語音壓縮感知觀測序列進(jìn)行建模,對于每幀觀測序列幅度、相位和頻率三類參數(shù),根據(jù)各類信號序列自身特點(diǎn)采用合適的編碼方式進(jìn)行編碼,提高傳輸?shù)男。在解碼端,利用解碼后的參數(shù)合成觀測序列。之后對其利用基追蹤算法重構(gòu)出合成語音信號,并后置低通濾波器提高合成語音的人耳聽覺效果。仿真實(shí)驗(yàn)表明:該編碼方案在實(shí)現(xiàn)對語音信號觀測序列壓縮編碼的同時(shí),主客觀重構(gòu)質(zhì)量均可以得到保證。(2)利用壓縮感知框架下行階梯矩陣投影后觀測序列可保留部分語音特性的特點(diǎn),采用稀疏表示字典對觀測序列進(jìn)行數(shù)學(xué)建模的方法,設(shè)計(jì)了一種新型語音壓縮感知編解碼器。首先在訓(xùn)練階段,先利用K奇異值分解方法對大量訓(xùn)練語音通過行階梯投影后的觀測序列進(jìn)行訓(xùn)練,得到一個(gè)語音觀測序列碼本字典;然后在編碼階段,選取字典內(nèi)的少量原子對實(shí)時(shí)語音觀測序列建模,編碼時(shí)僅對少量選擇原子的位置和幅度進(jìn)行編碼并傳輸;解碼端利用恢復(fù)后的觀測序列和壓縮感知重構(gòu)算法恢復(fù)語音信號。通過仿真實(shí)驗(yàn)表明:基于稀疏表示的語音觀測序列編碼方案可有效的降低編碼傳輸碼率,并且保證良好的重構(gòu)語音性能。
【關(guān)鍵詞】:壓縮感知 語音編解碼 觀測序列 行階梯矩陣 正弦字典 稀疏表示
【學(xué)位授予單位】:南京郵電大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2015
【分類號】:TN912.3
【目錄】:
- 摘要4-5
- Abstract5-9
- 專用術(shù)語注釋表9-11
- 第一章 緒論11-18
- 1.1 壓縮感知理論的發(fā)展情況11-13
- 1.2 語音編碼發(fā)展及研究現(xiàn)狀13-16
- 1.3 課題來源及研究內(nèi)容16-17
- 1.4 本文的結(jié)構(gòu)安排17-18
- 第二章 壓縮感知理論與技術(shù)18-35
- 2.1 引言18
- 2.2 壓縮感知基本理論18-24
- 2.2.1 數(shù)學(xué)模型18-20
- 2.2.2 信號的稀疏性20-21
- 2.2.3 觀測矩陣設(shè)計(jì)21-22
- 2.2.4 重構(gòu)算法22-24
- 2.3 語音信號CS系統(tǒng)框架24-34
- 2.3.1 觀測矩陣選取及性能分析25-27
- 2.3.2 語音稀疏矩陣選取及仿真27-30
- 2.3.3 重構(gòu)算法性能分析及仿真30-34
- 2.4 本章小結(jié)34-35
- 第三章 語音壓縮感知正弦字典參數(shù)編碼技術(shù)研究35-52
- 3.1 引言35-36
- 3.2 正弦模型和匹配追蹤36-38
- 3.2.1 語音信號的正弦模型36-37
- 3.2.2 匹配追蹤原理37-38
- 3.3 基于匹配追蹤的觀測序列正弦字典編碼38-46
- 3.3.1 行階梯觀測序列分析38-40
- 3.3.2 基于匹配追蹤和正弦字典的語音觀測序列模型40-41
- 3.3.3 模型參數(shù)編碼方案41-44
- 3.3.4 矢量量化和碼本構(gòu)造44-46
- 3.4 實(shí)驗(yàn)仿真與結(jié)果分析46-51
- 3.5 本章小結(jié)51-52
- 第四章 基于稀疏表示的語音壓縮感知編碼52-64
- 4.1 引言52
- 4.2 稀疏表示理論52-54
- 4.3 冗余字典簡介54-56
- 4.3.1 基于調(diào)和分析的字典54-55
- 4.3.2 基于樣本訓(xùn)練的字典55-56
- 4.4 稀疏表示在語音壓縮感知編碼中的應(yīng)用56-60
- 4.5 實(shí)驗(yàn)仿真與結(jié)果分析60-63
- 4.6 本章小結(jié)63-64
- 第五章 總結(jié)與展望64-66
- 5.1 論文總結(jié)64
- 5.2 下一步研究方向64-66
- 參考文獻(xiàn)66-70
- 附錄1 攻讀碩士學(xué)位期間撰寫的論文70-71
- 附錄2 攻讀碩士學(xué)位期間申請的專利71-72
- 附錄3 攻讀碩士學(xué)位期間參加的科研項(xiàng)目72-73
- 致謝73
【相似文獻(xiàn)】
中國期刊全文數(shù)據(jù)庫 前3條
1 張政偉;樊養(yǎng)余;汪凱斌;;由單變量受擾觀測序列估計(jì)混沌系統(tǒng)敏感參數(shù)[J];系統(tǒng)仿真學(xué)報(bào);2007年14期
2 康健;宋元章;;利用多維觀測序列的KCFM混合模型檢測新型P2P botnet[J];武漢大學(xué)學(xué)報(bào)(信息科學(xué)版);2010年05期
3 ;[J];;年期
中國碩士學(xué)位論文全文數(shù)據(jù)庫 前4條
1 李尚靖;基于壓縮感知的語音數(shù)字編碼技術(shù)研究[D];南京郵電大學(xué);2015年
2 嚴(yán)菲;基于正交匹配追蹤算法的壓縮感知觀測序列的正弦字典建模研究[D];南京郵電大學(xué);2014年
3 郭海亮;基于GEP算法的壓縮感知觀測序列建模[D];陜西師范大學(xué);2014年
4 朱俊華;壓縮采樣環(huán)境下的語音數(shù)字編碼技術(shù)及量化噪聲對信號重構(gòu)影響的研究[D];南京郵電大學(xué);2014年
本文關(guān)鍵詞:基于壓縮感知的語音數(shù)字編碼技術(shù)研究,由筆耕文化傳播整理發(fā)布。
本文編號:326787
本文鏈接:http://sikaile.net/kejilunwen/wltx/326787.html
最近更新
教材專著