基于稀疏表示的音頻修復(fù)算法研究
發(fā)布時(shí)間:2017-10-18 20:45
本文關(guān)鍵詞:基于稀疏表示的音頻修復(fù)算法研究
更多相關(guān)文章: 音頻修復(fù) 稀疏表示 字典訓(xùn)練 INK-SVD OMP
【摘要】:在現(xiàn)實(shí)生活中,音頻常常會(huì)因?yàn)榄h(huán)境噪聲、網(wǎng)絡(luò)擁塞和設(shè)備限幅等影響,而產(chǎn)生諸如脈沖干擾、片段丟失和削頂失真等情況的受損,降低音頻的可聽度和可懂度。如果音頻應(yīng)用于語音識(shí)別、說話人辨識(shí)等情況,還會(huì)導(dǎo)致相應(yīng)識(shí)別率下降,所以需要對(duì)受損音頻進(jìn)行數(shù)字化修復(fù),還原出受損部分,改善音頻質(zhì)量。針對(duì)目前音頻修復(fù)的研究現(xiàn)狀,本文采用基于稀疏表示的音頻修復(fù)算法;谙∈璞硎镜囊纛l修復(fù)是指在音頻為稀疏信號(hào)的前提下,利用受損音頻中可靠部分的數(shù)據(jù),在過完備字典中進(jìn)行稀疏表示,然后用稀疏重建的方法來恢復(fù)出受損部分。因?yàn)橐纛l中相鄰幀之間信息存在著冗余,丟失的部分信息可以利用周圍冗余信息來補(bǔ)全。算法分為過完備字典構(gòu)造和稀疏表示兩個(gè)環(huán)節(jié)。本文在前人工作的基礎(chǔ)上,針對(duì)這兩個(gè)環(huán)節(jié)進(jìn)行了研究改進(jìn):1.過完備字典訓(xùn)練算法對(duì)于過完備字典構(gòu)造,在之前的文獻(xiàn)中采用固定字典,但是音頻種類繁多,不同的音頻具有不同的基頻和共振峰等特征信息,因此固定字典不能很好的反映出特定音頻的結(jié)構(gòu)化特征,針對(duì)這一問題,本文采用訓(xùn)練的方法得到自適應(yīng)字典,在選擇字典訓(xùn)練算法時(shí),為了兼顧算法的高效性和字典中原子的相關(guān)性,本文選用解耦合的K-SVD字典訓(xùn)練算法,即INK-SVD算法,來對(duì)音頻進(jìn)行訓(xùn)練。2.稀疏表示算法對(duì)于稀疏表示,在之前的文獻(xiàn)中多使用OMP算法,這種算法不會(huì)選擇重復(fù)的原子,稀疏表示誤差小,但是,該算法并沒有充分利用音頻幀之間的相關(guān)性信息,即幀之間是存在很大程度上冗余的,本文通過實(shí)驗(yàn)的方法,證明相關(guān)性的存在,為了利用相關(guān)性信息,本文對(duì)傳統(tǒng)的OMP算法進(jìn)行改進(jìn),在選取原子的時(shí)候,考慮到該原子是否在前一幀用過,如果該原子被前一幀選中,則在下一幀中適當(dāng)增加一個(gè)權(quán)重,權(quán)重的大小根據(jù)幀之間相關(guān)性動(dòng)態(tài)調(diào)整,從而提高原子選取的精確性,降低計(jì)算誤差的影響。本文實(shí)驗(yàn)部分是在Audio Inpainting Toolbox提供的音頻數(shù)據(jù)集上,使用改進(jìn)型基于OMP的音頻修復(fù)算法對(duì)片段缺失、脈沖干擾、削頂失真等三類不同的受損情況,與傳統(tǒng)的固定Gabor字典相比,改進(jìn)算法在信噪比SNR有4-6dB提升,在主觀評(píng)價(jià)指標(biāo)PESQ上有0.2-0.3提升。
【關(guān)鍵詞】:音頻修復(fù) 稀疏表示 字典訓(xùn)練 INK-SVD OMP
【學(xué)位授予單位】:電子科技大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2016
【分類號(hào)】:TN912.3
【目錄】:
- 摘要5-6
- ABSTRACT6-10
- 第一章 緒論10-15
- 1.1 研究背景及意義10-11
- 1.2 國內(nèi)外研究現(xiàn)狀和發(fā)展態(tài)勢(shì)11-13
- 1.3 本文的主要工作13-14
- 1.4 論文的章節(jié)安排14-15
- 第二章 音頻修復(fù)和稀疏表示理論基礎(chǔ)15-34
- 2.1 音頻信號(hào)處理基本知識(shí)15-21
- 2.1.1 音頻信號(hào)的基本概念15-18
- 2.1.2 音頻信號(hào)的時(shí)頻表示18-21
- 2.2 音頻修復(fù)數(shù)學(xué)模型21-25
- 2.2.1 音頻失真問題建模22-25
- 2.2.2 分幀和重建25
- 2.3 音頻稀疏表示理論25-31
- 2.3.1 音頻的稀疏表示26-27
- 2.3.2 過完備字典構(gòu)造27-31
- 2.3.2.1 固定字典28-29
- 2.3.2.2 自適應(yīng)字典29-31
- 2.4 音頻信號(hào)修復(fù)效果的評(píng)價(jià)方法31-33
- 2.4.1 客觀評(píng)價(jià)方法31-32
- 2.4.2 主觀評(píng)價(jià)方法32-33
- 2.5 本章小結(jié)33-34
- 第三章 改進(jìn)型稀疏表示音頻修復(fù)算法設(shè)計(jì)34-55
- 3.1 基于稀疏表示音頻修復(fù)算法介紹34-36
- 3.2 INK-SVD算法介紹36-46
- 3.2.1 字典解耦合39-43
- 3.2.1.1 兩個(gè)原子的解耦合40-41
- 3.2.1.2 多個(gè)原子的解耦合41-43
- 3.2.2 K-SVD算法43-46
- 3.3. 改進(jìn)型OMP音頻修復(fù)算法46-52
- 3.3.1 OMP算法46-47
- 3.3.2 改進(jìn)型OMP算法47-52
- 3.4 音頻修復(fù)原理分析52-54
- 3.4.1 對(duì)片段缺失的修復(fù)52
- 3.4.2 對(duì)脈沖噪聲的修復(fù)52-53
- 3.4.3 對(duì)削頂失真的修復(fù)53-54
- 3.5 本章小結(jié)54-55
- 第四章 改進(jìn)型稀疏表示音頻修復(fù)算法實(shí)現(xiàn)55-69
- 4.1 片段缺失的修復(fù)實(shí)驗(yàn)55-58
- 4.1.1 固定長度缺失片段的修復(fù)56-57
- 4.1.2 不同長度缺失片段的修復(fù)57-58
- 4.2 脈沖噪聲的修復(fù)實(shí)驗(yàn)58-61
- 4.2.1 固定長度脈沖干擾的修復(fù)58-60
- 4.2.2 不同長度脈沖干擾的修復(fù)60-61
- 4.3 削頂失真的修復(fù)實(shí)驗(yàn)61-65
- 4.3.1 削頂?shù)燃?jí)固定的音頻修復(fù)61-63
- 4.3.2 削頂?shù)燃?jí)不同條件下的修復(fù)63-64
- 4.3.3 不同約束條件下削頂失真的修復(fù)64-65
- 4.4 實(shí)驗(yàn)參數(shù)優(yōu)化65-68
- 4.4.1 字典相關(guān)性閾值65-66
- 4.4.2 迭代次數(shù)66-67
- 4.4.3 幀移67
- 4.4.4 稀疏度67-68
- 4.5 本章小結(jié)68-69
- 第五章 總結(jié)與展望69-71
- 5.1 總結(jié)69-70
- 5.2 展望70-71
- 致謝71-72
- 參考文獻(xiàn)72-77
【參考文獻(xiàn)】
中國期刊全文數(shù)據(jù)庫 前4條
1 湯紅忠;張小剛;陳華;程煒;唐美玲;;帶邊界條件約束的非相干字典學(xué)習(xí)方法及其稀疏表示[J];自動(dòng)化學(xué)報(bào);2015年02期
2 李洋;李雙田;;壓縮感知下的稀疏表示語聲恢復(fù)模型與算法[J];信號(hào)處理;2014年08期
3 鄧峰;鮑長春;鮑楓;;基于核Fisher判別和加權(quán)碼書映射的音頻信號(hào)削波修復(fù)方法[J];數(shù)據(jù)采集與處理;2014年02期
4 劉春花;付強(qiáng);楊家瑋;顏永紅;;音頻信號(hào)截幅失真的檢測(cè)與修復(fù)[J];聲學(xué)技術(shù);2009年04期
中國碩士學(xué)位論文全文數(shù)據(jù)庫 前3條
1 隋經(jīng)緯;人工語音帶寬擴(kuò)展算法研究[D];大連理工大學(xué);2014年
2 李占輝;基于小波變換的音頻修復(fù)技術(shù)研究與實(shí)現(xiàn)[D];東華大學(xué);2010年
3 劉春花;音頻信號(hào)修復(fù)的算法研究[D];西安電子科技大學(xué);2009年
,本文編號(hào):1057100
本文鏈接:http://sikaile.net/kejilunwen/xinxigongchenglunwen/1057100.html
最近更新
教材專著