天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁 > 論文百科 > 研究生論文 >

語音信號稀疏表示方法研究

發(fā)布時間:2016-08-06 07:06

第一章  緒論 

1.1  引言 
早期的語音與音頻系統(tǒng)是針對模擬聲信號的,它實現(xiàn)起來容易,但是存在易受噪聲干擾的缺點。隨著信息技術(shù)的發(fā)展,數(shù)字信號處理的方法在越來越多領(lǐng)域得到應(yīng)用。數(shù)字信號易于遠(yuǎn)距離傳輸和存儲,抗干擾能力強,無累積失真,數(shù)字化存儲的信息還可以被高品質(zhì)的還原,這一系列的優(yōu)點促使音頻技術(shù)逐步走向數(shù)字化的方向發(fā)展。 事實上,即使經(jīng)過了數(shù)字化處理,語音信號的傳輸仍然需要付出很多的代價。語音信號攜帶的信息量巨大,一段語音不僅表達(dá)出了文字內(nèi)容的意思,還攜帶了音高、音強、音長、說話人的情緒和語氣等特征信息,與文本信息相比,用語音表達(dá)相同的一段內(nèi)容,信息量要比文本信息大十倍以上。尤其是近年,語音通信多與其他多媒體通信方式相結(jié)合,例如電視電話會議、微信語音聊天等。隨著這些應(yīng)用的流行,人們不僅對語音信息量的需求在逐漸變大,對語音質(zhì)量的要求也邁上了新的臺階。因此,在盡量保證語音通信可靠性的情況下,如何高效地對語音信號進(jìn)行壓縮編碼,降低數(shù)碼率、減少占用帶寬,顯得十分重要。 近年來,對語音信號處理的研究和探索集中在以下幾個主要的方面。語音編碼、信道編碼、語音增強、語音識別、語音情感識別、說話人識別、以及語音壓縮感知等。無論是哪個課題,當(dāng)前的研究方法都是去除語音信號的冗余信息,降維,提取主要特征。許多自然界的信號,如圖像和語音,大多是稀疏或近似稀疏的。稀疏性是信號固有的特性,可以作為先驗知識。如果把語音信號處理比作一座大廈,那么語音信號的稀疏表示就是大廈的基石。實現(xiàn)上述語音領(lǐng)域的研究基礎(chǔ)就是語音信號可以被稀疏表示。 近年來信號處理領(lǐng)域的一個熱點研究是壓縮感知[1],壓縮感知理論指出,如果信號具有稀疏性,就可以投影至某個基矩陣,得到比奈奎斯特采樣定理更少的采樣點,并且可以利用少量的樣點完整的恢復(fù)信號。壓縮感知中最重要的就是感知矩陣,而感知矩陣與稀疏基有密切的關(guān)系。語音信號的稀疏表示是語音壓縮感知的重要組成環(huán)節(jié)。 
........

1.2  語音稀疏表示理論研究現(xiàn)狀 
信號處理中最重要的事情之一是有效表示信號。首先,數(shù)據(jù)存儲和傳輸?shù)馁Y源是有限的,這就需要高效的信號表示以節(jié)省存儲空間。其次,信號不可避免地受到噪聲污染,需要不受噪聲影響的表征。第三,對于如檢測和分類等對信號的分析,信號的稀疏表示可以捕獲更有用的信號特征。特別是語音信號,語音信號在時頻上具有近似稀疏性。因此,用語音的稀疏表示可以從本質(zhì)上降低語音信號處理的成本。 早期的線性表示都是基于線性分辨率變換,例如熟悉的快速傅里葉變換(FFT)、離散余弦變換(DCT)和主成分分析(PCA)等。這些方法的一個重要特點是任何一個信號的表示都會用到所有的元素。隨后,類似于短時傅里葉變換(STFT)、Gabor 變換和小波分析等非線性分辨率變換的方法出現(xiàn),這些方法通過利用基函數(shù)中不同的元素組合獲得更好的近似表示。近幾年,一種新的信號表示方法被提出了并取得了極大的成功——稀疏編碼[5],這種技術(shù)采用一種過完備字典(也稱冗余字典)來替代各種變換,,字典中包含大量的元素信號,這些元素信號被稱作原子。每一個信號由部分原子的線性組合來近似表示。每一個信號可以看成多個原子的線性組合,并允許少量的原子存在非零系數(shù)。需要注意的是,表示信號所需的原子個數(shù)遠(yuǎn)小于過完備字典中含有的原子個數(shù)。 
.........

第二章  語音稀疏表示理論 

2.1  稀疏表示理論基礎(chǔ) 

信號處理過程中,為了便于分析,將信號進(jìn)行稀疏化處理是一種有效的信號處理方式。稀疏化處理方式可以通過某一個變換域上的一組基,將信號進(jìn)行投影,在投影中有效值的數(shù)目盡可能少的條件下,投影結(jié)果還能完全表現(xiàn)信號的本質(zhì)特征。 狹義的線性信號表示是將信號用一組基的線性組合來表示。例如,任意連續(xù)信號都有傅里葉變換,也就是可以用無數(shù)個正弦函數(shù)疊加而成。

......

2.2  稀疏表示理論的關(guān)鍵技術(shù) 
基于冗余字典的信號稀疏表示主要包含兩個熱點研究內(nèi)容:一是構(gòu)造過完備字典;二是稀疏分解算法,稀疏分解算法目的是在給定的字典 D 中尋找出T 個適合的原子的線性組合,也就是尋找稀疏系數(shù)。匹配追蹤算法[6]是最先被提出的一種稀疏分解算法,屬于貪婪算法的一種。MP 算法的主要思想是每一步迭代都選擇最匹配的原子,多次迭代后可實現(xiàn)對信號的逼近。相比上面提到的 BP 算法,MP 算法并不追求全局最優(yōu)解,只是局部最優(yōu)解,并且收斂速度很慢,因此,MP 算法的稀疏分解質(zhì)量也相對較低,只能得到信息的某個用少量原子表示的逼近值。 (3)正交匹配追蹤算法(Orthogonal Matching Pursuit, OMP) 正交匹配追蹤算法也屬于貪婪算法的一種,它與 MP 算法十分近似。唯一不同的是OMP 算法會對迭代中選出的原子進(jìn)行 Gram-Schmidt 正交。MP 算法進(jìn)行稀疏分解時候迭代次數(shù)很多,收斂的很慢。這是由于每次迭代的殘余項mfR 僅與當(dāng)前選出的原子正交,而不是與前面的每個原子正交。如圖 2-2 所示。
.......

第三章  基于 K-SVD 的過完備字典構(gòu)造方法研究 ......... 15 
3.1  字典構(gòu)造原則... 15 
3.2 K-Means 算法 .... 15 
3.3 MOD 算法 ......... 18 
3.4 K-SVD 算法 ...... 19 
3.5  本章小結(jié) ........... 22 
第四章  基于新型 BDS 模型的語音信號字典構(gòu)造方法 ............ 23 
4.1  引言 ........ 23 
4.2 BDS 模型原理 ... 24 
4.3  基于 BDS 模型的字典構(gòu)造實現(xiàn)..... 28 
4.4  實驗與分析 ....... 30 
4.5  本章小結(jié) ........... 35 
第五章  基于非線性核字典的語音信號稀疏表示方法 ... 37 
5.1  引言 ........ 37 
5.1.1  非線性稀疏表示 .......... 37 
5.1.2  語音信號的非線性特點 ........ 39 
5.2  非線性核字典算法原理 ........ 41 
5.3  非線性核字典的實現(xiàn) ............ 47 
5.4  實驗與分析....... 48 
5.5  本章小結(jié) ........... 51 

第五章  基于非線性核字典的語音信號稀疏表示方法 

5.1  引言 

前面章節(jié)中介紹的內(nèi)容都屬于線性范疇。然而,線性表示不適用于實際中的一些非線性結(jié)構(gòu)的數(shù)據(jù)。目前常用的稀疏算法都是利用線性模型,用這些算法解決非線性結(jié)構(gòu)問題結(jié)果會很差。K-SVD 算法作為一個典型的稀疏分解算法,可用于解決分類問題。但如果所分類的兩類目標(biāo)是非線性的,采用 K-SVD 算法進(jìn)行分類,其分類結(jié)果將出現(xiàn)較大偏差。如圖 5-1,兩類目標(biāo)是以非線性規(guī)律存在的,如果使用 K-SVD 算法線性模型對這兩類符號進(jìn)行分類,將可能會產(chǎn)生如圖 5-1(b)的效果。顯然,這個分類結(jié)果不理想,這是由于線性模型的局限性,導(dǎo)致分類只能局限于線性分類。圖(c)是利用非線性模型分類的結(jié)果。 在信號表示中,許多信號并不能直接用字典原子的某一線性組合精確表示,而是可以精確地表示成一部分原子的非線性組合,這樣就導(dǎo)致在低維空間出現(xiàn)線性不可分。針對這一不足,文獻(xiàn)[47]中的非線性聚類分析方法,把之前線性不可分的樣本通過一種非線性映射投影到一個高維特征空間,并通過核函數(shù)在高維空間采用某種線性的分類或回歸技術(shù)實現(xiàn)分類。這樣就避免了確定非線性映射函數(shù)和運算時出現(xiàn)  “維數(shù)災(zāi)難”等問題。 

語音信號稀疏表示方法研究

...........

總結(jié) 

現(xiàn)今,語音仍是使用最廣泛的交流方式。有效的表示語音信號仍是信號處理中重要的事情之一。尤其是當(dāng)今通信行業(yè)面臨的最大問題之一就是傳輸信道的帶寬有限,這就需要高效的信號表示以節(jié)省傳輸空間。另外,還有其他對語音信號的分析和識別等,希望可以捕獲語音信號中更有用的信號特征。語音信號的稀疏表示研究也隨之展開了。 2006 年,Candes,Tao 和 Donoho 提出了壓縮感知理論。壓縮感知理論是對傳統(tǒng)的奈奎斯特定理進(jìn)行的一場革命,而它是以信號的稀疏性為前提條件,隨著壓縮感知研究的發(fā)展,對信號的稀疏表示的研究也越來越得到人們的重視。本文對語音信號的稀疏表示進(jìn)行了深入研究。 自然界的信號大多是稀疏的,語音也不例外。在第一章中,本文驗證了語音信號的稀疏性,簡述了稀疏表示理論的發(fā)展歷程和國內(nèi)外研究現(xiàn)狀,并詳細(xì)解釋了稀疏理論和語音信號處理結(jié)合研究的必要性和先進(jìn)性。 在第二章中,詳細(xì)介紹了稀疏表示理論。首先,詳細(xì)研究了線性稀疏表示理論的數(shù)學(xué)模型及度量標(biāo)準(zhǔn)。隨后,介紹了稀疏表示理論中的兩個關(guān)鍵技術(shù):一個是稀疏分解算法,另外一個是稀疏基的構(gòu)造。稀疏分解算法中較常用的是正交匹配追蹤算法,因為其收斂速度快。關(guān)于稀疏基的構(gòu)造,本文分析了各種稀疏基的特點,認(rèn)為使用冗余字典作為稀疏基最具有靈活性,由于其冗余性,更容易得到更稀疏的表示。最后,本章將稀疏表示與壓縮感知聯(lián)和起來,簡單介紹了壓縮感知理論和壓縮感知中兩個主要技術(shù)手段。說明了語音信號的重構(gòu)依靠壓縮感知。  
.........
參考文獻(xiàn)(略)




本文編號:86182

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/wenshubaike/lwfw/86182.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶fd301***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com