基于深度學習和稀疏表示的圖像分類與檢索方法研究
發(fā)布時間:2021-12-16 04:02
圖像分類和圖像檢索技術(shù)是當前計算機科學飛速發(fā)展和數(shù)字圖像資源爆發(fā)式增長形勢下智能信息處理領(lǐng)域研究的熱點問題。如何對圖像內(nèi)容進行有效的表示是圖像分類和圖像檢索技術(shù)中一個關(guān)鍵問題。目前,在圖像分類與圖像檢索技術(shù)中,特征描述是圖像表示的主要形式,存在著高維度與復(fù)雜性等問題。圖像的稀疏表示模型作為一種新興的特征表示方法,能夠有效解決實際應(yīng)用中所存在的存儲量、計算復(fù)雜度與圖像解譯性等方面的問題。此外,深度學習技術(shù)的出現(xiàn)使得圖像特征提取不再依賴于受人為主觀因素影響的人工設(shè)計方法,而是著眼于通過大量數(shù)據(jù)來發(fā)掘數(shù)據(jù)中所隱含的深層次關(guān)系,使得圖像特征的描述能力得到進一步的提升。本文主要針對圖像分類和圖像檢索中圖像特征表示問題,研究了基于稀疏表示的圖像表示方法和基于層次化特征提取的深度學習模型,以達到提升圖像分類與檢索性能的目的。本文的主要工作包括:(1)提出一種基于稀疏表示和特征融合的圖像檢索方法:針對目前圖像局部特征表達所存在的高維度與復(fù)雜性等問題,以“稀疏編碼”為核心,通過字典學習、系數(shù)學習、特征池化等一系列操作,構(gòu)建了基于稀疏表示的稀疏特征學習模型,所獲得的特征描述相較于局部特征更具稀疏性與可區(qū)分...
【文章來源】:西安理工大學陜西省
【文章頁數(shù)】:85 頁
【學位級別】:碩士
【部分圖文】:
數(shù)字圖像資源的部分應(yīng)用
形式來表示圖像信息。在早期的 CBIR 和 CBIC 技術(shù)中得的情況下,比如不同的成像條件(光照變化、紅外熱成像目標存在遮擋或部分遮擋、目標與背景交錯雜亂等情況,像分類等應(yīng)用的魯棒性較差,因而效果并不理想,并且隨,準確率反而呈現(xiàn)一種下降的趨勢。一些能夠表述圖像主要內(nèi)容信息的像素信息,即目標像程中,圖像中各個部分所對應(yīng)的像素內(nèi)容對表達圖像內(nèi)容性的。如圖 2-2 所示,在一般的 CBIR 和 CBIC 任務(wù)中,要性上比 B 背景區(qū)域像素內(nèi)容要高。相比較于圖像的全-2 中山羊的胡須、耳朵、身子以及尾巴等等局部所具有目標位置變化、或存在部分遮擋等情況下,其部分特征仍好的可區(qū)分性。因此,圖像的局部特征可以在特定情況下
(a)背景信息 (b)前景目標圖 2-12 圖像低秩性分析圖示Fig.2-12 Schematic diagram of image low rank analysisb.稀疏表示(SR)Olshausen 和 Field 等人[53][54]在《Nature》上發(fā)表的論文證實了自然圖像本身存在著稀疏性這一特性。對于圖像來說,本身就是一種二維信號,根據(jù)圖像的稀疏性和信號的稀疏表示(Sparse representation)理論,研究學者們提出了一種新的圖像表示方法 圖像過完備稀疏表示μ(SR 模型將于本文第三章進行詳細介紹)。首先,通過對圖像進行重疊塊采樣,獲取到用以描述圖像局部的塊特征,以此作為數(shù)據(jù)源,通過字典學習的方法構(gòu)建過完備詞典,即得到用于描述圖像局部特征的基原子的集合。如果構(gòu)造的字典符合人類視覺系統(tǒng)的特性,則圖像過完備稀疏表示模型便能夠獲得更為稀疏的圖像表示。周培誠,韓軍偉等人[55]將圖像過完備稀疏表示理論應(yīng)用在了遙感圖像檢索方向上,通過訓練圖像構(gòu)建超完備視覺詞典對待測試的圖像進行過完備稀疏表示,最后通過查詢圖像與測試圖像的重構(gòu)誤差,采用基于投票策略的相似性度量方法實現(xiàn)了圖像檢索。Wright 等人[56]采用圖像過完備稀疏表示模型進行人臉識別應(yīng)用,首先通過訓練圖像構(gòu)建過完備詞典并對待測試的圖像
本文編號:3537441
【文章來源】:西安理工大學陜西省
【文章頁數(shù)】:85 頁
【學位級別】:碩士
【部分圖文】:
數(shù)字圖像資源的部分應(yīng)用
形式來表示圖像信息。在早期的 CBIR 和 CBIC 技術(shù)中得的情況下,比如不同的成像條件(光照變化、紅外熱成像目標存在遮擋或部分遮擋、目標與背景交錯雜亂等情況,像分類等應(yīng)用的魯棒性較差,因而效果并不理想,并且隨,準確率反而呈現(xiàn)一種下降的趨勢。一些能夠表述圖像主要內(nèi)容信息的像素信息,即目標像程中,圖像中各個部分所對應(yīng)的像素內(nèi)容對表達圖像內(nèi)容性的。如圖 2-2 所示,在一般的 CBIR 和 CBIC 任務(wù)中,要性上比 B 背景區(qū)域像素內(nèi)容要高。相比較于圖像的全-2 中山羊的胡須、耳朵、身子以及尾巴等等局部所具有目標位置變化、或存在部分遮擋等情況下,其部分特征仍好的可區(qū)分性。因此,圖像的局部特征可以在特定情況下
(a)背景信息 (b)前景目標圖 2-12 圖像低秩性分析圖示Fig.2-12 Schematic diagram of image low rank analysisb.稀疏表示(SR)Olshausen 和 Field 等人[53][54]在《Nature》上發(fā)表的論文證實了自然圖像本身存在著稀疏性這一特性。對于圖像來說,本身就是一種二維信號,根據(jù)圖像的稀疏性和信號的稀疏表示(Sparse representation)理論,研究學者們提出了一種新的圖像表示方法 圖像過完備稀疏表示μ(SR 模型將于本文第三章進行詳細介紹)。首先,通過對圖像進行重疊塊采樣,獲取到用以描述圖像局部的塊特征,以此作為數(shù)據(jù)源,通過字典學習的方法構(gòu)建過完備詞典,即得到用于描述圖像局部特征的基原子的集合。如果構(gòu)造的字典符合人類視覺系統(tǒng)的特性,則圖像過完備稀疏表示模型便能夠獲得更為稀疏的圖像表示。周培誠,韓軍偉等人[55]將圖像過完備稀疏表示理論應(yīng)用在了遙感圖像檢索方向上,通過訓練圖像構(gòu)建超完備視覺詞典對待測試的圖像進行過完備稀疏表示,最后通過查詢圖像與測試圖像的重構(gòu)誤差,采用基于投票策略的相似性度量方法實現(xiàn)了圖像檢索。Wright 等人[56]采用圖像過完備稀疏表示模型進行人臉識別應(yīng)用,首先通過訓練圖像構(gòu)建過完備詞典并對待測試的圖像
本文編號:3537441
本文鏈接:http://sikaile.net/kejilunwen/zidonghuakongzhilunwen/3537441.html
最近更新
教材專著