圖像場景識別的特征研究
發(fā)布時間:2017-09-28 20:00
本文關(guān)鍵詞:圖像場景識別的特征研究
更多相關(guān)文章: 圖像場景識別 LDA(Latent Dirichlet Allocation) 主題特征 目標(biāo)屬性特征 稀疏編碼 空間金字塔
【摘要】:圖像場景識別是根據(jù)場景相似性對圖像進(jìn)行分類。人類在完成場景識別時需要深刻理解圖像從而形成高層次的抽象概念,而計算機(jī)則是直接面向圖像的數(shù)字存儲形式做出判斷。人所理解的“概念相似性”與計算機(jī)理解的“數(shù)字存儲形式相似性”之間的“語義鴻溝”(Semantic Gap)是圖像場景識別面臨的重要問題之一。提取高層次的特征從而深度挖掘圖像中的信息可以有效跨越“語義鴻溝”,提高識別準(zhǔn)確率。 圍繞用于圖像場景識別的特征研究,論文的主要研究工作如下: 1.提出了一種可高效提取和分類的主題特征(Efficient Topic Feature,E-TF)。目前常見的使用主題模型表達(dá)新圖像時需要進(jìn)行主題潛變量推理,因此計算量較大,同時由于主題建模時需要已知標(biāo)簽從而造成標(biāo)簽和特征的耦合。為解決該問題,使用潛在狄利克雷分配(Latent Dirichlet Allocation,LDA)模型的潛變量及其學(xué)習(xí)算法構(gòu)造了一種主題表示,并通過主題模型的潛變量進(jìn)一步提出了可高效提取和分類的主題特征。該主題特征在所有類別中共享主題空間,提取過程無需類別標(biāo)簽,從而避免了特征與標(biāo)簽的耦合;對圖像碼字進(jìn)行簡單的線性映射即可完成E-TF的提取,從而大幅減小了計算量。通過類似的實(shí)驗(yàn)條件對比了其它三種相似特征,并在15-Scenes數(shù)據(jù)集上對比了pooling方法,,結(jié)果表明E-TF可以獲得更高的識別準(zhǔn)確率。 2.提出了低維目標(biāo)屬性(Low Dimensionality Object Bank,LD-OB)特征。目標(biāo)屬性特征是圖像的一種高層特征,具有很高的識別準(zhǔn)確率,然而其維度過高導(dǎo)致分類運(yùn)算的計算量過大,現(xiàn)有的降維方法不能兼顧大幅降低維度與提高識別率兩個指標(biāo)。針對該問題,提出一種低維目標(biāo)屬性特征,通過pooling方法簡化目標(biāo)屬性特征的模式從而大幅降低了維度,并且采用兩個優(yōu)化策略提高識別準(zhǔn)確率。為了驗(yàn)證LD-OB特征的有效性,在三個真實(shí)場景數(shù)據(jù)集上對其進(jìn)行了評估:事件類UIUC-Sports數(shù)據(jù)集、自然場景LabelMe數(shù)據(jù)集、室內(nèi)室外混合場景15-Scenes數(shù)據(jù)集。實(shí)驗(yàn)結(jié)果表明,LD-OB特征不僅可以顯著降低目標(biāo)屬性特征的維度,且具有更高的識別準(zhǔn)確率。計算復(fù)雜度的分析表明該特征可以有效降低分類的時間復(fù)雜度。 3.提出了一種基于快速稀疏編碼(Fast Sparse Coding,F(xiàn)-SC)的中間層特征。稀疏編碼的詞典學(xué)習(xí)需要詞典更新步驟和碼字分配步驟兩個凸優(yōu)化問題解的相互迭代,因此具有很大的計算量。為了對詞典學(xué)習(xí)步驟進(jìn)行優(yōu)化,改進(jìn)了稀疏編碼算法的詞典學(xué)習(xí)步驟,并由此建立了一種中間層特征。F-SC算法按照與碼字分配無關(guān)的規(guī)則尋找一系列最具有代表性的樣本作為詞典分量,使用k-means++算法求取初始化樣本,然后使用k-mediods聚類算法搜索有代表性的樣本,最終使用搜索到的樣本構(gòu)造詞典進(jìn)行稀疏編碼。改進(jìn)的詞典更新步驟獨(dú)立于稀疏編碼的碼字分配步驟,避免了兩個凸優(yōu)化問題解的相互迭代,因此可以有效降低詞典學(xué)習(xí)的計算復(fù)雜度。使用F-SC算法提取中間層特征,并進(jìn)行空間金字塔建模,在Caltech-101數(shù)據(jù)集、15-Scenes數(shù)據(jù)集和UIUC-Sports數(shù)據(jù)集上與其它空間金字塔方法展開了對比實(shí)驗(yàn),結(jié)果表明基于F-SC算法的中間層特征可以有效提高識別準(zhǔn)確率。
【關(guān)鍵詞】:圖像場景識別 LDA(Latent Dirichlet Allocation) 主題特征 目標(biāo)屬性特征 稀疏編碼 空間金字塔
【學(xué)位授予單位】:吉林大學(xué)
【學(xué)位級別】:博士
【學(xué)位授予年份】:2015
【分類號】:TP391.41
【目錄】:
- 摘要4-6
- Abstract6-12
- 第1章 緒論12-18
- 1.1 課題的研究背景及意義12-13
- 1.2 圖像場景識別的研究現(xiàn)狀13-16
- 1.3 論文的研究內(nèi)容16-17
- 1.4 論文的組織結(jié)構(gòu)17-18
- 第2章 圖像場景識別中各層特征18-32
- 2.1 底層局部特征18-23
- 2.1.1 尺度不變特征變換描述符18-21
- 2.1.2 方向梯度直方圖特征21-23
- 2.2 中間層特征23-27
- 2.2.1 基于詞袋模型的中間層特征23-24
- 2.2.2 基于稀疏編碼的中間層特征24-25
- 2.2.3 基于局部可變模型的中間層特征25-27
- 2.3 高層特征27-30
- 2.3.1 基于主題模型的高層特征27-29
- 2.3.2 基于空間金字塔的高層特征29-30
- 2.4 本章小結(jié)30-32
- 第3章 可高效提取和分類的主題特征32-50
- 3.1 引言32-33
- 3.2 主題模型與特征提取算法33-39
- 3.2.1 特征與碼書34-35
- 3.2.2 模型結(jié)構(gòu)35-36
- 3.2.3 參數(shù)估計—Gibbs 采樣36-38
- 3.2.4 圖像表示與主題特征38-39
- 3.3 主題模型用于場景識別的相關(guān)研究39-40
- 3.4 對比實(shí)驗(yàn)及結(jié)果分析40-46
- 3.4.1 實(shí)驗(yàn)條件40-41
- 3.4.2 LabelMe 和 UIUC-Sports 數(shù)據(jù)集41-44
- 3.4.3 15-Scenes 數(shù)據(jù)集44-46
- 3.5 可高效提取和分類的主題特征討論46-48
- 3.6 本章小結(jié)48-50
- 第4章 低維目標(biāo)屬性特征50-74
- 4.1 引言50-52
- 4.2 基于目標(biāo)屬性的圖像場景識別相關(guān)工作52-53
- 4.3 Object Bank 特征53-56
- 4.3.1 目標(biāo)濾波器及其響應(yīng)53
- 4.3.2 由響應(yīng)值生成 OB 描述符53-55
- 4.3.3 現(xiàn)有的 OB 降維特征55-56
- 4.4 低維目標(biāo)屬性特征的提取模型與算法56-62
- 4.4.1 合并特征的層次與尺度56-58
- 4.4.2 模式分析與 pooling 降維理論58-60
- 4.4.3 目標(biāo)屬性特征的降維算法60-62
- 4.5 對比實(shí)驗(yàn)及結(jié)果分析62-66
- 4.5.1 UIUC-Sports 數(shù)據(jù)集63-65
- 4.5.2 LabelMe 數(shù)據(jù)集65
- 4.5.3 15-Scenes 數(shù)據(jù)集65-66
- 4.6 低維目標(biāo)屬性特征分析66-72
- 4.6.1 關(guān)鍵策略的作用66-68
- 4.6.2 算法復(fù)雜度68-69
- 4.6.3 空間信息69-72
- 4.7 本章小結(jié)72-74
- 第5章 基于快速稀疏編碼的中間層特征74-88
- 5.1 引言74-75
- 5.2 基于快速稀疏編碼的相關(guān)研究75-76
- 5.3 稀疏編碼的模型與算法76-80
- 5.3.1 稀疏編碼的模型假設(shè)76-78
- 5.3.2 基于符號搜索的碼字分配算法78-79
- 5.3.3 拉格朗日乘數(shù)法更新詞典79-80
- 5.4 快速稀疏編碼80-82
- 5.4.1 詞典學(xué)習(xí)的模型假設(shè)80
- 5.4.2 快速詞典學(xué)習(xí)算法80-82
- 5.5 對比實(shí)驗(yàn)及結(jié)果分析82-87
- 5.5.1 Caltech-101 數(shù)據(jù)集83-85
- 5.5.2 15-Scenes 數(shù)據(jù)集85-86
- 5.5.3 UIUC-Sports 數(shù)據(jù)集86-87
- 5.6 本章小結(jié)87-88
- 第6章 全文總結(jié)88-92
- 6.1 論文工作總結(jié)88-89
- 6.2 工作展望89-92
- 參考文獻(xiàn)92-106
- 作者簡介及科研成果106-108
- 致謝108-109
【參考文獻(xiàn)】
中國期刊全文數(shù)據(jù)庫 前1條
1 徐戈;王厚峰;;自然語言處理中主題模型的發(fā)展[J];計算機(jī)學(xué)報;2011年08期
本文編號:937754
本文鏈接:http://sikaile.net/shoufeilunwen/xxkjbs/937754.html
最近更新
教材專著