基于顏色詞袋模型的圖像表示方式
本文關(guān)鍵詞:基于顏色詞袋模型的圖像表示方式
更多相關(guān)文章: 對象識別 形狀 顏色 有判別力的顏色 對象顏色 顏色注意力圖 顏色上下文注意力 閾值 圖像層次 特征挖掘 多圖像匹配 種子-膨脹策略 匹配集
【摘要】:對象識別是計算機視覺領(lǐng)域的一個基本問題,生成有判別力的圖像表示是解決這個問題的一種重要方法。詞袋模型(Bag-of-Words, BOW)是一種常用的圖像表示方式,它把局部的特征抽象成為視覺詞,通過統(tǒng)計視覺詞在圖像中出現(xiàn)的頻率來進行圖像表示。目前,BOW的主要問題包括只考慮了形狀特征和沒有引入空間信息等問題。本文針對這些問題,利用顏色作為發(fā)現(xiàn)對象區(qū)域的手段,融合形狀和顏色特征生成了更有判別力的圖像表示。本文取得的主要研究成果如下:(1)提出了顏色合并的圖像表示方法。此方法用圖像塊的顏色給形狀特征加權(quán),并且能夠通過對對象顏色的估計與合并,在圖像表示的時候給對象上的圖像塊賦予相同的高權(quán)值。算法認為對象是有判別力顏色的圖像塊集合,但是由于這些有判別力的顏色出現(xiàn)的概率不同,導(dǎo)致了對象上的圖像塊不能夠被賦予相同的高權(quán)值,算法通過對類內(nèi)和類間顏色相似性的判斷,以優(yōu)化的方式得到了每個類別中有判別力的顏色,最后通過合并顏色給圖像塊賦權(quán)值。實驗結(jié)果證明了提出的圖像表示方法的優(yōu)越性。(2)提出了上下文顏色注意力圖的圖像表示方式。該方法把所有的顏色分為兩種,即強顏色和弱顏色,相應(yīng)的,擁有這兩種顏色的圖像塊被稱為強圖像塊和弱圖像塊。其中強圖像塊都是對象上的圖像塊,弱圖像塊被認為是背景上的圖像塊。為了識別出對象上的圖像塊,我們利用強圖像塊和弱圖像塊的上下文位置關(guān)系,計算出上下文顏色注意力值,并通過優(yōu)化得到上下文顏色注意力閾值來判斷出對象上的偽弱圖像塊。實驗結(jié)果表明,我們提出的基于上下文顏色注意力的對象識別方法能夠比自頂向下的顏色注意圖(Color Attention,CA)方法獲得更好的識別效果。(3)提出了基于成分金字塔匹配(Component Pyramid Matching,CPM)的圖像表示方法,CPM利用顏色對圖像進行分層,每層的前景和背景代表著不同的成分,前景成分通常對應(yīng)著對象的一部分,最后把不同成分的表示連接起來作為最終的圖像表示。CPM的劃分方法能夠為圖像表示提供空間信息,在與顏色相關(guān)的圖像庫中取得了良好的識別效果(4)提出了一種中間層特征的層次挖掘方法。該方法首先用有判別力的顏色對圖像進行層次劃分,然后把每一個層次中的圖像塊認為是一個子類,通過挖掘子類中圖像塊的特征發(fā)現(xiàn)圖像中的模式,最終用模式集代替視覺詞來表示圖像。這種方法有利于發(fā)現(xiàn)不同層次中特征之間的關(guān)系,實驗結(jié)果證明了提出方法的有效性。(5)提出了一種基于多圖像匹配的圖像表示方式。該方法把圖像塊認為是節(jié)點,每一個節(jié)點與其近鄰的節(jié)點相連用于生成圖。同類圖像中能夠匹配的子圖即為對象所在的區(qū)域。我們采用了一種種子-膨脹的策略進行多圖像的匹配。把有判別力的顏色作為了判斷種子的重要依據(jù)。接下來用得到的匹配集圖來匹配所有的圖像用于找到對象上的圖像塊。最終,這些圖像塊的特征被用于圖像表示。實驗結(jié)果驗證了所提方法的優(yōu)越性;陬伾喜⑴c上下文顏色注意力圖的方法主要是利用顏色作為形狀特征加權(quán)的依據(jù),而成分金字塔與層次挖掘的方法則把顏色作為劃分層次的標準,用以為圖像表示增加空間信息。最后,提出的多圖像匹配的方法把有判別力的顏色作為發(fā)現(xiàn)種子的重要依據(jù),并且獲得了這些方法中的最好分類結(jié)果。
【學(xué)位授予單位】:北京交通大學(xué)
【學(xué)位級別】:博士
【學(xué)位授予年份】:2016
【分類號】:TP391.41
【相似文獻】
中國期刊全文數(shù)據(jù)庫 前10條
1 黃巍;陳傳波;鄭運平;吳雪麗;;可重疊矩形多值圖像表示及其上的幾何矩生成[J];計算機科學(xué);2008年10期
2 陶金金;黃秀清;陸云;高強;;基于重疊矩形圖像表示方法的貝塞爾-傅里葉矩快速計算[J];軟件導(dǎo)刊;2013年07期
3 曹奎,馮玉才,王元珍;一種基于顏色的圖像表示及全局相似檢索技術(shù)[J];計算機研究與發(fā)展;2001年09期
4 程兵,賈新春,鄭南寧,袁澤劍;基于水平差集的多精度圖像表示及繪制[J];西安交通大學(xué)學(xué)報;2002年04期
5 黃巍;陳傳波;鄭運平;吳雪麗;;基于非對稱逆布局圖像表示的近鄰尋找算法[J];計算機工程與科學(xué);2009年03期
6 舒振球;趙春霞;張浩峰;;局部敏感的稀疏概念編碼及其在圖像表示中的應(yīng)用[J];計算機輔助設(shè)計與圖形學(xué)學(xué)報;2014年01期
7 康寅;楊文川;;圖像表示及在檢索系統(tǒng)中的應(yīng)用[J];軟件;2011年01期
8 宋彥;蔣兵;戴禮榮;;基于多視覺碼本的圖像表示[J];模式識別與人工智能;2013年10期
9 劉艷麗,曹奎;一種基于PCA的圖像表示與檢索技術(shù)[J];計算機應(yīng)用與軟件;2003年04期
10 張琳波;王春恒;肖柏華;邵允學(xué);;基于Bag-of-phrases的圖像表示方法[J];自動化學(xué)報;2012年01期
中國重要會議論文全文數(shù)據(jù)庫 前1條
1 于萬波;趙慶賢;易欣;;基于神經(jīng)網(wǎng)的圖像表示方法[A];中國圖象圖形學(xué)會第十屆全國圖像圖形學(xué)術(shù)會議(CIG’2001)和第一屆全國虛擬現(xiàn)實技術(shù)研討會(CVR’2001)論文集[C];2001年
中國重要報紙全文數(shù)據(jù)庫 前1條
1 池健;信息技術(shù)在設(shè)計工作中的反映[N];中華建筑報;2008年
中國博士學(xué)位論文全文數(shù)據(jù)庫 前10條
1 江波;基于圖理論與稀疏約束模型的圖像表示、匹配與識別[D];安徽大學(xué);2015年
2 謝凌曦;基于局部特征的圖像表示模型理論與實踐[D];清華大學(xué);2015年
3 朱杰;基于顏色詞袋模型的圖像表示方式[D];北京交通大學(xué);2016年
4 李大瑞;基于大規(guī)模視覺模式學(xué)習(xí)的高性能圖像表示[D];中國科學(xué)技術(shù)大學(xué);2014年
5 黃巍;基于可重疊矩形子模式的圖像表示和操作方法研究[D];華中科技大學(xué);2008年
6 李亞峰;圖像表示的若干問題研究[D];西安電子科技大學(xué);2011年
7 吳中;大規(guī)模圖像搜索中的圖像表示模型[D];清華大學(xué);2010年
8 肖延輝;基于矩陣分解的圖像表示理論及其應(yīng)用研究[D];北京交通大學(xué);2014年
9 吳雪麗;基于斜面分解的非對稱逆布局圖像表示方法與處理算法研究[D];華中科技大學(xué);2009年
10 鄭運平;基于Gouraud陰影法和多子模式的NAM圖像表示方法研究[D];華中科技大學(xué);2008年
中國碩士學(xué)位論文全文數(shù)據(jù)庫 前2條
1 焦緒國;基于單層稀疏自編碼和支持向量機的場景分類[D];重慶大學(xué);2015年
2 陸永亮;基于偏微分方程和多邊形的非對稱逆布局圖像表示方法研究[D];華中科技大學(xué);2009年
,本文編號:1300909
本文鏈接:http://sikaile.net/shoufeilunwen/xxkjbs/1300909.html