基于目標(biāo)的場景圖像表示及分類
本文關(guān)鍵詞:基于目標(biāo)的場景圖像表示及分類
更多相關(guān)文章: 場景分類 圖像表示 語義分割 卷積神經(jīng)網(wǎng)絡(luò)
【摘要】:在計算機(jī)視覺領(lǐng)域中,圖像的編碼表示一直是至關(guān)重要的技術(shù)之一。傳統(tǒng)的基于低層特征的圖像表示方法是有效可行的,且得到了廣泛的應(yīng)用;然而,從人類認(rèn)知的角度出發(fā),人類更多地傾向于基于目標(biāo)的場景圖像表示方法。在本文中,我們針對場景圖像中的目標(biāo)對象提出兩種高層的圖像表示方法,并成功將其應(yīng)用在場景分類中。為了獲得圖像中所包含的目標(biāo)信息,我們采用了圖像的標(biāo)注信息和現(xiàn)存的語義分割算法,在此基礎(chǔ)上提出第一種基于目標(biāo)的表示方法,并生成了兩種對應(yīng)的場景分類模型。該目標(biāo)表示方法主要包含三個部分:第一步,統(tǒng)計出圖像中所包含的目標(biāo)信息,建立目標(biāo)對象的特征直方圖;第二步,采用高斯混合方法建立目標(biāo)的空間幾何先驗?zāi)P?從而建立整個圖像的空間幾何直方圖,抓取目標(biāo)對象的位置信息和大小信息;第三步,構(gòu)建共現(xiàn)直方圖抽取各個目標(biāo)與目標(biāo)之間共同出現(xiàn)的頻率、相對位置等特征信息。利用卷積神經(jīng)網(wǎng)絡(luò)在目標(biāo)檢測和識別中所表現(xiàn)的獨特優(yōu)勢,將場景圖像經(jīng)卷積神經(jīng)網(wǎng)絡(luò)處理,在此基礎(chǔ)上提出第二種基于目標(biāo)的表示方法,并生成結(jié)合卷積神經(jīng)網(wǎng)絡(luò)的目標(biāo)表示分類模型。通過提取網(wǎng)絡(luò)中pool5層的特征,獲得圖像中的有關(guān)目標(biāo)信息作為圖像的表示。在實驗中,我們依次對基于標(biāo)注信息的目標(biāo)表示模型、結(jié)合語義分割的目標(biāo)表示模型、結(jié)合卷積神經(jīng)網(wǎng)絡(luò)的目標(biāo)表示模型進(jìn)行了驗證,結(jié)果表明本文所提出的兩種基于目標(biāo)的圖像表示方法是非常有效的。
【關(guān)鍵詞】:場景分類 圖像表示 語義分割 卷積神經(jīng)網(wǎng)絡(luò)
【學(xué)位授予單位】:華東師范大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2016
【分類號】:TP391.41
【目錄】:
- 摘要6-7
- ABSTRACT7-10
- 第一章 緒論10-14
- 1.1 課題背景與研究意義10-11
- 1.2 場景分類的研究現(xiàn)狀及存在難點11-12
- 1.3 論文研究內(nèi)容與創(chuàng)新點12-13
- 1.4 論文組織結(jié)構(gòu)13-14
- 第二章 場景分類圖像表示及相關(guān)理論14-20
- 2.1 低層特征圖像表示方法14-16
- 2.1.1 局部特征14-15
- 2.1.2 全局特征15
- 2.1.3 低層特征比較分析15-16
- 2.2 語義特征圖像表示方法16-17
- 2.3 基于深度學(xué)習(xí)特征的圖像表示方法17-19
- 2.3.1 卷積神經(jīng)網(wǎng)絡(luò)17-18
- 2.3.2 AlexNet網(wǎng)絡(luò)18-19
- 2.4 本章小結(jié)19-20
- 第三章 基于圖像標(biāo)注信息的目標(biāo)表示模型20-24
- 3.1 目標(biāo)直方圖20-21
- 3.2 空間幾何直方圖21-22
- 3.3 共現(xiàn)直方圖22-23
- 3.4 本章小結(jié)23-24
- 第四章 結(jié)合語義分割的目標(biāo)表示模型24-29
- 4.1 語義分割24-28
- 4.1.1 O2P算法25-27
- 4.1.2 O2P算法結(jié)果分析27-28
- 4.2 基于目標(biāo)的圖像表示方法28
- 4.2.1 目標(biāo)直方圖28
- 4.2.2 空間幾何直方圖和共現(xiàn)直方圖28
- 4.3 本章小結(jié)28-29
- 第五章 結(jié)合卷積神經(jīng)網(wǎng)絡(luò)的目標(biāo)表示模型29-37
- 5.1 卷積神經(jīng)網(wǎng)絡(luò)各層特征分析29-34
- 5.1.1 ImageNet-CNN各層特征分析29-32
- 5.1.2 Places-CNN高層特征分析32-34
- 5.2 結(jié)合卷積神經(jīng)網(wǎng)絡(luò)的目標(biāo)表示34-36
- 5.2.1 VGG深度卷積神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)35
- 5.2.2 目標(biāo)直方圖35-36
- 5.3 本章小結(jié)36-37
- 第六章 實驗37-53
- 6.1 結(jié)合標(biāo)注信息的目標(biāo)表示方法驗證37-41
- 6.1.1 LabelMe 8類室外場景庫38-40
- 6.1.2 MIT室內(nèi)5類場景庫40-41
- 6.2 結(jié)合語義分割的目標(biāo)表示模型驗證41-44
- 6.2.1 LabelMe 8類室外場景庫42-43
- 6.2.2 MIT室內(nèi)5類數(shù)據(jù)庫43-44
- 6.3 結(jié)合卷積神經(jīng)網(wǎng)絡(luò)的目標(biāo)表示模型驗證44-49
- 6.3.1 VGG-16卷積神經(jīng)網(wǎng)絡(luò)pool5層特征分析44-45
- 6.3.2 小數(shù)據(jù)集上結(jié)果比較分析45-47
- 6.3.3 大規(guī)模數(shù)據(jù)集上結(jié)果比較分析47-49
- 6.4 與其他方法的比較49-51
- 6.4.1 與低層特征方法的比較49-50
- 6.4.2 與語義特征方法的比較50
- 6.4.3 與其他結(jié)合卷積神經(jīng)網(wǎng)絡(luò)分類方法的比較50-51
- 6.5 本章小結(jié)51-53
- 第七章 總結(jié)和展望53-54
- 附錄54-55
- 參考文獻(xiàn)55-60
- 致謝60
【相似文獻(xiàn)】
中國期刊全文數(shù)據(jù)庫 前10條
1 黃巍;陳傳波;鄭運平;吳雪麗;;可重疊矩形多值圖像表示及其上的幾何矩生成[J];計算機(jī)科學(xué);2008年10期
2 陶金金;黃秀清;陸云;高強(qiáng);;基于重疊矩形圖像表示方法的貝塞爾-傅里葉矩快速計算[J];軟件導(dǎo)刊;2013年07期
3 曹奎,馮玉才,王元珍;一種基于顏色的圖像表示及全局相似檢索技術(shù)[J];計算機(jī)研究與發(fā)展;2001年09期
4 程兵,賈新春,鄭南寧,袁澤劍;基于水平差集的多精度圖像表示及繪制[J];西安交通大學(xué)學(xué)報;2002年04期
5 黃巍;陳傳波;鄭運平;吳雪麗;;基于非對稱逆布局圖像表示的近鄰尋找算法[J];計算機(jī)工程與科學(xué);2009年03期
6 舒振球;趙春霞;張浩峰;;局部敏感的稀疏概念編碼及其在圖像表示中的應(yīng)用[J];計算機(jī)輔助設(shè)計與圖形學(xué)學(xué)報;2014年01期
7 康寅;楊文川;;圖像表示及在檢索系統(tǒng)中的應(yīng)用[J];軟件;2011年01期
8 宋彥;蔣兵;戴禮榮;;基于多視覺碼本的圖像表示[J];模式識別與人工智能;2013年10期
9 劉艷麗,曹奎;一種基于PCA的圖像表示與檢索技術(shù)[J];計算機(jī)應(yīng)用與軟件;2003年04期
10 張琳波;王春恒;肖柏華;邵允學(xué);;基于Bag-of-phrases的圖像表示方法[J];自動化學(xué)報;2012年01期
中國重要會議論文全文數(shù)據(jù)庫 前1條
1 于萬波;趙慶賢;易欣;;基于神經(jīng)網(wǎng)的圖像表示方法[A];中國圖象圖形學(xué)會第十屆全國圖像圖形學(xué)術(shù)會議(CIG’2001)和第一屆全國虛擬現(xiàn)實技術(shù)研討會(CVR’2001)論文集[C];2001年
中國重要報紙全文數(shù)據(jù)庫 前1條
1 池健;信息技術(shù)在設(shè)計工作中的反映[N];中華建筑報;2008年
中國博士學(xué)位論文全文數(shù)據(jù)庫 前10條
1 江波;基于圖理論與稀疏約束模型的圖像表示、匹配與識別[D];安徽大學(xué);2015年
2 謝凌曦;基于局部特征的圖像表示模型理論與實踐[D];清華大學(xué);2015年
3 朱杰;基于顏色詞袋模型的圖像表示方式[D];北京交通大學(xué);2016年
4 李大瑞;基于大規(guī)模視覺模式學(xué)習(xí)的高性能圖像表示[D];中國科學(xué)技術(shù)大學(xué);2014年
5 黃巍;基于可重疊矩形子模式的圖像表示和操作方法研究[D];華中科技大學(xué);2008年
6 李亞峰;圖像表示的若干問題研究[D];西安電子科技大學(xué);2011年
7 吳中;大規(guī)模圖像搜索中的圖像表示模型[D];清華大學(xué);2010年
8 肖延輝;基于矩陣分解的圖像表示理論及其應(yīng)用研究[D];北京交通大學(xué);2014年
9 吳雪麗;基于斜面分解的非對稱逆布局圖像表示方法與處理算法研究[D];華中科技大學(xué);2009年
10 鄭運平;基于Gouraud陰影法和多子模式的NAM圖像表示方法研究[D];華中科技大學(xué);2008年
中國碩士學(xué)位論文全文數(shù)據(jù)庫 前3條
1 焦緒國;基于單層稀疏自編碼和支持向量機(jī)的場景分類[D];重慶大學(xué);2015年
2 羅序輝;基于目標(biāo)的場景圖像表示及分類[D];華東師范大學(xué);2016年
3 陸永亮;基于偏微分方程和多邊形的非對稱逆布局圖像表示方法研究[D];華中科技大學(xué);2009年
,本文編號:905121
本文鏈接:http://sikaile.net/kejilunwen/ruanjiangongchenglunwen/905121.html