面向網(wǎng)絡(luò)數(shù)據(jù)的圖像檢索和解析
本文關(guān)鍵詞:面向網(wǎng)絡(luò)數(shù)據(jù)的圖像檢索和解析,由筆耕文化傳播整理發(fā)布。
【摘要】:隨著互聯(lián)網(wǎng)技術(shù)的飛速發(fā)展,越來越多圖像信息被上傳到網(wǎng)絡(luò),如何對(duì)這些圖像信息進(jìn)行檢索和解析是當(dāng)下計(jì)算機(jī)視覺領(lǐng)域研究的熱點(diǎn)問題。其中,圖像檢索解決的是如何從大規(guī)模的數(shù)據(jù)當(dāng)中快速、準(zhǔn)確的找到目標(biāo)物體的問題,廣泛應(yīng)用于商用搜素引擎,電子商務(wù),視頻監(jiān)控等領(lǐng)域。2003年的BoW(Bag-of-Words)模型的提出是該領(lǐng)域的一個(gè)重要突破,后續(xù)的圖像檢索模型也大都延續(xù)了“局部特征”+“詞典向量”的形式。但隨著檢索規(guī)模的擴(kuò)大,在生成圖像的詞典向量過程當(dāng)中,非目標(biāo)的背景局部特征也會(huì)被參考進(jìn)來,從而影響詞典向量的表達(dá)能力,當(dāng)目標(biāo)物體在圖像中所占的面積比例較小時(shí)這種背景干擾的影響就越強(qiáng)烈,影響算法的檢索真確性。另一方面,就圖像解析而言,圖像解析是指對(duì)于圖像的每個(gè)像素點(diǎn)指定正確的標(biāo)注信息,可被用于商品推薦,自動(dòng)駕駛,虛擬現(xiàn)實(shí)等眾多領(lǐng)域。在大規(guī)模圖像分類領(lǐng)域獲得極大突破的深度學(xué)習(xí)技術(shù)近年來也被用于圖像解析領(lǐng)域并取得了優(yōu)異的表現(xiàn)。但是傳統(tǒng)的基于深度學(xué)習(xí)的圖像解析需要進(jìn)行大量的數(shù)據(jù)標(biāo)注,也即在訓(xùn)練階段需要對(duì)訓(xùn)練數(shù)據(jù)的每個(gè)像素提供真實(shí)的標(biāo)注信息,這種代價(jià)無疑是巨大的,從而限制了用于訓(xùn)練的數(shù)據(jù)規(guī)模,進(jìn)而影響了模型的性能。本文在總結(jié)現(xiàn)有的圖像檢索和圖像解析技術(shù)的基礎(chǔ)上,對(duì)于上述問題提出了自己的解決方案,主要貢獻(xiàn)如下:(1)在圖像檢索方面,為了消除背景干擾對(duì)詞典向量表達(dá)能力的影響,我們將圖像檢索從傳統(tǒng)的圖片層面降至目標(biāo)層面,從而降低了背景干擾,并探究目標(biāo)層面的索引重排和索引擴(kuò)展;(2)在圖像解析方面,為了降低像素級(jí)標(biāo)注的成本,我們探究利用圖像級(jí)的結(jié)構(gòu)標(biāo)注信息作為圖像解析任務(wù)學(xué)習(xí)時(shí)的弱監(jiān)督信息,同時(shí)利用結(jié)構(gòu)標(biāo)注信息之間的邏輯性質(zhì),輔助提高圖像解析的精度。通過在公共數(shù)據(jù)集中將我們的算法與傳統(tǒng)算法進(jìn)行比較,實(shí)驗(yàn)結(jié)果表明,我們的算法在圖像檢索和圖像解析上都取得了比傳統(tǒng)算法更好的效果。
【關(guān)鍵詞】:圖像檢索 圖像解析 深度學(xué)習(xí)
【學(xué)位授予單位】:蘭州大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2016
【分類號(hào)】:TP391.41
【目錄】:
- 中文摘要3-4
- Abstract4-8
- 第一章 引言8-14
- 1.1 圖像檢索和解析的背景和意義8
- 1.2 圖像檢索和解析的難點(diǎn)及研究現(xiàn)狀8-12
- 1.3 本文主要工作12-13
- 1.4 論文組織結(jié)構(gòu)13-14
- 第二章 通過目標(biāo)分割進(jìn)行圖像檢索14-31
- 2.1 特征提取及VLAD描述符14-16
- 2.2 假定物體區(qū)域生成和過濾16-19
- 2.3 物體匹配圖生成19-20
- 2.4 物體級(jí)別的檢索重排20-21
- 2.5 半徑敏感的檢索擴(kuò)展21-23
- 2.6 實(shí)驗(yàn)與結(jié)果分析23-31
- 2.6.1 數(shù)據(jù)庫23-25
- 2.6.2 評(píng)價(jià)標(biāo)準(zhǔn)與實(shí)現(xiàn)細(xì)節(jié)25-26
- 2.6.3 與傳統(tǒng)方法的對(duì)比26-27
- 2.6.4 選擇區(qū)域個(gè)數(shù)的敏感測(cè)試27-28
- 2.6.5 物體級(jí)別的檢索重排和半徑敏感的查詢擴(kuò)展28
- 2.6.6 半徑敏感的查詢擴(kuò)展參數(shù)敏感試驗(yàn)28-29
- 2.6.7 pVLAD伸縮性實(shí)驗(yàn)29-31
- 第三章 深度學(xué)習(xí)綜述31-40
- 3.1 深度學(xué)習(xí)的發(fā)展歷史31-33
- 3.2 卷積神經(jīng)網(wǎng)絡(luò)33-38
- 3.2.1 卷積層 (Convolutional layers)33-36
- 3.2.2 池化層 (Pooling layers)36
- 3.2.3 可視化結(jié)果36-38
- 3.3 網(wǎng)絡(luò)的優(yōu)化與訓(xùn)練38-40
- 第四章 基于弱結(jié)構(gòu)標(biāo)簽的圖像解析40-49
- 4.1 人物檢測(cè)41-42
- 4.2 處理弱監(jiān)督結(jié)構(gòu)性數(shù)據(jù)的卷積神經(jīng)網(wǎng)絡(luò)42-44
- 4.2.1 卷積層 (Convolutional Layers)42
- 4.2.2 邏輯池化層(Logistic Pooling layers)42-43
- 4.2.3 標(biāo)注整合層 ( Label Aggregation Layers )43-44
- 4.5 實(shí)驗(yàn)與結(jié)果分析44-49
- 4.5.1 實(shí)驗(yàn)設(shè)定44-45
- 4.5.2 實(shí)現(xiàn)細(xì)節(jié)45
- 4.5.3 對(duì)圖像解析結(jié)果進(jìn)行定量分析45-46
- 4.5.4 對(duì)圖像解析結(jié)果進(jìn)行定性分析46-49
- 第五章 結(jié)論49-51
- 3.1 主要結(jié)論49
- 3.2 研究展望49-51
- 參考文獻(xiàn)51-56
- 在學(xué)期間研究成果56-57
- 致謝57-58
【相似文獻(xiàn)】
中國期刊全文數(shù)據(jù)庫 前10條
1 韓法旺;;基于云計(jì)算模式的圖像檢索研究[J];情報(bào)科學(xué);2011年10期
2 何巖;;以計(jì)算機(jī)為基礎(chǔ)的色彩圖像檢索方法與研究[J];計(jì)算機(jī)光盤軟件與應(yīng)用;2013年12期
3 郭海鳳;李廣水;仇彬任;;基于融合多特征的社會(huì)網(wǎng)上圖像檢索方法[J];計(jì)算機(jī)與現(xiàn)代化;2013年12期
4 柏正堯,周紀(jì)勤;基于復(fù)數(shù)矩不變性的圖像檢索方法研究[J];計(jì)算機(jī)應(yīng)用;2000年10期
5 夏峰,張文龍;一種圖像檢索的新方法[J];計(jì)算機(jī)應(yīng)用研究;2002年11期
6 鄧誠強(qiáng),馮剛;基于內(nèi)容的多特征綜合圖像檢索[J];計(jì)算機(jī)應(yīng)用;2003年07期
7 斯白露,高文,盧漢清,曾煒,段立娟;基于感興趣區(qū)域的圖像檢索方法[J];高技術(shù)通訊;2003年05期
8 劉怡,于沛;基于“知網(wǎng)”的新聞圖像檢索方法[J];河南師范大學(xué)學(xué)報(bào)(自然科學(xué)版);2003年02期
9 張榮,鄭浩然,李金龍,王煦法;進(jìn)化加速技術(shù)在圖像檢索中的應(yīng)用[J];計(jì)算機(jī)工程與應(yīng)用;2004年16期
10 黃德才,胡嘉,鄭月鋒;交互式圖像檢索中相關(guān)反饋進(jìn)展研究[J];計(jì)算機(jī)應(yīng)用研究;2005年09期
中國重要會(huì)議論文全文數(shù)據(jù)庫 前10條
1 陳旭文;朱紅麗;;一種高效的圖像檢索方法[A];中國儀器儀表學(xué)會(huì)第九屆青年學(xué)術(shù)會(huì)議論文集[C];2007年
2 周向東;張亮;張琪;劉莉;殷慷;施伯樂;;一種新的圖像檢索相關(guān)反饋方法[A];第十九屆全國數(shù)據(jù)庫學(xué)術(shù)會(huì)議論文集(研究報(bào)告篇)[C];2002年
3 陳世亮;李戰(zhàn)懷;閆劍鋒;;一種基于本體描述的空間語義圖像檢索方法[A];第二十一屆中國數(shù)據(jù)庫學(xué)術(shù)會(huì)議論文集(技術(shù)報(bào)告篇)[C];2004年
4 趙海英;彭宏;;基于最優(yōu)近似反饋的圖像檢索[A];’2004系統(tǒng)仿真技術(shù)及其應(yīng)用學(xué)術(shù)交流會(huì)論文集[C];2004年
5 許相莉;張利彪;于哲舟;周春光;;基于商空間粒度計(jì)算的圖像檢索[A];第八屆全國信息隱藏與多媒體安全學(xué)術(shù)大會(huì)湖南省計(jì)算機(jī)學(xué)會(huì)第十一屆學(xué)術(shù)年會(huì)論文集[C];2009年
6 李凌偉;周榮貴;劉怡;;基于概念的圖像檢索方法[A];第十九屆全國數(shù)據(jù)庫學(xué)術(shù)會(huì)議論文集(技術(shù)報(bào)告篇)[C];2002年
7 楊關(guān)良;李忠杰;徐小杰;;基于代表色的圖像檢索方法研究[A];首屆信息獲取與處理學(xué)術(shù)會(huì)議論文集[C];2003年
8 彭瑜;喬奇峰;魏昆娟;;基于多示例學(xué)習(xí)的圖像檢索方法[A];第三屆全國信息檢索與內(nèi)容安全學(xué)術(shù)會(huì)議論文集[C];2007年
9 胡敬;武港山;;基于語義特征的風(fēng)景圖像檢索[A];2009年研究生學(xué)術(shù)交流會(huì)通信與信息技術(shù)論文集[C];2009年
10 許天兵;;一種基于語義分類的圖像檢索方法[A];中國圖象圖形學(xué)會(huì)第十屆全國圖像圖形學(xué)術(shù)會(huì)議(CIG’2001)和第一屆全國虛擬現(xiàn)實(shí)技術(shù)研討會(huì)(CVR’2001)論文集[C];2001年
中國博士學(xué)位論文全文數(shù)據(jù)庫 前10條
1 崔超然;圖像檢索中自動(dòng)標(biāo)注、標(biāo)簽處理和重排序問題的研究[D];山東大學(xué);2015年
2 楊迪;基于內(nèi)容的分布式圖像檢索[D];北京郵電大學(xué);2015年
3 張旭;網(wǎng)絡(luò)圖像檢索關(guān)鍵技術(shù)研究[D];西安電子科技大學(xué);2014年
4 吳夢(mèng)麟;基于半監(jiān)督學(xué)習(xí)的醫(yī)學(xué)圖像檢索研究[D];南京理工大學(xué);2015年
5 汪友寶;基于多分辨率和顯著特征的圖像檢索方法研究[D];上海大學(xué);2015年
6 張運(yùn)超;面向海量圖像檢索的視覺編碼方法分析與優(yōu)化[D];北京理工大學(xué);2015年
7 高毫林;基于哈希技術(shù)的圖像檢索研究[D];解放軍信息工程大學(xué);2014年
8 李清亮;圖像檢索中判別性增強(qiáng)研究[D];吉林大學(xué);2016年
9 李展;基于多示例學(xué)習(xí)的圖像檢索與推薦相關(guān)算法研究[D];西北大學(xué);2012年
10 郭麗;基于內(nèi)容的商標(biāo)圖像檢索研究[D];南京理工大學(xué);2003年
中國碩士學(xué)位論文全文數(shù)據(jù)庫 前10條
1 趙鴻;基于尺度不變局部特征的圖像檢索研究[D];華南理工大學(xué);2015年
2 孫劍飛;基于圖像索引的熱點(diǎn)話題檢索方法研究[D];蘭州大學(xué);2015年
3 章進(jìn)洲;圖像檢索中的用戶意圖分析[D];南京理工大學(xué);2015年
4 苗思楊;移動(dòng)圖像檢索中的漸進(jìn)式傳輸方式研究[D];大連海事大學(xué);2015年
5 都業(yè)剛;基于顯著性的移動(dòng)圖像檢索[D];大連海事大學(xué);2015年
6 王夢(mèng)蕾;基于用戶反饋和改進(jìn)詞袋模型的圖像檢索[D];南京理工大學(xué);2015年
7 許鵬飛;基于草圖的海量圖像檢索方法研究[D];浙江大學(xué);2015年
8 馮進(jìn)麗;基于BoF的圖像檢索與行為識(shí)別研究[D];山西大學(xué);2015年
9 喬維強(qiáng);基于低級(jí)特征和語義特征的醫(yī)學(xué)圖像檢索[D];北京理工大學(xué);2015年
10 蔣國寶;基于內(nèi)容的概念建模和圖像檢索重排序[D];復(fù)旦大學(xué);2014年
本文關(guān)鍵詞:面向網(wǎng)絡(luò)數(shù)據(jù)的圖像檢索和解析,由筆耕文化傳播整理發(fā)布。
,本文編號(hào):349168
本文鏈接:http://sikaile.net/kejilunwen/ruanjiangongchenglunwen/349168.html