基于深度學(xué)習(xí)的圖像語義提取與圖像檢索技術(shù)研究
本文關(guān)鍵詞:基于深度學(xué)習(xí)的圖像語義提取與圖像檢索技術(shù)研究,,由筆耕文化傳播整理發(fā)布。
【摘要】:隨著移動互聯(lián)網(wǎng)技術(shù)的飛速發(fā)展和智能手機(jī)廣泛普及,用戶每天都會上傳分享海量的圖像。如何讓用戶在海量的數(shù)據(jù)中準(zhǔn)確地找到自己真正需要的信息,讓企業(yè)有效地整合其龐大的圖像數(shù)據(jù)資源,是當(dāng)前很重要的研究課題。然而,傳統(tǒng)的基于內(nèi)容的圖像檢索技術(shù)是基于圖像底層視覺特征的,和人對圖像的認(rèn)知存在著巨大的“語義鴻溝”問題。因此,為了解決“語義鴻溝”問題而提出的基于語義的圖像檢索成為圖像檢索領(lǐng)域中急需解決的關(guān)鍵問題之一。深度學(xué)習(xí)是在借鑒人腦視覺機(jī)制的基礎(chǔ)上發(fā)展起來的,和人腦視覺機(jī)制一樣,也是逐層迭代、逐層抽象的過程。深度學(xué)習(xí)最大的優(yōu)勢是可以自主學(xué)習(xí)圖像特征,從最底層的方向邊緣特征到物體結(jié)構(gòu)特征直至更抽象的特征。針對語義鴻溝問題,本論文基于深度學(xué)習(xí)理論,構(gòu)建一個從圖像底層視覺特征到高級語義特征逐層迭代、逐層抽象的深度網(wǎng)絡(luò)映射模型,旨在減小語義鴻溝,得到圖像語義特征提取系統(tǒng),并深入研究圖像語義相似性度量,為大規(guī)模圖像自動標(biāo)注提供良好的基礎(chǔ),實(shí)現(xiàn)基于語義的圖像檢索技術(shù),真正有效地利用海量的圖像信息資源。本論文的主要工作如下:(1)針對圖像檢索中語義鴻溝問題,將深度學(xué)習(xí)應(yīng)用到圖像語義特征提取中,構(gòu)建圖像底層視覺特征到高級語義特征逐層迭代、逐層抽象的映射模型。(2)針對標(biāo)簽數(shù)據(jù)資源有限、無法支撐起深度網(wǎng)絡(luò)訓(xùn)練的現(xiàn)實(shí)情況,提出了一種無監(jiān)督的深度學(xué)習(xí)算法。先利用稀疏降噪自動編碼器無監(jiān)督地學(xué)習(xí)得到卷積核(對應(yīng)于視覺機(jī)制中的感受野),然后利用遷移學(xué)習(xí)理論,把學(xué)習(xí)得到的卷積核傳遞給卷積神經(jīng)網(wǎng)絡(luò)。對于卷積核的個數(shù)和池化尺度對于圖像分類準(zhǔn)確率的影響做了深入研究。同時,采取了多級分類器級聯(lián)的方法來提高分類準(zhǔn)確率。若移除最后分類器模塊,則可以把其當(dāng)成一個圖像語義特征提取器,根據(jù)圖像相似性度量方法,可以得到各圖像之間的相似度,實(shí)現(xiàn)快速圖像檢索。(3)基于深度學(xué)習(xí)理論,提出了一種樸素的基于深度學(xué)習(xí)的圖像標(biāo)注方法。利用訓(xùn)練好的深度卷積神經(jīng)網(wǎng)絡(luò)提取待標(biāo)注圖像的語義特征,然后利用相似性度量得到基準(zhǔn)庫中最相近一些的圖像,根據(jù)這些圖像的自帶標(biāo)簽對待標(biāo)注圖像進(jìn)行語義標(biāo)注。在綜合考慮加大網(wǎng)絡(luò)深度能夠提高網(wǎng)絡(luò)抽象能力和隨之帶來的“梯度彌散”問題上,結(jié)合現(xiàn)有的數(shù)據(jù)集,在深度卷積神經(jīng)網(wǎng)絡(luò)中引入了多級特征級聯(lián)的方式,從而提高系統(tǒng)的魯棒性,提高語義標(biāo)注的準(zhǔn)確率。(4)最后,根據(jù)上面的研究設(shè)計了一個基于深度學(xué)習(xí)的圖像語義提取和檢索的原型系統(tǒng)。
【關(guān)鍵詞】:深度學(xué)習(xí) 圖像語義 圖像檢索 圖像標(biāo)注 多分類器級聯(lián)
【學(xué)位授予單位】:東華大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2016
【分類號】:TP391.41
【目錄】:
- 摘要5-7
- ABSTRACT7-11
- 第一章 緒論11-20
- 1.1 研究目的與意義11-12
- 1.2 國內(nèi)外研究現(xiàn)狀12-17
- 1.2.1 語義模型的研究12-13
- 1.2.2 解決語義鴻溝的現(xiàn)有方向13-14
- 1.2.3 傳統(tǒng)的圖像特征提取14
- 1.2.4 圖像語義提取方法14-16
- 1.2.5 深度學(xué)習(xí)的研究與應(yīng)用16-17
- 1.3 主要研究內(nèi)容和創(chuàng)新點(diǎn)17-18
- 1.4 論文的章節(jié)安排18-20
- 第二章 基于語義的圖像檢索系統(tǒng)與深度學(xué)習(xí)理論研究20-33
- 2.1 引言20
- 2.2 基于語義的圖像檢索系統(tǒng)20-21
- 2.3 圖像語義層次模型和深度模型的類比21-23
- 2.4 相似性度量23-25
- 2.5 檢索系統(tǒng)性能評價標(biāo)準(zhǔn)25
- 2.6 深度學(xué)習(xí)原理25-31
- 2.6.1 棧式自動編碼算法26-29
- 2.6.2 卷積神經(jīng)網(wǎng)絡(luò)29-30
- 2.6.3 Softmax回歸模型30-31
- 2.7 深度網(wǎng)絡(luò)的訓(xùn)練31-32
- 2.7.1 深度網(wǎng)絡(luò)訓(xùn)練的難點(diǎn)31
- 2.7.2 逐層貪婪訓(xùn)練方法31-32
- 2.8 小結(jié)32-33
- 第三章 多級級聯(lián)深度前饋卷積稀疏降噪自動編碼算法33-48
- 3.1 引言33-34
- 3.2 深度學(xué)習(xí)網(wǎng)絡(luò)架構(gòu)34-35
- 3.3 深度學(xué)習(xí)網(wǎng)絡(luò)中的算法35-38
- 3.3.1 稀疏降噪自動編碼器自我學(xué)習(xí)特征35-37
- 3.3.2 卷積37
- 3.3.3 池化37
- 3.3.4 多級級聯(lián)分類器37-38
- 3.4 多級級聯(lián)深度前饋卷積稀疏降噪自動編碼算法在圖像分類上應(yīng)用38-47
- 3.4.1 STL-10圖像數(shù)據(jù)集38-39
- 3.4.2 單層網(wǎng)絡(luò)下無監(jiān)督特征學(xué)習(xí)的性能分析39-45
- 3.4.3 在STL-10數(shù)據(jù)集上的實(shí)驗(yàn)結(jié)果45-47
- 3.5 小結(jié)47-48
- 第四章 基于深度學(xué)習(xí)的圖像檢索系統(tǒng)設(shè)計及測試結(jié)果與分析48-58
- 4.1 引言48
- 4.2 運(yùn)行環(huán)境48-49
- 4.2.1 硬件環(huán)境48-49
- 4.2.2 軟件環(huán)境49
- 4.3 基于深度學(xué)習(xí)的圖像檢索系統(tǒng)設(shè)計49-51
- 4.3.1 軟件框架圖結(jié)構(gòu)49-50
- 4.3.2 軟件界面50-51
- 4.4 基于深度學(xué)習(xí)的圖像檢索系統(tǒng)測試51-57
- 4.4.1 基于深度學(xué)習(xí)的圖像分類模塊測試51-54
- 4.4.2 基于深度學(xué)習(xí)的圖像檢索模塊測試54-57
- 4.5 小結(jié)57-58
- 第五章 基于深度學(xué)習(xí)和搜索的圖像標(biāo)注算法58-68
- 5.1 引言58-59
- 5.2 圖像數(shù)據(jù)集構(gòu)建59
- 5.3 深度卷積神經(jīng)網(wǎng)絡(luò)構(gòu)建和訓(xùn)練59-62
- 5.3.1 構(gòu)建訓(xùn)練集59-60
- 5.3.2 樸素深度卷積神經(jīng)網(wǎng)絡(luò)并訓(xùn)練60-61
- 5.3.3 特征級聯(lián)深度卷積神經(jīng)網(wǎng)絡(luò)并訓(xùn)練61-62
- 5.4 圖像數(shù)據(jù)集語義特征提取62
- 5.5 利用語義特征進(jìn)行相似圖像檢索62-63
- 5.6 候選圖像語義標(biāo)注的合并63
- 5.6.1 K-NN思想63
- 5.6.2 相似度因子63
- 5.7 圖像標(biāo)注實(shí)驗(yàn)結(jié)果與分析63-67
- 5.7.1 評價方法64
- 5.7.2 在Corel5K數(shù)據(jù)集上的結(jié)果64-67
- 5.8 小結(jié)67-68
- 第六章 總結(jié)與展望68-70
- 6.1 總結(jié)68-69
- 6.2 展望69-70
- 參考文獻(xiàn)70-76
- 致謝76-78
- 附錄:攻讀碩士期間參加的項(xiàng)目及成果78
【相似文獻(xiàn)】
中國期刊全文數(shù)據(jù)庫 前10條
1 李倩倩;陽愛民;李心廣;;圖像語義的圖形化標(biāo)注和檢索研究[J];計算機(jī)應(yīng)用與軟件;2008年12期
2 時慧琨;;一種利用用戶反饋日志獲取圖像語義標(biāo)注方法[J];通化師范學(xué)院學(xué)報;2010年12期
3 郭海鳳;張盈盈;李廣水;韓立新;;基于社會網(wǎng)絡(luò)的圖像語義獲取研究綜述[J];計算機(jī)與現(xiàn)代化;2014年01期
4 石躍祥;朱東輝;蔡自興;B.Benhabib;;圖像語義特征的抽取方法及其應(yīng)用[J];計算機(jī)工程;2007年19期
5 孫季豐;袁春林;邱衛(wèi)東;余英林;;一個具有圖像語義的物體分類系統(tǒng)的實(shí)現(xiàn)[J];科學(xué)技術(shù)與工程;2008年03期
6 王妍寧;郭雷;方俊;;一種新的圖像語義自動標(biāo)注模型[J];計算機(jī)工程與應(yīng)用;2011年07期
7 李曉雅;;淺析計算機(jī)圖像語義的識別應(yīng)用技術(shù)[J];知識經(jīng)濟(jì);2012年09期
8 李大湘;趙小強(qiáng);李娜;;圖像語義分析的多示例學(xué)習(xí)算法綜述[J];控制與決策;2013年04期
9 林春漪;馬麗紅;尹俊勛;陳建宇;;基于多層貝葉斯網(wǎng)絡(luò)的醫(yī)學(xué)圖像語義建模[J];生物醫(yī)學(xué)工程學(xué)雜志;2009年02期
10 魏晗;李弼程;張瑞杰;唐永旺;;圖像語義提取方法研究[J];現(xiàn)代電子技術(shù);2011年24期
中國重要會議論文全文數(shù)據(jù)庫 前3條
1 張楊;房斌;徐傳運(yùn);;基于本體和描述邏輯的圖像語義識別[A];全國第20屆計算機(jī)技術(shù)與應(yīng)用學(xué)術(shù)會議(CACIS·2009)暨全國第1屆安全關(guān)鍵技術(shù)與應(yīng)用學(xué)術(shù)會議論文集(上冊)[C];2009年
2 葉劍燁;謝祖銘;周向東;張亮;施伯樂;;一種新的圖像語義自動標(biāo)注方法[A];第二十一屆中國數(shù)據(jù)庫學(xué)術(shù)會議論文集(研究報告篇)[C];2004年
3 王偉強(qiáng);付立波;高文;黃慶明;蔣樹強(qiáng);;一種基于筆畫特征的疊加文字檢測方法[A];全國網(wǎng)絡(luò)與信息安全技術(shù)研討會論文集(下冊)[C];2007年
中國博士學(xué)位論文全文數(shù)據(jù)庫 前7條
1 陳久軍;基于統(tǒng)計學(xué)習(xí)的圖像語義挖掘研究[D];浙江大學(xué);2006年
2 于永新;基于本體的圖像語義識別和檢索研究[D];天津大學(xué);2009年
3 李曉燕;海量圖像語義分析和檢索技術(shù)研究[D];浙江大學(xué);2009年
4 林春漪;基于混合貝葉斯網(wǎng)絡(luò)的醫(yī)學(xué)圖像語義建模及其檢索的研究[D];華南理工大學(xué);2006年
5 許紅濤;Web圖像語義分析與自動標(biāo)注研究[D];復(fù)旦大學(xué);2009年
6 鮑泓;基于視覺感知的中國畫圖像語義自動分類研究[D];北京交通大學(xué);2012年
7 王梅;基于多標(biāo)簽學(xué)習(xí)的圖像語義自動標(biāo)注研究[D];復(fù)旦大學(xué);2008年
中國碩士學(xué)位論文全文數(shù)據(jù)庫 前10條
1 甄健華;圖像語義自動標(biāo)注過程研究[D];河北師范大學(xué);2015年
2 楊雪;基于紋理基元塊的圖像語義分割[D];西南科技大學(xué);2015年
3 張智慧;基于本體的圖像語義檢索研究[D];西南科技大學(xué);2015年
4 高瞰;社會化媒體中的圖像語義理解[D];華北電力大學(xué);2015年
5 王行行;面向檢索的鞋底花紋圖像語義表達(dá)算法研究[D];大連海事大學(xué);2015年
6 羅世操;基于深度學(xué)習(xí)的圖像語義提取與圖像檢索技術(shù)研究[D];東華大學(xué);2016年
7 劉先明;互聯(lián)網(wǎng)圖像語義表達(dá)規(guī)律分析及主題發(fā)現(xiàn)[D];哈爾濱工業(yè)大學(xué);2010年
8 王小蕾;基于上下文的社交圖像語義信息的精化與豐富[D];華北電力大學(xué);2012年
9 盧祖友;圖像語義標(biāo)注方法研究及其系統(tǒng)實(shí)現(xiàn)[D];電子科技大學(xué);2009年
10 李冰季;基于線條和結(jié)構(gòu)模塊識別的圖像語義識別方法[D];華中師范大學(xué);2014年
本文關(guān)鍵詞:基于深度學(xué)習(xí)的圖像語義提取與圖像檢索技術(shù)研究,由筆耕文化傳播整理發(fā)布。
本文編號:433181
本文鏈接:http://sikaile.net/kejilunwen/ruanjiangongchenglunwen/433181.html