基于卷積神經(jīng)網(wǎng)絡(luò)的遷移學(xué)習(xí)算法研究及其在細(xì)粒度圖像識(shí)別中的應(yīng)用
發(fā)布時(shí)間:2022-11-09 19:05
圖像識(shí)別技術(shù)目前已經(jīng)廣泛應(yīng)用于互聯(lián)網(wǎng)行業(yè)、金融行業(yè)、安防領(lǐng)域,相關(guān)的模型算法都很成熟。但是,在細(xì)粒度圖像識(shí)別研究上存在很多空白,一方面在于目前的圖像識(shí)別算法主要集中于研究―大‖類識(shí)別,例如區(qū)分貓和狗、房子和車輛等,而很少關(guān)注于細(xì)粒度識(shí)別的范疇,例如在同為犬類的情況下區(qū)分阿拉斯加犬和和哈士奇。另一方面,采集帶有標(biāo)注信息的細(xì)粒度數(shù)據(jù)過程中通常需要特定領(lǐng)域的專家知識(shí)導(dǎo)致非常耗時(shí)而且困難巨大,所以細(xì)粒度圖像識(shí)別領(lǐng)域缺乏充足的且精確標(biāo)記的訓(xùn)練樣本。由于訓(xùn)練樣本非常有限且子類之間細(xì)微的類間差異和較大的類內(nèi)差異,細(xì)粒度圖像分類是一項(xiàng)極具挑戰(zhàn)性的研究課題。傳統(tǒng)的細(xì)粒度識(shí)別算法通;谌斯ぴO(shè)計(jì)的特征,例如借助于局部區(qū)域位置和關(guān)鍵部位標(biāo)注點(diǎn)等額外的人工標(biāo)注信息,才能獲得比較好的的分類精度,但是這個(gè)過程需要耗費(fèi)巨大的人力物力。因此,如何充分利用現(xiàn)有的少量標(biāo)記樣本,在不利用人工標(biāo)注信息的基礎(chǔ)上構(gòu)建分類精度高、泛化能力強(qiáng)的細(xì)粒度圖像識(shí)別模型非常必要。本文針對(duì)細(xì)粒度圖像的識(shí)別問題進(jìn)行了方法研究,主要工作如下:(1)構(gòu)建細(xì)粒度圖像數(shù)據(jù)庫,從面向圖像識(shí)別的公開數(shù)據(jù)集中構(gòu)建了Stanford Dogs、CUB 200-...
【文章頁數(shù)】:84 頁
【學(xué)位級(jí)別】:碩士
【文章目錄】:
摘要
ABSTRACT
符號(hào)對(duì)照表
縮略語對(duì)照表
第一章 緒論
1.1 課題的研究背景及意義
1.2 國內(nèi)外研究現(xiàn)狀
1.2.1 細(xì)粒度圖像研究現(xiàn)狀
1.2.2 卷積神經(jīng)網(wǎng)絡(luò)研究現(xiàn)狀
1.2.3 遷移學(xué)習(xí)研究現(xiàn)狀
1.3 本文主要研究工作
第二章 數(shù)據(jù)收集及預(yù)處理
2.1 細(xì)粒度圖像數(shù)據(jù)庫介紹
2.2 細(xì)粒度圖像數(shù)據(jù)集的特點(diǎn)
2.2.1 低類間差異
2.2.2 高類內(nèi)差異
2.2.3 背景和姿態(tài)變化
2.3 數(shù)據(jù)預(yù)處理
2.3.1 訓(xùn)練集和測(cè)試集劃分
2.3.2 數(shù)據(jù)預(yù)處理
2.4 實(shí)驗(yàn)環(huán)境及配置
2.4.1 實(shí)驗(yàn)環(huán)境
2.4.2 深度學(xué)習(xí)框架MXNet
2.5 本章小結(jié)
第三章 卷積神經(jīng)網(wǎng)絡(luò)算法研究
3.1 卷積神經(jīng)網(wǎng)絡(luò)
3.1.1 卷積神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu)
3.1.2 局部連接
3.1.3 權(quán)重共享
3.1.4 多核卷積
3.1.5 池化
3.1.6 全連接層
3.2 激活函數(shù)
3.2.1 Sigmoid激活函數(shù)
3.2.2 Tanh激活函數(shù)
3.2.3 ReLU激活函數(shù)
3.2.4 PReLU激活函數(shù)
3.2.5 ELU激活函數(shù)
3.3 防止過擬合技術(shù)
3.3.1 數(shù)據(jù)增強(qiáng)
3.3.2 權(quán)值衰減
3.3.3 丟棄法
3.4 深度卷積神經(jīng)網(wǎng)絡(luò)模型研究
3.4.1 AlexNet
3.4.2 VGGNet
3.4.3 GoogleNet
3.4.4 ResNet
3.4.5 DenseNet
3.5 本章小結(jié)
第四章 基于卷積神經(jīng)網(wǎng)絡(luò)的遷移學(xué)習(xí)算法研究
4.1 遷移學(xué)習(xí)理論介紹
4.1.1 遷移學(xué)習(xí)相關(guān)定義
4.1.2 遷移學(xué)習(xí)的分類
4.1.3 遷移學(xué)習(xí)的方法
4.1.4 基于模型的遷移學(xué)習(xí)準(zhǔn)則
4.2 基于深度卷積神經(jīng)網(wǎng)絡(luò)的遷移學(xué)習(xí)算法
4.2.1 卷積神經(jīng)網(wǎng)絡(luò)的特征學(xué)習(xí)
4.2.2 基于卷積神經(jīng)網(wǎng)絡(luò)的遷移學(xué)習(xí)
4.3 本章小結(jié)
第五章 基于卷積神經(jīng)網(wǎng)絡(luò)遷移學(xué)習(xí)的細(xì)粒度圖像識(shí)別
5.1 多層感知機(jī)分類模型
5.1.1 損失函數(shù)和度量指標(biāo)
5.1.2 模型優(yōu)化方法
5.1.3 MLP模型訓(xùn)練參數(shù)配置
5.2 實(shí)驗(yàn)結(jié)果
5.2.1 Stanford Dogs識(shí)別結(jié)果
5.2.2 CUB 200-2011 Birds識(shí)別結(jié)果
5.2.3 Oxford 102 flowers識(shí)別結(jié)果
5.3 本章小結(jié)
第六章 總結(jié)與展望
6.1 總結(jié)
6.2 展望
參考文獻(xiàn)
致謝
作者簡介
【參考文獻(xiàn)】:
期刊論文
[1]基于區(qū)域邊緣統(tǒng)計(jì)的圖像特征描述新方法[J]. 余旺盛,田孝華,侯志強(qiáng). 計(jì)算機(jī)學(xué)報(bào). 2014(06)
[2]2DPCA-SIFT:一種有效的局部特征描述方法[J]. 顏雪軍,趙春霞,袁夏. 自動(dòng)化學(xué)報(bào). 2014(04)
[3]基于Bag-of-phrases的圖像表示方法[J]. 張琳波,王春恒,肖柏華,邵允學(xué). 自動(dòng)化學(xué)報(bào). 2012(01)
本文編號(hào):3704732
【文章頁數(shù)】:84 頁
【學(xué)位級(jí)別】:碩士
【文章目錄】:
摘要
ABSTRACT
符號(hào)對(duì)照表
縮略語對(duì)照表
第一章 緒論
1.1 課題的研究背景及意義
1.2 國內(nèi)外研究現(xiàn)狀
1.2.1 細(xì)粒度圖像研究現(xiàn)狀
1.2.2 卷積神經(jīng)網(wǎng)絡(luò)研究現(xiàn)狀
1.2.3 遷移學(xué)習(xí)研究現(xiàn)狀
1.3 本文主要研究工作
第二章 數(shù)據(jù)收集及預(yù)處理
2.1 細(xì)粒度圖像數(shù)據(jù)庫介紹
2.2 細(xì)粒度圖像數(shù)據(jù)集的特點(diǎn)
2.2.1 低類間差異
2.2.2 高類內(nèi)差異
2.2.3 背景和姿態(tài)變化
2.3 數(shù)據(jù)預(yù)處理
2.3.1 訓(xùn)練集和測(cè)試集劃分
2.3.2 數(shù)據(jù)預(yù)處理
2.4 實(shí)驗(yàn)環(huán)境及配置
2.4.1 實(shí)驗(yàn)環(huán)境
2.4.2 深度學(xué)習(xí)框架MXNet
2.5 本章小結(jié)
第三章 卷積神經(jīng)網(wǎng)絡(luò)算法研究
3.1 卷積神經(jīng)網(wǎng)絡(luò)
3.1.1 卷積神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu)
3.1.2 局部連接
3.1.3 權(quán)重共享
3.1.4 多核卷積
3.1.5 池化
3.1.6 全連接層
3.2 激活函數(shù)
3.2.1 Sigmoid激活函數(shù)
3.2.2 Tanh激活函數(shù)
3.2.3 ReLU激活函數(shù)
3.2.4 PReLU激活函數(shù)
3.2.5 ELU激活函數(shù)
3.3 防止過擬合技術(shù)
3.3.1 數(shù)據(jù)增強(qiáng)
3.3.2 權(quán)值衰減
3.3.3 丟棄法
3.4 深度卷積神經(jīng)網(wǎng)絡(luò)模型研究
3.4.1 AlexNet
3.4.2 VGGNet
3.4.3 GoogleNet
3.4.4 ResNet
3.4.5 DenseNet
3.5 本章小結(jié)
第四章 基于卷積神經(jīng)網(wǎng)絡(luò)的遷移學(xué)習(xí)算法研究
4.1 遷移學(xué)習(xí)理論介紹
4.1.1 遷移學(xué)習(xí)相關(guān)定義
4.1.2 遷移學(xué)習(xí)的分類
4.1.3 遷移學(xué)習(xí)的方法
4.1.4 基于模型的遷移學(xué)習(xí)準(zhǔn)則
4.2 基于深度卷積神經(jīng)網(wǎng)絡(luò)的遷移學(xué)習(xí)算法
4.2.1 卷積神經(jīng)網(wǎng)絡(luò)的特征學(xué)習(xí)
4.2.2 基于卷積神經(jīng)網(wǎng)絡(luò)的遷移學(xué)習(xí)
4.3 本章小結(jié)
第五章 基于卷積神經(jīng)網(wǎng)絡(luò)遷移學(xué)習(xí)的細(xì)粒度圖像識(shí)別
5.1 多層感知機(jī)分類模型
5.1.1 損失函數(shù)和度量指標(biāo)
5.1.2 模型優(yōu)化方法
5.1.3 MLP模型訓(xùn)練參數(shù)配置
5.2 實(shí)驗(yàn)結(jié)果
5.2.1 Stanford Dogs識(shí)別結(jié)果
5.2.2 CUB 200-2011 Birds識(shí)別結(jié)果
5.2.3 Oxford 102 flowers識(shí)別結(jié)果
5.3 本章小結(jié)
第六章 總結(jié)與展望
6.1 總結(jié)
6.2 展望
參考文獻(xiàn)
致謝
作者簡介
【參考文獻(xiàn)】:
期刊論文
[1]基于區(qū)域邊緣統(tǒng)計(jì)的圖像特征描述新方法[J]. 余旺盛,田孝華,侯志強(qiáng). 計(jì)算機(jī)學(xué)報(bào). 2014(06)
[2]2DPCA-SIFT:一種有效的局部特征描述方法[J]. 顏雪軍,趙春霞,袁夏. 自動(dòng)化學(xué)報(bào). 2014(04)
[3]基于Bag-of-phrases的圖像表示方法[J]. 張琳波,王春恒,肖柏華,邵允學(xué). 自動(dòng)化學(xué)報(bào). 2012(01)
本文編號(hào):3704732
本文鏈接:http://sikaile.net/kejilunwen/zidonghuakongzhilunwen/3704732.html
最近更新
教材專著