基于CNN的目標(biāo)區(qū)域提取和細(xì)粒度圖像分類的研究
發(fā)布時間:2023-06-16 20:58
圖像分類是計算視覺中重要的一部分,從發(fā)展之初到現(xiàn)在已經(jīng)取得巨大的進(jìn)步。在大類別分類中前五的正確率已經(jīng)有90%以上,超過了人類現(xiàn)有的水平。在同一大類別內(nèi)的子類分類的性能已經(jīng)到達(dá)80%以上,但是還沒有達(dá)到專業(yè)的水平,并且這些模型往往只針對特定的數(shù)據(jù)集,可能不具有廣泛性。現(xiàn)階段的細(xì)粒度圖像分類算法主要分為兩步,第一步是找出目標(biāo)對象的區(qū)域或者目標(biāo)對象關(guān)鍵部位的區(qū)域,第二步將找出的區(qū)域用于特征提取作為分類器的輸入進(jìn)行訓(xùn)練。在第一步中現(xiàn)有的細(xì)粒度算法使用人工標(biāo)注的信息來對輸入圖像進(jìn)行區(qū)域提取,這樣的代價往往是昂貴的。在第二步中現(xiàn)有的細(xì)粒度圖像分類算法使用單一的卷積神經(jīng)網(wǎng)絡(luò)進(jìn)行分類訓(xùn)練,單一的卷積神經(jīng)網(wǎng)絡(luò)可能對一些特征的提取不完善。本文主要使用弱監(jiān)督的區(qū)域提取算法提取目標(biāo)區(qū)域,再用CNN提取目標(biāo)區(qū)域的特征進(jìn)行細(xì)粒度分類。本文有兩個主要工作:第一個是使用現(xiàn)有網(wǎng)絡(luò)的一些特性在無人工標(biāo)記信息的情況下盡可能的降低噪聲(噪聲對象處于前景或者所占圖像面積大于目標(biāo)對象)對圖像分類帶來的影響,并在此基礎(chǔ)上盡可能的保留住目標(biāo)對象的重要特征區(qū)域,生成裁剪圖像。在ImageNet圖像集上進(jìn)行訓(xùn)練的網(wǎng)絡(luò)模型已經(jīng)能夠很好的區(qū)...
【文章頁數(shù)】:53 頁
【學(xué)位級別】:碩士
【文章目錄】:
摘要
Abstract
第一章 緒論
1.1 研究的背景和意義
1.2 研究現(xiàn)狀
1.2.1 卷積神經(jīng)網(wǎng)絡(luò)概述
1.2.2 細(xì)粒度圖像分類概述
1.2.3 區(qū)域提取算法概述
1.2.4 當(dāng)前圖像分類主要研究方向
1.3 現(xiàn)有區(qū)域提取和細(xì)粒度分類的不足
1.4 本文組織結(jié)構(gòu)與創(chuàng)新點
1.4.1 本文的組織結(jié)構(gòu)
1.4.2 本文模型結(jié)構(gòu)
1.4.3 本文創(chuàng)新點
第二章 相關(guān)內(nèi)容綜述
2.1 卷積神經(jīng)網(wǎng)絡(luò)的基本組成
2.2 經(jīng)典卷積神經(jīng)網(wǎng)絡(luò)
2.2.1 AlexNet
2.2.2 ZF Net
2.2.3 VGG Net
2.2.4 GoogLeNet
2.2.5 ResNet
2.2.6 DenseNet
2.3 典型的細(xì)粒度圖像分類算法
2.3.1 強(qiáng)監(jiān)督:使用人工標(biāo)注信息
2.3.2 弱監(jiān)督:只使用類別標(biāo)簽
2.4 區(qū)域提取算法
2.4.1 R-CNN
2.4.2 SPP-Net
2.4.3 Fast R-CNN
2.4.4 Faster R-CNN
2.4.5 特征金字塔FPN
2.5 本章小結(jié)
第三章 基于CNN的弱監(jiān)督區(qū)域提取算法
3.1 特征的可視化與區(qū)域提取的意義
3.2 本文提出的區(qū)域提取算法
3.2.1 粗糙區(qū)域信息的提取
3.2.2 高亮區(qū)域的選取
3.2.3 閾值的自動選取與調(diào)整
3.3 實驗分析
3.3.1 評判標(biāo)準(zhǔn)
3.3.2 數(shù)據(jù)集
3.3.3 區(qū)域提取算法的流程
3.3.4 實驗分析
3.4 本章小結(jié)
第四章 基于預(yù)處理圖像的分類器設(shè)計
4.1 單CNN網(wǎng)絡(luò)的細(xì)粒度圖像分類模型
4.1.1 對現(xiàn)有模型進(jìn)行學(xué)習(xí)
4.1.2 基于現(xiàn)有模型的改動
4.2 多CNN網(wǎng)絡(luò)的細(xì)粒度圖像分類模型
4.3 本章小結(jié)
第五章 總結(jié)與展望
5.1 本文總結(jié)
5.2 展望
參考文獻(xiàn)
攻讀碩士學(xué)位期間的科研成果
致謝
本文編號:3833972
【文章頁數(shù)】:53 頁
【學(xué)位級別】:碩士
【文章目錄】:
摘要
Abstract
第一章 緒論
1.1 研究的背景和意義
1.2 研究現(xiàn)狀
1.2.1 卷積神經(jīng)網(wǎng)絡(luò)概述
1.2.2 細(xì)粒度圖像分類概述
1.2.3 區(qū)域提取算法概述
1.2.4 當(dāng)前圖像分類主要研究方向
1.3 現(xiàn)有區(qū)域提取和細(xì)粒度分類的不足
1.4 本文組織結(jié)構(gòu)與創(chuàng)新點
1.4.1 本文的組織結(jié)構(gòu)
1.4.2 本文模型結(jié)構(gòu)
1.4.3 本文創(chuàng)新點
第二章 相關(guān)內(nèi)容綜述
2.1 卷積神經(jīng)網(wǎng)絡(luò)的基本組成
2.2 經(jīng)典卷積神經(jīng)網(wǎng)絡(luò)
2.2.1 AlexNet
2.2.2 ZF Net
2.2.3 VGG Net
2.2.4 GoogLeNet
2.2.5 ResNet
2.2.6 DenseNet
2.3 典型的細(xì)粒度圖像分類算法
2.3.1 強(qiáng)監(jiān)督:使用人工標(biāo)注信息
2.3.2 弱監(jiān)督:只使用類別標(biāo)簽
2.4 區(qū)域提取算法
2.4.1 R-CNN
2.4.2 SPP-Net
2.4.3 Fast R-CNN
2.4.4 Faster R-CNN
2.4.5 特征金字塔FPN
2.5 本章小結(jié)
第三章 基于CNN的弱監(jiān)督區(qū)域提取算法
3.1 特征的可視化與區(qū)域提取的意義
3.2 本文提出的區(qū)域提取算法
3.2.1 粗糙區(qū)域信息的提取
3.2.2 高亮區(qū)域的選取
3.2.3 閾值的自動選取與調(diào)整
3.3 實驗分析
3.3.1 評判標(biāo)準(zhǔn)
3.3.2 數(shù)據(jù)集
3.3.3 區(qū)域提取算法的流程
3.3.4 實驗分析
3.4 本章小結(jié)
第四章 基于預(yù)處理圖像的分類器設(shè)計
4.1 單CNN網(wǎng)絡(luò)的細(xì)粒度圖像分類模型
4.1.1 對現(xiàn)有模型進(jìn)行學(xué)習(xí)
4.1.2 基于現(xiàn)有模型的改動
4.2 多CNN網(wǎng)絡(luò)的細(xì)粒度圖像分類模型
4.3 本章小結(jié)
第五章 總結(jié)與展望
5.1 本文總結(jié)
5.2 展望
參考文獻(xiàn)
攻讀碩士學(xué)位期間的科研成果
致謝
本文編號:3833972
本文鏈接:http://sikaile.net/kejilunwen/shengwushengchang/3833972.html
最近更新
教材專著