基于卷積神經(jīng)網(wǎng)絡(luò)的圖像目標(biāo)檢測(cè)技術(shù)研究
發(fā)布時(shí)間:2023-02-12 13:10
圖像目標(biāo)檢測(cè)是計(jì)算機(jī)視覺領(lǐng)域最重要,也最具有挑戰(zhàn)性的難題之一,它為更高層次的視覺任務(wù)做準(zhǔn)備。圖像特征提取是圖像目標(biāo)檢測(cè)的關(guān)鍵。卷積神經(jīng)網(wǎng)絡(luò)可以從大量圖像數(shù)據(jù)中自動(dòng)學(xué)習(xí)出目標(biāo)檢測(cè)所需的特征,避免了人工設(shè)計(jì)特征的復(fù)雜過程。并且可以適應(yīng)目標(biāo)平移、目標(biāo)縮放、目標(biāo)形變以及目標(biāo)所處環(huán)境的變化。因此,基于卷積神經(jīng)網(wǎng)絡(luò)的目標(biāo)檢測(cè)算法正受到越來越多人的關(guān)注。但是現(xiàn)有的經(jīng)典網(wǎng)絡(luò)在檢測(cè)多尺度目標(biāo),特別是小目標(biāo)時(shí)仍然存在困難,本文針對(duì)這些問題對(duì)網(wǎng)絡(luò)做改進(jìn),并將它應(yīng)用于遙感圖像飛機(jī)檢測(cè),說明本文的研究工作具有非常重要的理論研究意義和工程應(yīng)用價(jià)值。本文主要研究基于卷積神經(jīng)網(wǎng)絡(luò)的目標(biāo)檢測(cè)技術(shù),對(duì)Two-stage的目標(biāo)檢測(cè)器做改進(jìn),以提升它們對(duì)圖像目標(biāo)的檢測(cè)效果。論文的主要工作和成果如下:1、針對(duì)卷積神經(jīng)網(wǎng)絡(luò)對(duì)小目標(biāo)檢測(cè)效果較差的問題。本文利用卷積神經(jīng)網(wǎng)絡(luò)不同層的多尺度特征,提出了一種構(gòu)建語義金字塔特征的新方法,并用該方法構(gòu)建了一個(gè)新的語義金字塔特征,目標(biāo)候選區(qū)域的分類和回歸都在該金字塔特征上進(jìn)行,增強(qiáng)了算法對(duì)小目標(biāo)的檢測(cè)性能。2、針對(duì)傳統(tǒng)卷積神經(jīng)網(wǎng)絡(luò)的目標(biāo)候選區(qū)域特征過于簡(jiǎn)單的問題,本文利用卷積神經(jīng)網(wǎng)絡(luò)卷積層的跨...
【文章頁(yè)數(shù)】:90 頁(yè)
【學(xué)位級(jí)別】:碩士
【文章目錄】:
摘要
ABSTRACT
第一章 緒論
1.1 研究背景及意義
1.2 圖像目標(biāo)檢測(cè)研究現(xiàn)狀
1.2.1 傳統(tǒng)圖像目標(biāo)檢測(cè)算法研究現(xiàn)狀
1.2.2 基于卷積神經(jīng)網(wǎng)絡(luò)的圖像目標(biāo)檢測(cè)算法研究現(xiàn)狀
1.3 論文主要內(nèi)容及章節(jié)安排
1.3.1 主要研究?jī)?nèi)容
1.3.2 論文章節(jié)安排
第二章 面向圖像目標(biāo)檢測(cè)的深度卷積神經(jīng)網(wǎng)絡(luò)基本原理
2.1 引言
2.2 卷積神經(jīng)網(wǎng)絡(luò)的基本結(jié)構(gòu)
2.2.1 卷積層
2.2.2 激活函數(shù)層
2.2.3 池化層
2.2.4 全連接層
2.2.5 softmax層
2.3 面向圖像目標(biāo)檢測(cè)的卷積神經(jīng)網(wǎng)絡(luò)
2.3.1 基于卷積神經(jīng)網(wǎng)絡(luò)的圖像目標(biāo)檢測(cè)流程
2.3.2 卷積神經(jīng)網(wǎng)絡(luò)的訓(xùn)練方法
2.3.3 優(yōu)化算法
2.4 經(jīng)典的目標(biāo)檢測(cè)模型
2.4.1 Faster R-CNN
2.4.2 R-FCN
2.4.3 目標(biāo)檢測(cè)算法的評(píng)價(jià)標(biāo)準(zhǔn)
2.5 小結(jié)
第三章 面向圖像目標(biāo)檢測(cè)的CNN多尺度特征融合技術(shù)研究
3.1 引言
3.2 傳統(tǒng)卷積神經(jīng)網(wǎng)絡(luò)用于圖像目標(biāo)檢測(cè)的缺點(diǎn)
3.3 基于卷積神經(jīng)網(wǎng)絡(luò)多尺度特征融合的目標(biāo)檢測(cè)
3.3.1 多尺度特征融合方法
3.3.2 特征提取模塊的設(shè)計(jì)
3.4 實(shí)驗(yàn)與分析
3.4.1 實(shí)驗(yàn)數(shù)據(jù)集
3.4.2 實(shí)驗(yàn)環(huán)境設(shè)置
3.4.3 實(shí)驗(yàn)結(jié)果與分析
3.5 小結(jié)
第四章 基于Maxout R-CNN的目標(biāo)檢測(cè)技術(shù)研究
4.1 引言
4.2 面向圖像目標(biāo)檢測(cè)的傳統(tǒng)CNN目標(biāo)候選區(qū)域特征獲取
4.2.1 目標(biāo)候選區(qū)域精選
4.2.2 傳統(tǒng)CNN目標(biāo)候選區(qū)域特征獲取的缺陷
4.3 基于Maxout R-CNN的圖像目標(biāo)檢測(cè)
4.3.1 Ro I-scale Pooling層
4.3.2 Maxout層
4.3.3 基于Maxout R-CNN的目標(biāo)候選區(qū)域特征獲取
4.4 實(shí)驗(yàn)與分析
4.4.1 實(shí)驗(yàn)環(huán)境設(shè)置
4.4.2 Faster R-CNN的實(shí)驗(yàn)結(jié)果
4.4.3 FPN的實(shí)驗(yàn)結(jié)果
4.5 小結(jié)
第五章 基于CNN多尺度特征融合和Maxout R-CNN的遙感圖像目標(biāo)檢測(cè)
5.1 引言
5.2 用于遙感圖像目標(biāo)檢測(cè)的卷積神經(jīng)網(wǎng)絡(luò)基本架構(gòu)
5.3 遙感圖像預(yù)處理
5.3.1 裁剪遙感圖像
5.3.2 k-means聚類目標(biāo)真值框
5.4 實(shí)驗(yàn)與分析
5.4.1 實(shí)驗(yàn)數(shù)據(jù)集
5.4.2 實(shí)驗(yàn)環(huán)境設(shè)置
5.4.3 實(shí)驗(yàn)結(jié)果與分析
5.5 小結(jié)
結(jié)束語
致謝
參考文獻(xiàn)
作者在學(xué)期間取得的學(xué)術(shù)成果
本文編號(hào):3741169
【文章頁(yè)數(shù)】:90 頁(yè)
【學(xué)位級(jí)別】:碩士
【文章目錄】:
摘要
ABSTRACT
第一章 緒論
1.1 研究背景及意義
1.2 圖像目標(biāo)檢測(cè)研究現(xiàn)狀
1.2.1 傳統(tǒng)圖像目標(biāo)檢測(cè)算法研究現(xiàn)狀
1.2.2 基于卷積神經(jīng)網(wǎng)絡(luò)的圖像目標(biāo)檢測(cè)算法研究現(xiàn)狀
1.3 論文主要內(nèi)容及章節(jié)安排
1.3.1 主要研究?jī)?nèi)容
1.3.2 論文章節(jié)安排
第二章 面向圖像目標(biāo)檢測(cè)的深度卷積神經(jīng)網(wǎng)絡(luò)基本原理
2.1 引言
2.2 卷積神經(jīng)網(wǎng)絡(luò)的基本結(jié)構(gòu)
2.2.1 卷積層
2.2.2 激活函數(shù)層
2.2.3 池化層
2.2.4 全連接層
2.2.5 softmax層
2.3 面向圖像目標(biāo)檢測(cè)的卷積神經(jīng)網(wǎng)絡(luò)
2.3.1 基于卷積神經(jīng)網(wǎng)絡(luò)的圖像目標(biāo)檢測(cè)流程
2.3.2 卷積神經(jīng)網(wǎng)絡(luò)的訓(xùn)練方法
2.3.3 優(yōu)化算法
2.4 經(jīng)典的目標(biāo)檢測(cè)模型
2.4.1 Faster R-CNN
2.4.2 R-FCN
2.4.3 目標(biāo)檢測(cè)算法的評(píng)價(jià)標(biāo)準(zhǔn)
2.5 小結(jié)
第三章 面向圖像目標(biāo)檢測(cè)的CNN多尺度特征融合技術(shù)研究
3.1 引言
3.2 傳統(tǒng)卷積神經(jīng)網(wǎng)絡(luò)用于圖像目標(biāo)檢測(cè)的缺點(diǎn)
3.3 基于卷積神經(jīng)網(wǎng)絡(luò)多尺度特征融合的目標(biāo)檢測(cè)
3.3.1 多尺度特征融合方法
3.3.2 特征提取模塊的設(shè)計(jì)
3.4 實(shí)驗(yàn)與分析
3.4.1 實(shí)驗(yàn)數(shù)據(jù)集
3.4.2 實(shí)驗(yàn)環(huán)境設(shè)置
3.4.3 實(shí)驗(yàn)結(jié)果與分析
3.5 小結(jié)
第四章 基于Maxout R-CNN的目標(biāo)檢測(cè)技術(shù)研究
4.1 引言
4.2 面向圖像目標(biāo)檢測(cè)的傳統(tǒng)CNN目標(biāo)候選區(qū)域特征獲取
4.2.1 目標(biāo)候選區(qū)域精選
4.2.2 傳統(tǒng)CNN目標(biāo)候選區(qū)域特征獲取的缺陷
4.3 基于Maxout R-CNN的圖像目標(biāo)檢測(cè)
4.3.1 Ro I-scale Pooling層
4.3.2 Maxout層
4.3.3 基于Maxout R-CNN的目標(biāo)候選區(qū)域特征獲取
4.4 實(shí)驗(yàn)與分析
4.4.1 實(shí)驗(yàn)環(huán)境設(shè)置
4.4.2 Faster R-CNN的實(shí)驗(yàn)結(jié)果
4.4.3 FPN的實(shí)驗(yàn)結(jié)果
4.5 小結(jié)
第五章 基于CNN多尺度特征融合和Maxout R-CNN的遙感圖像目標(biāo)檢測(cè)
5.1 引言
5.2 用于遙感圖像目標(biāo)檢測(cè)的卷積神經(jīng)網(wǎng)絡(luò)基本架構(gòu)
5.3 遙感圖像預(yù)處理
5.3.1 裁剪遙感圖像
5.3.2 k-means聚類目標(biāo)真值框
5.4 實(shí)驗(yàn)與分析
5.4.1 實(shí)驗(yàn)數(shù)據(jù)集
5.4.2 實(shí)驗(yàn)環(huán)境設(shè)置
5.4.3 實(shí)驗(yàn)結(jié)果與分析
5.5 小結(jié)
結(jié)束語
致謝
參考文獻(xiàn)
作者在學(xué)期間取得的學(xué)術(shù)成果
本文編號(hào):3741169
本文鏈接:http://sikaile.net/kejilunwen/zidonghuakongzhilunwen/3741169.html
最近更新
教材專著