多模態(tài)融合的RGB-D圖像顯著目標(biāo)檢測(cè)研究
發(fā)布時(shí)間:2021-05-21 19:54
圖像顯著目標(biāo)檢測(cè)旨在找出圖像中最吸引人的目標(biāo),作為計(jì)算機(jī)視覺任務(wù)中的一個(gè)分支,在近幾年越來越受到重視。作為其他計(jì)算機(jī)視覺任務(wù)中的一個(gè)預(yù)處理步驟,例如圖像分割、場景重建、視覺追蹤等,可以節(jié)省許多不必要的時(shí)間和空間成本代價(jià)。目前單幅圖顯著目標(biāo)檢測(cè)主要分為基于RGB圖像及基于RGB-D圖像的顯著目標(biāo)檢測(cè)。隨著深度傳感器的應(yīng)用,Depth信息被證明在顯著目標(biāo)檢測(cè)中是一種具有特別重要價(jià)值的特征線索。因此RGB-D圖像顯著目標(biāo)檢測(cè)方法大量被提出,早期的工作都是基于人工設(shè)計(jì)特征的RGB-D顯著目標(biāo)檢測(cè),單純的將RGB特征和Depth特征融合,缺失了目標(biāo)的全局性。特別是在背景復(fù)雜的情況下,傳統(tǒng)的方法取得的效果欠佳。近年來,隨著深度學(xué)習(xí)的發(fā)展,各種各樣的基于卷積神經(jīng)網(wǎng)絡(luò)的RGB-D模型被應(yīng)用于圖像顯著目標(biāo)檢測(cè)。目前的基于深度卷積神經(jīng)網(wǎng)絡(luò)的RGB-D圖像顯著目標(biāo)檢測(cè)模型主要分為兩種架構(gòu)模式,一種為輸入融合,即單流網(wǎng)絡(luò)架構(gòu)模式,另一種后期融合,即雙流網(wǎng)絡(luò)架構(gòu)模式。針對(duì)RGB-D圖像顯著目標(biāo)檢測(cè),本文分別基于這兩種架構(gòu)模式做了部分工作。針對(duì)于深度卷積神經(jīng)網(wǎng)絡(luò)的研究,本文第一個(gè)工作設(shè)計(jì)了一種基于單流網(wǎng)絡(luò)的RGB...
【文章來源】:安徽大學(xué)安徽省 211工程院校
【文章頁數(shù)】:67 頁
【學(xué)位級(jí)別】:碩士
【文章目錄】:
摘要
abstract
第一章 緒論
1.1 研究背景和意義
1.2 國內(nèi)外研究現(xiàn)狀
1.2.1 RGB-D顯著目標(biāo)檢測(cè)研究現(xiàn)狀
1.2.2 基于注意力機(jī)制的顯著目標(biāo)檢測(cè)研究現(xiàn)狀
1.3 本文主要工作與章節(jié)安排
1.3.1 本文主要工作與創(chuàng)新點(diǎn)
1.3.2 章節(jié)安排
第二章 相關(guān)理論與算法
2.1 RGB圖像和RGB-D圖像
2.2 深度學(xué)習(xí)
2.3 注意力機(jī)制
2.4 本章小結(jié)
第三章 基于多級(jí)漸進(jìn)并行注意力的RGB-D圖像顯著目標(biāo)檢測(cè)
3.1 模型框架
3.2 特征提取
3.3 漸進(jìn)式注意力機(jī)制
3.3.1 漸進(jìn)式空間注意力機(jī)制
3.3.2 漸進(jìn)式通道注意力機(jī)制
3.4 遞歸卷積層優(yōu)化
3.5 層次顯著圖的融合
3.6 實(shí)驗(yàn)
3.6.1 數(shù)據(jù)集
3.6.2 評(píng)估標(biāo)準(zhǔn)
3.6.3 實(shí)驗(yàn)設(shè)置
3.6.4 漸進(jìn)式注意力機(jī)制消融對(duì)比實(shí)驗(yàn)
3.6.5 與級(jí)聯(lián)空間和通道注意力機(jī)制的實(shí)驗(yàn)對(duì)比
3.6.6 與其他模型的對(duì)比評(píng)估
3.7 本章小結(jié)
第四章 基于多模態(tài)特征融合監(jiān)督的RGB-D圖像顯著目標(biāo)檢測(cè)
4.1 模型框架
4.2 雙流側(cè)邊監(jiān)督
4.3 多模態(tài)特征融合
4.4 損失函數(shù)
4.5 實(shí)驗(yàn)
4.5.1 數(shù)據(jù)集及評(píng)估標(biāo)準(zhǔn)
4.5.2 實(shí)驗(yàn)設(shè)置
4.5.3 側(cè)邊監(jiān)督模塊對(duì)比
4.5.4 多模態(tài)特征融合實(shí)驗(yàn)對(duì)比
4.5.5 低維Depth特征實(shí)驗(yàn)對(duì)比
4.5.6 與其它模型實(shí)驗(yàn)對(duì)比
4.6 本章小結(jié)
第五章 總結(jié)與展望
5.1 工作總結(jié)
5.2 研究展望
參考文獻(xiàn)
在讀碩士期間的研究成果
致謝
本文編號(hào):3200285
【文章來源】:安徽大學(xué)安徽省 211工程院校
【文章頁數(shù)】:67 頁
【學(xué)位級(jí)別】:碩士
【文章目錄】:
摘要
abstract
第一章 緒論
1.1 研究背景和意義
1.2 國內(nèi)外研究現(xiàn)狀
1.2.1 RGB-D顯著目標(biāo)檢測(cè)研究現(xiàn)狀
1.2.2 基于注意力機(jī)制的顯著目標(biāo)檢測(cè)研究現(xiàn)狀
1.3 本文主要工作與章節(jié)安排
1.3.1 本文主要工作與創(chuàng)新點(diǎn)
1.3.2 章節(jié)安排
第二章 相關(guān)理論與算法
2.1 RGB圖像和RGB-D圖像
2.2 深度學(xué)習(xí)
2.3 注意力機(jī)制
2.4 本章小結(jié)
第三章 基于多級(jí)漸進(jìn)并行注意力的RGB-D圖像顯著目標(biāo)檢測(cè)
3.1 模型框架
3.2 特征提取
3.3 漸進(jìn)式注意力機(jī)制
3.3.1 漸進(jìn)式空間注意力機(jī)制
3.3.2 漸進(jìn)式通道注意力機(jī)制
3.4 遞歸卷積層優(yōu)化
3.5 層次顯著圖的融合
3.6 實(shí)驗(yàn)
3.6.1 數(shù)據(jù)集
3.6.2 評(píng)估標(biāo)準(zhǔn)
3.6.3 實(shí)驗(yàn)設(shè)置
3.6.4 漸進(jìn)式注意力機(jī)制消融對(duì)比實(shí)驗(yàn)
3.6.5 與級(jí)聯(lián)空間和通道注意力機(jī)制的實(shí)驗(yàn)對(duì)比
3.6.6 與其他模型的對(duì)比評(píng)估
3.7 本章小結(jié)
第四章 基于多模態(tài)特征融合監(jiān)督的RGB-D圖像顯著目標(biāo)檢測(cè)
4.1 模型框架
4.2 雙流側(cè)邊監(jiān)督
4.3 多模態(tài)特征融合
4.4 損失函數(shù)
4.5 實(shí)驗(yàn)
4.5.1 數(shù)據(jù)集及評(píng)估標(biāo)準(zhǔn)
4.5.2 實(shí)驗(yàn)設(shè)置
4.5.3 側(cè)邊監(jiān)督模塊對(duì)比
4.5.4 多模態(tài)特征融合實(shí)驗(yàn)對(duì)比
4.5.5 低維Depth特征實(shí)驗(yàn)對(duì)比
4.5.6 與其它模型實(shí)驗(yàn)對(duì)比
4.6 本章小結(jié)
第五章 總結(jié)與展望
5.1 工作總結(jié)
5.2 研究展望
參考文獻(xiàn)
在讀碩士期間的研究成果
致謝
本文編號(hào):3200285
本文鏈接:http://sikaile.net/kejilunwen/shengwushengchang/3200285.html
最近更新
教材專著