基于眼動(dòng)注視點(diǎn)和多尺度卷積神經(jīng)網(wǎng)絡(luò)的顯著目標(biāo)檢測(cè)
發(fā)布時(shí)間:2023-05-11 04:55
隨著互聯(lián)網(wǎng)和多媒體技術(shù)的快速發(fā)展,圖像逐漸成為人們傳遞信息的重要載體。如何有效的從海量地圖像數(shù)據(jù)中過濾冗余信息并提取出圖像中的顯著區(qū)域已經(jīng)成為圖像處理領(lǐng)域的熱門問題,圖像顯著目標(biāo)檢測(cè)是解決該問題的一個(gè)重要方法。通常,基于底層特征的顯著目標(biāo)檢測(cè)模型雖然在簡(jiǎn)單圖像中取得了較好的效果,但是沒有考慮人眼的視覺特性和高層語義特征,因此無法滿足復(fù)雜圖像的顯著目標(biāo)檢測(cè)需求。卷積神經(jīng)網(wǎng)絡(luò)通過監(jiān)督學(xué)習(xí)可以有效的提取圖像的高層語義特征,被廣泛地應(yīng)用于圖像處理領(lǐng)域。眼動(dòng)記錄了人眼在觀察圖像時(shí)的運(yùn)動(dòng)信息,為了解人眼的視覺感知和真實(shí)意圖提供了依據(jù),利用眼動(dòng)可以很好地模擬人的視覺選擇注意機(jī)制;谝陨峡紤],本文提出了一種結(jié)合眼動(dòng)注視點(diǎn)和多尺度卷積神經(jīng)網(wǎng)絡(luò)的圖像顯著目標(biāo)檢測(cè)模型,充分利用眼動(dòng)數(shù)據(jù)提取圖像的高層語義信息,有效提高了顯著性檢測(cè)的性能。本文的主要工作有:(1)提出了一種基于多尺度卷積神經(jīng)網(wǎng)絡(luò)的顯著目標(biāo)檢測(cè)模型。首先,使用循環(huán)卷積神經(jīng)網(wǎng)絡(luò)提取圖像的高層語義特征,通過反卷積網(wǎng)絡(luò)將該特征非線性映射為分層的特征圖;然后對(duì)特征圖提取多尺度的顯著先驗(yàn)圖;最后通過融合卷積網(wǎng)絡(luò)得到最終的顯著圖。(2)提出了融合眼動(dòng)注視點(diǎn)...
【文章頁數(shù)】:53 頁
【學(xué)位級(jí)別】:碩士
【文章目錄】:
摘要
Abstract
第1章 緒論
1.1 研究背景和意義
1.2 國(guó)內(nèi)外研究現(xiàn)狀
1.2.1 自底向上的顯著目標(biāo)檢測(cè)方法
1.2.2 自頂向下的顯著目標(biāo)檢測(cè)方法
1.3 主要研究?jī)?nèi)容和論文結(jié)構(gòu)
第2章 相關(guān)知識(shí)
2.1 卷積神經(jīng)網(wǎng)絡(luò)
2.1.1 卷積神經(jīng)網(wǎng)絡(luò)特點(diǎn)
2.1.2 卷積神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)
2.1.3 卷積神經(jīng)網(wǎng)絡(luò)優(yōu)點(diǎn)
2.2 常用的卷積神經(jīng)網(wǎng)絡(luò)模型
2.2.1 AlexNet網(wǎng)絡(luò)
2.2.2 VGG網(wǎng)絡(luò)
2.2.3 RCNN網(wǎng)絡(luò)
2.3 基于卷積神經(jīng)網(wǎng)絡(luò)的圖像顯著目標(biāo)檢測(cè)
2.3.1 DHSN模型
2.3.2 WSS模型
2.4 本章小結(jié)
第3章 基于多尺度卷積神經(jīng)網(wǎng)絡(luò)的顯著目標(biāo)檢測(cè)
3.1 基于多尺度卷積神經(jīng)網(wǎng)絡(luò)的顯著目標(biāo)檢測(cè)
3.1.1 基于RCNN的高層特征提取
3.1.2 基于反卷積的多尺度顯著先驗(yàn)圖提取
3.1.3 基于FCM的多尺度顯著圖融合
3.2 實(shí)驗(yàn)與分析
3.2.1 圖像庫(kù)
3.2.2 評(píng)價(jià)指標(biāo)
3.2.3 實(shí)驗(yàn)細(xì)節(jié)
3.2.4 實(shí)驗(yàn)結(jié)果與分析
3.3 本章小結(jié)
第4章 眼動(dòng)注視點(diǎn)在圖像顯著性檢測(cè)上的應(yīng)用
4.1 人眼視覺感知系統(tǒng)
4.1.1 人類視覺信息傳遞過程
4.1.2 人眼視覺注意機(jī)制
4.1.3 眼動(dòng)追蹤技術(shù)的方法
4.1.4 眼動(dòng)的基本模式
4.2 結(jié)合眼動(dòng)注視點(diǎn)的顯著目標(biāo)檢測(cè)
4.2.1 RGB-E的獲取
4.2.2 基于RGB-E的顯著目標(biāo)檢測(cè)
4.3 眼動(dòng)數(shù)據(jù)與眼動(dòng)實(shí)驗(yàn)
4.3.1 眼動(dòng)數(shù)據(jù)集
4.3.2 眼動(dòng)數(shù)據(jù)采集
4.3.3 眼動(dòng)數(shù)據(jù)分析
4.4 實(shí)驗(yàn)與分析
4.4.1 實(shí)驗(yàn)細(xì)節(jié)
4.4.2 實(shí)驗(yàn)結(jié)果與分析
4.5 本章小結(jié)
第5章 總結(jié)與展望
5.1 本文工作總結(jié)
5.2 未來工作展望
致謝
參考文獻(xiàn)
附錄A 攻讀碩士期間發(fā)表的學(xué)術(shù)論文和參與的科研項(xiàng)目
本文編號(hào):3814202
【文章頁數(shù)】:53 頁
【學(xué)位級(jí)別】:碩士
【文章目錄】:
摘要
Abstract
第1章 緒論
1.1 研究背景和意義
1.2 國(guó)內(nèi)外研究現(xiàn)狀
1.2.1 自底向上的顯著目標(biāo)檢測(cè)方法
1.2.2 自頂向下的顯著目標(biāo)檢測(cè)方法
1.3 主要研究?jī)?nèi)容和論文結(jié)構(gòu)
第2章 相關(guān)知識(shí)
2.1 卷積神經(jīng)網(wǎng)絡(luò)
2.1.1 卷積神經(jīng)網(wǎng)絡(luò)特點(diǎn)
2.1.2 卷積神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)
2.1.3 卷積神經(jīng)網(wǎng)絡(luò)優(yōu)點(diǎn)
2.2 常用的卷積神經(jīng)網(wǎng)絡(luò)模型
2.2.1 AlexNet網(wǎng)絡(luò)
2.2.2 VGG網(wǎng)絡(luò)
2.2.3 RCNN網(wǎng)絡(luò)
2.3 基于卷積神經(jīng)網(wǎng)絡(luò)的圖像顯著目標(biāo)檢測(cè)
2.3.1 DHSN模型
2.3.2 WSS模型
2.4 本章小結(jié)
第3章 基于多尺度卷積神經(jīng)網(wǎng)絡(luò)的顯著目標(biāo)檢測(cè)
3.1 基于多尺度卷積神經(jīng)網(wǎng)絡(luò)的顯著目標(biāo)檢測(cè)
3.1.1 基于RCNN的高層特征提取
3.1.2 基于反卷積的多尺度顯著先驗(yàn)圖提取
3.1.3 基于FCM的多尺度顯著圖融合
3.2 實(shí)驗(yàn)與分析
3.2.1 圖像庫(kù)
3.2.2 評(píng)價(jià)指標(biāo)
3.2.3 實(shí)驗(yàn)細(xì)節(jié)
3.2.4 實(shí)驗(yàn)結(jié)果與分析
3.3 本章小結(jié)
第4章 眼動(dòng)注視點(diǎn)在圖像顯著性檢測(cè)上的應(yīng)用
4.1 人眼視覺感知系統(tǒng)
4.1.1 人類視覺信息傳遞過程
4.1.2 人眼視覺注意機(jī)制
4.1.3 眼動(dòng)追蹤技術(shù)的方法
4.1.4 眼動(dòng)的基本模式
4.2 結(jié)合眼動(dòng)注視點(diǎn)的顯著目標(biāo)檢測(cè)
4.2.1 RGB-E的獲取
4.2.2 基于RGB-E的顯著目標(biāo)檢測(cè)
4.3 眼動(dòng)數(shù)據(jù)與眼動(dòng)實(shí)驗(yàn)
4.3.1 眼動(dòng)數(shù)據(jù)集
4.3.2 眼動(dòng)數(shù)據(jù)采集
4.3.3 眼動(dòng)數(shù)據(jù)分析
4.4 實(shí)驗(yàn)與分析
4.4.1 實(shí)驗(yàn)細(xì)節(jié)
4.4.2 實(shí)驗(yàn)結(jié)果與分析
4.5 本章小結(jié)
第5章 總結(jié)與展望
5.1 本文工作總結(jié)
5.2 未來工作展望
致謝
參考文獻(xiàn)
附錄A 攻讀碩士期間發(fā)表的學(xué)術(shù)論文和參與的科研項(xiàng)目
本文編號(hào):3814202
本文鏈接:http://sikaile.net/kejilunwen/zidonghuakongzhilunwen/3814202.html
最近更新
教材專著