基于改進(jìn)卷積神經(jīng)網(wǎng)絡(luò)的光流預(yù)測(cè)算法研究
發(fā)布時(shí)間:2022-10-30 11:29
光流是目前運(yùn)動(dòng)圖像分析的重要方法和工具,現(xiàn)已發(fā)展成為計(jì)算機(jī)視覺(jué)領(lǐng)域的一個(gè)重要分支。光流所表示的是空間運(yùn)動(dòng)物體,在觀察參考平面上像素的運(yùn)動(dòng)狀態(tài)。光流預(yù)測(cè)算法是利用圖像序列中相鄰兩幀之間的相關(guān)性和對(duì)應(yīng)關(guān)系,來(lái)找到對(duì)應(yīng)像素在時(shí)間和空間上的變化,以此計(jì)算相鄰兩幀間目標(biāo)對(duì)象運(yùn)動(dòng)狀態(tài)的方法。光流表達(dá)了圖像像素的變化,由于它包含了目標(biāo)運(yùn)動(dòng)的信息,因此可被觀察者用來(lái)確定目標(biāo)的運(yùn)動(dòng)情況。研究光流場(chǎng)的目的就是為了從圖像序列中近似得到不能直接得到的運(yùn)動(dòng)場(chǎng)。因此對(duì)光流信息的研究在圖像處理領(lǐng)域有著重要的理論價(jià)值;谧兎帜芰磕P偷念A(yù)測(cè)方法和基于塊匹配的啟發(fā)式方法是光流預(yù)測(cè)中最主流的傳統(tǒng)預(yù)測(cè)方法,而這些方法對(duì)圖像的適應(yīng)性有限,缺乏泛化性,效率低且操作和計(jì)算上較為復(fù)雜,不利于復(fù)雜圖像數(shù)據(jù)光流的提取。而使用卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Network,CNN)可以避免人工構(gòu)造特征所導(dǎo)致計(jì)算繁瑣且適應(yīng)性差的問(wèn)題,通過(guò)海量數(shù)據(jù)自適應(yīng)學(xué)習(xí)所需特征,能夠更好得提取數(shù)據(jù)深層信息,且對(duì)不同類型圖像數(shù)據(jù)有著較強(qiáng)的適應(yīng)性。但由于圖像光流預(yù)測(cè)中存在許多復(fù)雜問(wèn)題,例如遮擋、大位移導(dǎo)致目標(biāo)搜索丟失以及圖像細(xì)節(jié)特征...
【文章頁(yè)數(shù)】:57 頁(yè)
【學(xué)位級(jí)別】:碩士
【文章目錄】:
摘要
abstract
1 緒論
1.1 課題研究背景和意義
1.1.1 研究背景
1.1.2 選題意義
1.2 光流預(yù)測(cè)算法的研究現(xiàn)狀
1.2.1 傳統(tǒng)方法研究現(xiàn)狀
1.2.2 深度學(xué)習(xí)方法研究現(xiàn)狀
1.3 本文算法擬解決問(wèn)題
1.4 本文主要研究?jī)?nèi)容及章節(jié)安排
1.5 本章小結(jié)
2 光流預(yù)測(cè)基本知識(shí)介紹
2.1 圖像光流的基本概念
2.2 光流預(yù)測(cè)的基本原理
2.2.1 傳統(tǒng)變分方法的原理介紹
2.2.2 深度學(xué)習(xí)方法的原理介紹
2.3 基于卷積神經(jīng)網(wǎng)絡(luò)的光流預(yù)測(cè)模型優(yōu)化思路
2.4 本章小結(jié)
3 基于卷積神經(jīng)網(wǎng)絡(luò)的光流預(yù)測(cè)模型
3.1 引言
3.2 總體網(wǎng)絡(luò)架構(gòu)概述
3.3 可形變卷積特征提取
3.3.1 可形變卷積捕獲細(xì)節(jié)和大位移特征
3.3.2 可形變池化
3.4 基于注意力機(jī)制的幀間特征關(guān)聯(lián)層
3.4.1 注意力機(jī)制的原理
3.4.2 Encoder-Decoder框架解釋
3.4.3 基于通道注意力的特征關(guān)聯(lián)層
3.5 光流預(yù)測(cè)與網(wǎng)絡(luò)級(jí)聯(lián)光流優(yōu)化
3.5.1 Warp損失量
3.5.2 級(jí)聯(lián)網(wǎng)絡(luò)搭建
3.6 網(wǎng)絡(luò)訓(xùn)練細(xì)節(jié)
3.7 本章小結(jié)
4 實(shí)驗(yàn)結(jié)果與分析
4.1 引言
4.2 數(shù)據(jù)集介紹
4.2.1 Flying Chairs數(shù)據(jù)集
4.2.2 Mpi Sintel數(shù)據(jù)集
4.3 基于Flying Chairs數(shù)據(jù)集的算法測(cè)試和其他方法的精度比較
4.3.1 對(duì)比方法簡(jiǎn)介
4.3.2 數(shù)據(jù)分析對(duì)比
4.4 基于Mpi Sintel數(shù)據(jù)集的算法測(cè)試和其他文獻(xiàn)的精度比較
4.4.1 對(duì)比方法簡(jiǎn)介
4.4.2 精度分析對(duì)比
4.5 光流預(yù)測(cè)在遮擋、大位移、細(xì)節(jié)呈現(xiàn)三個(gè)方面的魯棒性分析
4.5.1 遮擋問(wèn)題的魯棒性分析
4.5.2 大位移問(wèn)題的魯棒性分析
4.5.3 細(xì)節(jié)圖像的光流預(yù)測(cè)魯棒性分析
4.6 本章小結(jié)
總結(jié)與展望
總結(jié)
展望
參考文獻(xiàn)
致謝
攻讀學(xué)位期間發(fā)表的學(xué)術(shù)論文目錄
【參考文獻(xiàn)】:
期刊論文
[1]基于雙向注意力機(jī)制圖像描述方法研究[J]. 陶云松,張麗紅. 測(cè)試技術(shù)學(xué)報(bào). 2019(04)
[2]相互結(jié)構(gòu)引導(dǎo)濾波TV-L1變分光流估計(jì)[J]. 葛利躍,張聰炫,陳震,黎明,陳昊. 電子學(xué)報(bào). 2019(03)
[3]視覺(jué)注意力檢測(cè)技術(shù)研究綜述[J]. 羅元,陳雪峰,毛雪峰,張毅. 半導(dǎo)體光電. 2019(01)
[4]I-vector聚類字典及注意力機(jī)制框架的說(shuō)話人自適應(yīng)[J]. 黃俊,蔣兵,李先剛,郭武生,戴禮榮. 小型微型計(jì)算機(jī)系統(tǒng). 2019(02)
[5]視覺(jué)注意力檢測(cè)綜述[J]. 王文冠,沈建冰,賈云得. 軟件學(xué)報(bào). 2019(02)
[6]卷積神經(jīng)網(wǎng)絡(luò)綜述[J]. 劉健,袁謙,吳廣,喻曉. 計(jì)算機(jī)時(shí)代. 2018(11)
[7]基于分層置信度傳播的光流估計(jì)方法[J]. 張子星,文穎. 計(jì)算機(jī)系統(tǒng)應(yīng)用. 2018(09)
[8]基于注意力機(jī)制的句子排序方法[J]. 欒克鑫,杜新凱,孫承杰,劉秉權(quán),王曉龍. 中文信息學(xué)報(bào). 2018(01)
[9]圖像理解中的卷積神經(jīng)網(wǎng)絡(luò)[J]. 常亮,鄧小明,周明全,武仲科,袁野,楊碩,王宏安. 自動(dòng)化學(xué)報(bào). 2016(09)
碩士論文
[1]基于非剛性稠密匹配的變分光流計(jì)算技術(shù)研究[D]. 熊帆.南昌航空大學(xué) 2018
本文編號(hào):3698806
【文章頁(yè)數(shù)】:57 頁(yè)
【學(xué)位級(jí)別】:碩士
【文章目錄】:
摘要
abstract
1 緒論
1.1 課題研究背景和意義
1.1.1 研究背景
1.1.2 選題意義
1.2 光流預(yù)測(cè)算法的研究現(xiàn)狀
1.2.1 傳統(tǒng)方法研究現(xiàn)狀
1.2.2 深度學(xué)習(xí)方法研究現(xiàn)狀
1.3 本文算法擬解決問(wèn)題
1.4 本文主要研究?jī)?nèi)容及章節(jié)安排
1.5 本章小結(jié)
2 光流預(yù)測(cè)基本知識(shí)介紹
2.1 圖像光流的基本概念
2.2 光流預(yù)測(cè)的基本原理
2.2.1 傳統(tǒng)變分方法的原理介紹
2.2.2 深度學(xué)習(xí)方法的原理介紹
2.3 基于卷積神經(jīng)網(wǎng)絡(luò)的光流預(yù)測(cè)模型優(yōu)化思路
2.4 本章小結(jié)
3 基于卷積神經(jīng)網(wǎng)絡(luò)的光流預(yù)測(cè)模型
3.1 引言
3.2 總體網(wǎng)絡(luò)架構(gòu)概述
3.3 可形變卷積特征提取
3.3.1 可形變卷積捕獲細(xì)節(jié)和大位移特征
3.3.2 可形變池化
3.4 基于注意力機(jī)制的幀間特征關(guān)聯(lián)層
3.4.1 注意力機(jī)制的原理
3.4.2 Encoder-Decoder框架解釋
3.4.3 基于通道注意力的特征關(guān)聯(lián)層
3.5 光流預(yù)測(cè)與網(wǎng)絡(luò)級(jí)聯(lián)光流優(yōu)化
3.5.1 Warp損失量
3.5.2 級(jí)聯(lián)網(wǎng)絡(luò)搭建
3.6 網(wǎng)絡(luò)訓(xùn)練細(xì)節(jié)
3.7 本章小結(jié)
4 實(shí)驗(yàn)結(jié)果與分析
4.1 引言
4.2 數(shù)據(jù)集介紹
4.2.1 Flying Chairs數(shù)據(jù)集
4.2.2 Mpi Sintel數(shù)據(jù)集
4.3 基于Flying Chairs數(shù)據(jù)集的算法測(cè)試和其他方法的精度比較
4.3.1 對(duì)比方法簡(jiǎn)介
4.3.2 數(shù)據(jù)分析對(duì)比
4.4 基于Mpi Sintel數(shù)據(jù)集的算法測(cè)試和其他文獻(xiàn)的精度比較
4.4.1 對(duì)比方法簡(jiǎn)介
4.4.2 精度分析對(duì)比
4.5 光流預(yù)測(cè)在遮擋、大位移、細(xì)節(jié)呈現(xiàn)三個(gè)方面的魯棒性分析
4.5.1 遮擋問(wèn)題的魯棒性分析
4.5.2 大位移問(wèn)題的魯棒性分析
4.5.3 細(xì)節(jié)圖像的光流預(yù)測(cè)魯棒性分析
4.6 本章小結(jié)
總結(jié)與展望
總結(jié)
展望
參考文獻(xiàn)
致謝
攻讀學(xué)位期間發(fā)表的學(xué)術(shù)論文目錄
【參考文獻(xiàn)】:
期刊論文
[1]基于雙向注意力機(jī)制圖像描述方法研究[J]. 陶云松,張麗紅. 測(cè)試技術(shù)學(xué)報(bào). 2019(04)
[2]相互結(jié)構(gòu)引導(dǎo)濾波TV-L1變分光流估計(jì)[J]. 葛利躍,張聰炫,陳震,黎明,陳昊. 電子學(xué)報(bào). 2019(03)
[3]視覺(jué)注意力檢測(cè)技術(shù)研究綜述[J]. 羅元,陳雪峰,毛雪峰,張毅. 半導(dǎo)體光電. 2019(01)
[4]I-vector聚類字典及注意力機(jī)制框架的說(shuō)話人自適應(yīng)[J]. 黃俊,蔣兵,李先剛,郭武生,戴禮榮. 小型微型計(jì)算機(jī)系統(tǒng). 2019(02)
[5]視覺(jué)注意力檢測(cè)綜述[J]. 王文冠,沈建冰,賈云得. 軟件學(xué)報(bào). 2019(02)
[6]卷積神經(jīng)網(wǎng)絡(luò)綜述[J]. 劉健,袁謙,吳廣,喻曉. 計(jì)算機(jī)時(shí)代. 2018(11)
[7]基于分層置信度傳播的光流估計(jì)方法[J]. 張子星,文穎. 計(jì)算機(jī)系統(tǒng)應(yīng)用. 2018(09)
[8]基于注意力機(jī)制的句子排序方法[J]. 欒克鑫,杜新凱,孫承杰,劉秉權(quán),王曉龍. 中文信息學(xué)報(bào). 2018(01)
[9]圖像理解中的卷積神經(jīng)網(wǎng)絡(luò)[J]. 常亮,鄧小明,周明全,武仲科,袁野,楊碩,王宏安. 自動(dòng)化學(xué)報(bào). 2016(09)
碩士論文
[1]基于非剛性稠密匹配的變分光流計(jì)算技術(shù)研究[D]. 熊帆.南昌航空大學(xué) 2018
本文編號(hào):3698806
本文鏈接:http://sikaile.net/kejilunwen/zidonghuakongzhilunwen/3698806.html
最近更新
教材專著