面向精細(xì)視覺理解的深度漸進學(xué)習(xí)研究
發(fā)布時間:2023-02-19 12:55
近年來,隨著視頻監(jiān)控網(wǎng)絡(luò)的大規(guī)模建設(shè)和移動終端設(shè)備的加速普及,圖像和視頻數(shù)據(jù)呈現(xiàn)爆炸式增長。由于分析技術(shù)的缺乏,大量視覺數(shù)據(jù)成為“沉睡”在存儲系統(tǒng)中的無用垃圾數(shù)據(jù)。為提高海量圖像和視頻的有用性,迫切需要研究圖像與視頻數(shù)據(jù)自動化分析與理解技術(shù)。自2012年以來深度學(xué)習(xí)極大推動了計算機視覺的發(fā)展,讓許多視覺技術(shù)逐漸走向應(yīng)用。然而現(xiàn)有方法往往只能針對簡單化、低層次的視覺理解任務(wù)取得較好的效果,這極大限制了計算機視覺的進一步發(fā)展和應(yīng)用。本文面向視頻和圖像分析需求,提出漸進學(xué)習(xí)的思想,重點探討如何實現(xiàn)更高層次、更精細(xì)的視覺內(nèi)容理解。從研究內(nèi)容角度,本文關(guān)注更加精細(xì)的視覺理解任務(wù),包括實例級別理解(instance-level understanding)、細(xì)粒度類別理解(fine-grained categorization)以及像素級別理解(pixel-level understanding)。從研究方法角度,本文提出漸進學(xué)習(xí)的思想,將單一模型難以捕獲的細(xì)節(jié)內(nèi)容和精細(xì)語義信息拆分到多個漸進階段,并基于該思想提出一系列漸進模型以適應(yīng)不同級別的精細(xì)視覺理解任務(wù)。本文的主要工作與創(chuàng)新如下:(1)本文...
【文章頁數(shù)】:140 頁
【學(xué)位級別】:博士
【文章目錄】:
摘要
abstract
主要符號對照表
第一章 緒論
1.1 課題的研究背景和意義
1.2 深度學(xué)習(xí)研究現(xiàn)狀及挑戰(zhàn)
1.3 本文的研究動機及內(nèi)容
1.4 本文的章節(jié)安排和創(chuàng)新點
第二章 深度漸進學(xué)習(xí)概述
2.1 研究背景
2.2 深度學(xué)習(xí)基本原理
2.2.1 卷積神經(jīng)網(wǎng)絡(luò)
2.2.2 循環(huán)神經(jīng)網(wǎng)絡(luò)
2.3 深度漸進學(xué)習(xí)
2.3.1 深度漸進學(xué)習(xí)的三大特征
2.3.2 深度漸進學(xué)習(xí)研究方法
2.3.3 深度漸進學(xué)習(xí)與現(xiàn)有學(xué)習(xí)方法的關(guān)系
2.4 本章小結(jié)
第三章 時序漸進模型與視頻行人重識別算法
3.1 引言
3.2 國內(nèi)外相關(guān)工作
3.3 研究動機
3.4 時序漸進模型
3.4.1 圖像特征表示
3.4.2 漸進特征融合網(wǎng)絡(luò)
3.4.3 損失函數(shù)與網(wǎng)絡(luò)訓(xùn)練
3.4.4 實現(xiàn)細(xì)節(jié)
3.5 實驗結(jié)果
3.5.1 時序漸進模型的精細(xì)性和伸縮性分析
3.5.2 時序漸進模型的數(shù)據(jù)敏感性分析
3.5.3 特征融合網(wǎng)絡(luò)的魯棒性分析
3.5.4 與現(xiàn)有方法的比較
3.5.5 收斂性分析
3.5.6 結(jié)果示例
3.6 本章小結(jié)
第四章 空間漸進學(xué)習(xí)與細(xì)粒度圖像識別算法
4.1 引言
4.2 相關(guān)工作
4.3 動機
4.4 空間漸進模型
4.4.1 循環(huán)視覺注意力網(wǎng)絡(luò)
4.4.2 空間位置漸進模型
4.4.3 空間尺度漸進模型
4.4.4 特征融合網(wǎng)絡(luò)
4.4.5 模型結(jié)構(gòu)和實現(xiàn)細(xì)節(jié)
4.5 實驗結(jié)果與評價
4.5.1 數(shù)據(jù)集與實驗設(shè)置
4.5.2 注意力網(wǎng)絡(luò)的有效性
4.5.3 特征融合網(wǎng)絡(luò)的有效性
4.5.4 與其他方法的比較
4.6 本章小結(jié)
第五章 交互漸進學(xué)習(xí)與行為預(yù)測算法
5.1 引言
5.2 相關(guān)工作
5.2.1 傳統(tǒng)方法
5.2.2 深度方法
5.3 研究動機
5.3.1 整體LRCN模型
5.3.2 個體LRCN模型
5.4 交互漸進模型
5.4.1 個體信息耦合網(wǎng)絡(luò)
5.4.2 整體-個體信息耦合模型
5.4.3 相互注意力模型
5.4.4 網(wǎng)絡(luò)訓(xùn)練
5.4.5 模型細(xì)節(jié)
5.5 實驗結(jié)果
5.5.1 數(shù)據(jù)集與實驗設(shè)置
5.5.2 在UTI上的實驗結(jié)果
5.5.3 在BIT上的實驗結(jié)果
5.5.4 漸進框架性質(zhì)研究
5.5.5 結(jié)果可視化
5.6 本章小結(jié)
第六章 模態(tài)漸進學(xué)習(xí)與視頻動作生成算法
6.1 引言
6.2 相關(guān)工作
6.2.1 人體運動分析
6.2.2 圖像生成
6.2.3 視頻生成
6.3 動機
6.4 模態(tài)漸進模型
6.4.1 對抗生成網(wǎng)絡(luò)
6.4.2 基于運動條件的關(guān)鍵點序列生成網(wǎng)絡(luò)
6.4.3 基于音頻條件的關(guān)鍵點序列生成網(wǎng)絡(luò)
6.4.4 外觀一致性運動生成網(wǎng)絡(luò)
6.4.5 實現(xiàn)細(xì)節(jié)
6.5 剛體運動生成
6.5.1 數(shù)據(jù)庫和測試標(biāo)準(zhǔn)
6.5.2 實驗結(jié)果
6.6 非剛體運動生成
6.6.1 數(shù)據(jù)集
6.6.2 結(jié)果比較
6.6.3 各部件的有效性分析
6.6.4 與其他基于關(guān)鍵點的模型的比較
6.7 群體交互運動生成
6.7.1 數(shù)據(jù)庫
6.7.2 實驗結(jié)果
6.8 本章小結(jié)
第七章 總結(jié)與展望
7.1 論文工作總結(jié)
7.2 未來研究展望
參考文獻
致謝
攻讀學(xué)位期間發(fā)表或已接收的學(xué)術(shù)論文
本文編號:3746261
【文章頁數(shù)】:140 頁
【學(xué)位級別】:博士
【文章目錄】:
摘要
abstract
主要符號對照表
第一章 緒論
1.1 課題的研究背景和意義
1.2 深度學(xué)習(xí)研究現(xiàn)狀及挑戰(zhàn)
1.3 本文的研究動機及內(nèi)容
1.4 本文的章節(jié)安排和創(chuàng)新點
第二章 深度漸進學(xué)習(xí)概述
2.1 研究背景
2.2 深度學(xué)習(xí)基本原理
2.2.1 卷積神經(jīng)網(wǎng)絡(luò)
2.2.2 循環(huán)神經(jīng)網(wǎng)絡(luò)
2.3 深度漸進學(xué)習(xí)
2.3.1 深度漸進學(xué)習(xí)的三大特征
2.3.2 深度漸進學(xué)習(xí)研究方法
2.3.3 深度漸進學(xué)習(xí)與現(xiàn)有學(xué)習(xí)方法的關(guān)系
2.4 本章小結(jié)
第三章 時序漸進模型與視頻行人重識別算法
3.1 引言
3.2 國內(nèi)外相關(guān)工作
3.3 研究動機
3.4 時序漸進模型
3.4.1 圖像特征表示
3.4.2 漸進特征融合網(wǎng)絡(luò)
3.4.3 損失函數(shù)與網(wǎng)絡(luò)訓(xùn)練
3.4.4 實現(xiàn)細(xì)節(jié)
3.5 實驗結(jié)果
3.5.1 時序漸進模型的精細(xì)性和伸縮性分析
3.5.2 時序漸進模型的數(shù)據(jù)敏感性分析
3.5.3 特征融合網(wǎng)絡(luò)的魯棒性分析
3.5.4 與現(xiàn)有方法的比較
3.5.5 收斂性分析
3.5.6 結(jié)果示例
3.6 本章小結(jié)
第四章 空間漸進學(xué)習(xí)與細(xì)粒度圖像識別算法
4.1 引言
4.2 相關(guān)工作
4.3 動機
4.4 空間漸進模型
4.4.1 循環(huán)視覺注意力網(wǎng)絡(luò)
4.4.2 空間位置漸進模型
4.4.3 空間尺度漸進模型
4.4.4 特征融合網(wǎng)絡(luò)
4.4.5 模型結(jié)構(gòu)和實現(xiàn)細(xì)節(jié)
4.5 實驗結(jié)果與評價
4.5.1 數(shù)據(jù)集與實驗設(shè)置
4.5.2 注意力網(wǎng)絡(luò)的有效性
4.5.3 特征融合網(wǎng)絡(luò)的有效性
4.5.4 與其他方法的比較
4.6 本章小結(jié)
第五章 交互漸進學(xué)習(xí)與行為預(yù)測算法
5.1 引言
5.2 相關(guān)工作
5.2.1 傳統(tǒng)方法
5.2.2 深度方法
5.3 研究動機
5.3.1 整體LRCN模型
5.3.2 個體LRCN模型
5.4 交互漸進模型
5.4.1 個體信息耦合網(wǎng)絡(luò)
5.4.2 整體-個體信息耦合模型
5.4.3 相互注意力模型
5.4.4 網(wǎng)絡(luò)訓(xùn)練
5.4.5 模型細(xì)節(jié)
5.5 實驗結(jié)果
5.5.1 數(shù)據(jù)集與實驗設(shè)置
5.5.2 在UTI上的實驗結(jié)果
5.5.3 在BIT上的實驗結(jié)果
5.5.4 漸進框架性質(zhì)研究
5.5.5 結(jié)果可視化
5.6 本章小結(jié)
第六章 模態(tài)漸進學(xué)習(xí)與視頻動作生成算法
6.1 引言
6.2 相關(guān)工作
6.2.1 人體運動分析
6.2.2 圖像生成
6.2.3 視頻生成
6.3 動機
6.4 模態(tài)漸進模型
6.4.1 對抗生成網(wǎng)絡(luò)
6.4.2 基于運動條件的關(guān)鍵點序列生成網(wǎng)絡(luò)
6.4.3 基于音頻條件的關(guān)鍵點序列生成網(wǎng)絡(luò)
6.4.4 外觀一致性運動生成網(wǎng)絡(luò)
6.4.5 實現(xiàn)細(xì)節(jié)
6.5 剛體運動生成
6.5.1 數(shù)據(jù)庫和測試標(biāo)準(zhǔn)
6.5.2 實驗結(jié)果
6.6 非剛體運動生成
6.6.1 數(shù)據(jù)集
6.6.2 結(jié)果比較
6.6.3 各部件的有效性分析
6.6.4 與其他基于關(guān)鍵點的模型的比較
6.7 群體交互運動生成
6.7.1 數(shù)據(jù)庫
6.7.2 實驗結(jié)果
6.8 本章小結(jié)
第七章 總結(jié)與展望
7.1 論文工作總結(jié)
7.2 未來研究展望
參考文獻
致謝
攻讀學(xué)位期間發(fā)表或已接收的學(xué)術(shù)論文
本文編號:3746261
本文鏈接:http://sikaile.net/kejilunwen/shengwushengchang/3746261.html
最近更新
教材專著