基于特征光流的視頻中物體檢測
發(fā)布時間:2021-10-11 12:06
物體檢測是通過算法從拍攝的圖像或視頻中檢測出物體位置和類別。作為計算機視覺領(lǐng)域最基礎(chǔ)的問題之一,物體檢測具有重要的研究意義和廣泛的實際應(yīng)用價值。針對視頻的物體檢測要求實時精確地輸出視頻中每一幀內(nèi)物體位置和類別,F(xiàn)有的視頻檢測算法需要手工設(shè)計規(guī)則,在檢測速度和檢測準確率方面面臨著巨大的挑戰(zhàn)。針對上述問題,論文提出了一種基于特征光流的視頻物體檢測框架,利用特征光流刻畫鄰近幀在特征層面發(fā)生的相對運動,并通過端到端的訓(xùn)練自動抽取所需特征層面時域信息,從而實現(xiàn)了快速、準確的視頻中物體檢測。論文的主要研究工作和貢獻如下:·提出了一種基于特征傳播的高速視頻物體檢測算法。算法在稀疏關(guān)鍵幀上進行耗時的特征提取,并依據(jù)特征光流將關(guān)鍵幀的特征傳播到其他幀。傳播后特征圖直接經(jīng)由檢測子網(wǎng)絡(luò)輸出檢測結(jié)果。對比逐幀圖像物體檢測,所提出算法可以保證檢測準確率并有效提升檢測速度。·提出了一種基于特征融合的高準確率視頻物體檢測算法。算法沿物體的運動軌跡融合鄰近幀的特征圖以增強當(dāng)前幀特征表示。融合后特征圖經(jīng)由檢測子網(wǎng)絡(luò)輸出檢測結(jié)果。所提出方法避免手工設(shè)計多幀融合規(guī)則并有效地提升了檢測準確率!ぬ岢隽艘环N基于遞歸特征融合與自...
【文章來源】:中國科學(xué)技術(shù)大學(xué)安徽省 211工程院校 985工程院校
【文章頁數(shù)】:127 頁
【學(xué)位級別】:博士
【文章目錄】:
摘要
ABSTRACT
第1章 緒論
1.1 研究背景及意義
1.2 視頻中物體檢測的評價指標
1.3 圖像中物體檢測的研究現(xiàn)狀
1.3.1 單階段圖像物體檢測算法
1.3.2 雙階段圖像物體檢測算法
1.3.3 檢測速度與檢測準確率的均衡
1.4 視頻中物體檢測的研究現(xiàn)狀
1.4.1 將圖像中物體檢測應(yīng)用于視頻領(lǐng)域
1.4.2 視頻中物體檢測算法現(xiàn)狀
1.5 建模視頻內(nèi)時域上下文信息
1.5.1 基于光流的運動估計
1.5.2 視頻物體跟蹤
1.5.3 視頻特征跟蹤
1.5.4 基于注意力機制的特征融合
1.6 論文研究內(nèi)容和組織結(jié)構(gòu)
第2章 基于特征傳播的高速視頻中物體檢測
2.1 提升視頻物體檢測速度
2.1.1 研究目標
2.1.2 核心思想和技術(shù)難點
2.2 基于特征傳播的視頻物體檢測
2.2.1 特征光流與特征傳播
2.2.2 測試算法
2.2.3 訓(xùn)練策略
2.2.4 算法復(fù)雜度分析
2.3 網(wǎng)絡(luò)結(jié)構(gòu)
2.3.1 特征光流估計網(wǎng)絡(luò)
2.3.2 特征提取子網(wǎng)絡(luò)
2.3.3 物體檢測子網(wǎng)絡(luò)
2.3.4 語義分割子網(wǎng)絡(luò)
2.4 實驗結(jié)果
2.4.1 實驗配置
2.4.2 驗證基于特征傳播的視頻物體檢測/語義分割
2.4.3 速度與準確率均衡
2.4.4 特征提取子網(wǎng)絡(luò)與識別子網(wǎng)絡(luò)的劃分
2.4.5 視頻物體檢測和語義分割結(jié)果可視化
2.5 小結(jié)與討論
第3章 基于特征融合的高準確率視頻中物體檢測
3.1 提升視頻物體檢測準確率
3.1.1 研究目標
3.1.2 核心思想和技術(shù)難點
3.2 基于特征融合的視頻物體檢測
3.2.1 模型設(shè)計
3.2.2 測試算法
3.2.3 訓(xùn)練策略
3.2.4 算法復(fù)雜度分析
3.3 網(wǎng)絡(luò)結(jié)構(gòu)
3.3.1 特征光流估計網(wǎng)絡(luò)
3.3.2 特征提取子網(wǎng)絡(luò)
3.3.3 特征融合中特征變換子網(wǎng)絡(luò)
3.3.4 物體檢測子網(wǎng)絡(luò)
3.4 實驗結(jié)果
3.4.1 實驗配置
3.4.2 慢速、中速和快速運動物體
3.4.3 驗證基于特征融合的視頻物體檢測
3.4.4 對比復(fù)合相鄰幀特征光流
3.4.5 訓(xùn)練和測試中特征融合的鄰近幀數(shù)量
3.4.6 結(jié)合后處理方法
3.5 特征融合中自適應(yīng)權(quán)重的實證性分析
3.5.1 Transformer注意力模塊
3.5.2 帶開關(guān)的Transformer自適應(yīng)權(quán)重
3.5.3 實驗配置
3.5.4 自適應(yīng)權(quán)重分量對性能的影響
3.5.5 應(yīng)用于視頻中物體檢測
3.6 小結(jié)與討論
第4章 基于遞歸特征融合與自適應(yīng)特征提取的高速高準確率視頻中物體檢測
4.1 從圖像到視頻中物體檢測
4.1.1 回顧基于特征傳播的視頻物體檢測
4.1.2 回顧基于特征融合的視頻物體檢測
4.2 高速高準確率的視頻中物體檢測
4.2.1 研究目標
4.2.2 核心思想和技術(shù)難點
4.3 基于遞歸特征融合與自適應(yīng)特征提取的視頻物體檢測
4.3.1 (c1)稀疏關(guān)鍵幀的遞歸特征融合
4.3.2 (c2)非關(guān)鍵幀的局部特征提取
4.3.3 (c3)時域自適應(yīng)的關(guān)鍵幀策略
4.3.4 統(tǒng)一視角下基于特征光流的視頻物體檢測
4.3.5 測試算法
4.3.6 訓(xùn)練策略
4.4 實驗結(jié)果
4.4.1 實驗配置
4.4.2 統(tǒng)一視角下評測基于特征光流的視頻物體檢測
4.4.3 分析基于遞歸特征融合與自適應(yīng)特征提取的視頻物體檢測
4.4.4 對比最先進的視頻物體檢測方法
4.5 拓展到資源受限的移動設(shè)備
4.5.1 網(wǎng)絡(luò)結(jié)構(gòu)
4.5.2 移動設(shè)備上的高速高準確率視頻物體檢測
4.5.3 對比最先進的輕量級物體檢測算法
4.6 小結(jié)與討論
第5章 總結(jié)與展望
參考文獻
致謝
在讀期間發(fā)表的學(xué)術(shù)論文與取得的研究成果
本文編號:3430477
【文章來源】:中國科學(xué)技術(shù)大學(xué)安徽省 211工程院校 985工程院校
【文章頁數(shù)】:127 頁
【學(xué)位級別】:博士
【文章目錄】:
摘要
ABSTRACT
第1章 緒論
1.1 研究背景及意義
1.2 視頻中物體檢測的評價指標
1.3 圖像中物體檢測的研究現(xiàn)狀
1.3.1 單階段圖像物體檢測算法
1.3.2 雙階段圖像物體檢測算法
1.3.3 檢測速度與檢測準確率的均衡
1.4 視頻中物體檢測的研究現(xiàn)狀
1.4.1 將圖像中物體檢測應(yīng)用于視頻領(lǐng)域
1.4.2 視頻中物體檢測算法現(xiàn)狀
1.5 建模視頻內(nèi)時域上下文信息
1.5.1 基于光流的運動估計
1.5.2 視頻物體跟蹤
1.5.3 視頻特征跟蹤
1.5.4 基于注意力機制的特征融合
1.6 論文研究內(nèi)容和組織結(jié)構(gòu)
第2章 基于特征傳播的高速視頻中物體檢測
2.1 提升視頻物體檢測速度
2.1.1 研究目標
2.1.2 核心思想和技術(shù)難點
2.2 基于特征傳播的視頻物體檢測
2.2.1 特征光流與特征傳播
2.2.2 測試算法
2.2.3 訓(xùn)練策略
2.2.4 算法復(fù)雜度分析
2.3 網(wǎng)絡(luò)結(jié)構(gòu)
2.3.1 特征光流估計網(wǎng)絡(luò)
2.3.2 特征提取子網(wǎng)絡(luò)
2.3.3 物體檢測子網(wǎng)絡(luò)
2.3.4 語義分割子網(wǎng)絡(luò)
2.4 實驗結(jié)果
2.4.1 實驗配置
2.4.2 驗證基于特征傳播的視頻物體檢測/語義分割
2.4.3 速度與準確率均衡
2.4.4 特征提取子網(wǎng)絡(luò)與識別子網(wǎng)絡(luò)的劃分
2.4.5 視頻物體檢測和語義分割結(jié)果可視化
2.5 小結(jié)與討論
第3章 基于特征融合的高準確率視頻中物體檢測
3.1 提升視頻物體檢測準確率
3.1.1 研究目標
3.1.2 核心思想和技術(shù)難點
3.2 基于特征融合的視頻物體檢測
3.2.1 模型設(shè)計
3.2.2 測試算法
3.2.3 訓(xùn)練策略
3.2.4 算法復(fù)雜度分析
3.3 網(wǎng)絡(luò)結(jié)構(gòu)
3.3.1 特征光流估計網(wǎng)絡(luò)
3.3.2 特征提取子網(wǎng)絡(luò)
3.3.3 特征融合中特征變換子網(wǎng)絡(luò)
3.3.4 物體檢測子網(wǎng)絡(luò)
3.4 實驗結(jié)果
3.4.1 實驗配置
3.4.2 慢速、中速和快速運動物體
3.4.3 驗證基于特征融合的視頻物體檢測
3.4.4 對比復(fù)合相鄰幀特征光流
3.4.5 訓(xùn)練和測試中特征融合的鄰近幀數(shù)量
3.4.6 結(jié)合后處理方法
3.5 特征融合中自適應(yīng)權(quán)重的實證性分析
3.5.1 Transformer注意力模塊
3.5.2 帶開關(guān)的Transformer自適應(yīng)權(quán)重
3.5.3 實驗配置
3.5.4 自適應(yīng)權(quán)重分量對性能的影響
3.5.5 應(yīng)用于視頻中物體檢測
3.6 小結(jié)與討論
第4章 基于遞歸特征融合與自適應(yīng)特征提取的高速高準確率視頻中物體檢測
4.1 從圖像到視頻中物體檢測
4.1.1 回顧基于特征傳播的視頻物體檢測
4.1.2 回顧基于特征融合的視頻物體檢測
4.2 高速高準確率的視頻中物體檢測
4.2.1 研究目標
4.2.2 核心思想和技術(shù)難點
4.3 基于遞歸特征融合與自適應(yīng)特征提取的視頻物體檢測
4.3.1 (c1)稀疏關(guān)鍵幀的遞歸特征融合
4.3.2 (c2)非關(guān)鍵幀的局部特征提取
4.3.3 (c3)時域自適應(yīng)的關(guān)鍵幀策略
4.3.4 統(tǒng)一視角下基于特征光流的視頻物體檢測
4.3.5 測試算法
4.3.6 訓(xùn)練策略
4.4 實驗結(jié)果
4.4.1 實驗配置
4.4.2 統(tǒng)一視角下評測基于特征光流的視頻物體檢測
4.4.3 分析基于遞歸特征融合與自適應(yīng)特征提取的視頻物體檢測
4.4.4 對比最先進的視頻物體檢測方法
4.5 拓展到資源受限的移動設(shè)備
4.5.1 網(wǎng)絡(luò)結(jié)構(gòu)
4.5.2 移動設(shè)備上的高速高準確率視頻物體檢測
4.5.3 對比最先進的輕量級物體檢測算法
4.6 小結(jié)與討論
第5章 總結(jié)與展望
參考文獻
致謝
在讀期間發(fā)表的學(xué)術(shù)論文與取得的研究成果
本文編號:3430477
本文鏈接:http://sikaile.net/shoufeilunwen/xxkjbs/3430477.html
最近更新
教材專著