復雜場景下的小目標檢測方法研究
發(fā)布時間:2022-02-21 15:58
目標檢測是計算機視覺領域的一個重要研究方向,也是其它復雜視覺任務的基礎。最近幾年,隨著深度學習的快速發(fā)展,目標檢測也取得了巨大的突破。目前,目標檢測已經(jīng)廣泛應用于多個領域,包括自動駕駛、智能監(jiān)控和醫(yī)療圖像分析等。然而,現(xiàn)有的方法仍然難以很好地處理小目標,尤其是復雜場景下的小目標。在復雜的真實應用場景中,目標的尺寸通常是較小的,并且會伴隨光照劇烈變化、目標遮擋和目標尺度變化等情況。因此,復雜場景下的小目標檢測是極具挑戰(zhàn)性的。本文圍繞復雜場景下的小目標檢測展開了一系列創(chuàng)新研究,在現(xiàn)有目標檢測方法的基礎上,提出了多種能夠提升小目標檢測性能的新方法。本文的主要工作和創(chuàng)新點如下:1.針對小目標特征難以提取問題,本文提出一種基于深度卷積神經(jīng)網(wǎng)絡的雙向特征融合方法。該方法通過充分融合不同層的特征來增強用于目標檢測的特征圖,從而提高小目標的檢測性能。在得到不同尺度的特征圖后,該方法同時從淺層向深層傳遞細節(jié)特征和深層向淺層傳遞語義特征,并將這些特征進行融合,最后使得新生成的特征圖既包含有細節(jié)特征又包含有豐富的語義特征。實驗結果表明,所提方法通過將不同層的特征信息進行融合,提升了小目標的檢測性能。2.針對...
【文章來源】:中國科學院大學(中國科學院計算機科學與技術學院)北京市
【文章頁數(shù)】:130 頁
【學位級別】:博士
【文章目錄】:
摘要
abstract
符號列表
第1章 引言
1.1 研究背景與意義
1.2 復雜場景下小目標檢測面臨的挑戰(zhàn)
1.3 本文的研究內(nèi)容與貢獻
1.3.1 本文的研究內(nèi)容
1.3.2 本文的主要貢獻
1.4 本文的組織結構
第2章 研究現(xiàn)狀綜述
2.1 目標檢測算法
2.1.1 傳統(tǒng)的目標檢測算法
2.1.2 基于深度學習的目標檢測算法
2.2 針對小目標的檢測算法
2.2.1 特征融合
2.2.2 上下文利用
2.2.3 對抗學習
2.3 目標檢測數(shù)據(jù)集
2.3.1 PASCAL VOC
2.3.2 MS COCO
2.3.3 FOD
2.3.4 評價標準
2.4 本章小結
第3章 基于雙向特征融合的小目標檢測方法
3.1 引言
3.2 相關工作
3.3 雙向特征融合方法
3.3.1 特征金字塔生成
3.3.2 前向特征傳遞
3.3.3 反向特征傳遞
3.3.4 新特征金字塔生成
3.4 基于雙向特征融合的改進算法
3.4.1 模型結構
3.4.2 模型訓練
3.5 實驗結果與分析
3.5.1 實驗設置
3.5.2 在VOC2007上的性能評估
3.5.3 在PASCAL VOC2012 上的性能評估
3.5.4 在FOD上的檢測性能
3.5.5 前向和反向特征傳遞的影響
3.5.6 特征圖融合方式的討論
3.6 本章小結
第4章 基于上下文學習的小目標檢測方法
4.1 引言
4.2 相關工作
4.3 上下文學習網(wǎng)絡
4.3.1 局部上下文學習
4.3.2 全局上下文學習
4.3.3 特征增強
4.4 基于上下文學習的改進算法
4.5 實驗結果與分析
4.5.1 實驗設置
4.5.2 在PASCAL VOC上的性能評估
4.5.3 在FOD上的性能評估
4.5.4 上下文學習網(wǎng)絡中各模塊的作用
4.5.5 不同骨干網(wǎng)絡的影響
4.5.6 上下文和卷積特征圖融合方式的影響
4.6 本章小結
第5章 基于中心和寬高預測的小目標檢測方法
5.1 引言
5.2 相關工作
5.2.1 基于錨框機制的目標檢測
5.2.2 基于關鍵點的目標檢測
5.3 基于中心和寬高預測的小目標檢測方法
5.3.1 算法整體結構
5.3.2 骨干網(wǎng)絡
5.3.3 中心注意力的寬高回歸
5.3.4 級聯(lián)的中心預測
5.3.5 訓練和推理
5.4 實驗結果與分析
5.4.1 實驗設置
5.4.2 在FOD上的性能評估
5.4.3 在MS COCO上的性能評估
5.4.4 不同骨干網(wǎng)絡和測試方式的影響
5.4.5 級聯(lián)中心預測的作用
5.4.6 中心注意力的寬高回歸的作用
5.4.7 級聯(lián)數(shù)量的影響
5.4.8 不同損失權重的影響
5.5 本章小結
第6章 小目標檢測模型應用研究
6.1 實驗設置
6.2 在FOD上的性能評估
6.3 不同模塊對檢測結果的影響
6.4 本章小結
第7章 總結與展望
參考文獻
致謝
作者簡歷及攻讀學位期間發(fā)表的學術論文與研究成果
本文編號:3637589
【文章來源】:中國科學院大學(中國科學院計算機科學與技術學院)北京市
【文章頁數(shù)】:130 頁
【學位級別】:博士
【文章目錄】:
摘要
abstract
符號列表
第1章 引言
1.1 研究背景與意義
1.2 復雜場景下小目標檢測面臨的挑戰(zhàn)
1.3 本文的研究內(nèi)容與貢獻
1.3.1 本文的研究內(nèi)容
1.3.2 本文的主要貢獻
1.4 本文的組織結構
第2章 研究現(xiàn)狀綜述
2.1 目標檢測算法
2.1.1 傳統(tǒng)的目標檢測算法
2.1.2 基于深度學習的目標檢測算法
2.2 針對小目標的檢測算法
2.2.1 特征融合
2.2.2 上下文利用
2.2.3 對抗學習
2.3 目標檢測數(shù)據(jù)集
2.3.1 PASCAL VOC
2.3.2 MS COCO
2.3.3 FOD
2.3.4 評價標準
2.4 本章小結
第3章 基于雙向特征融合的小目標檢測方法
3.1 引言
3.2 相關工作
3.3 雙向特征融合方法
3.3.1 特征金字塔生成
3.3.2 前向特征傳遞
3.3.3 反向特征傳遞
3.3.4 新特征金字塔生成
3.4 基于雙向特征融合的改進算法
3.4.1 模型結構
3.4.2 模型訓練
3.5 實驗結果與分析
3.5.1 實驗設置
3.5.2 在VOC2007上的性能評估
3.5.3 在PASCAL VOC2012 上的性能評估
3.5.4 在FOD上的檢測性能
3.5.5 前向和反向特征傳遞的影響
3.5.6 特征圖融合方式的討論
3.6 本章小結
第4章 基于上下文學習的小目標檢測方法
4.1 引言
4.2 相關工作
4.3 上下文學習網(wǎng)絡
4.3.1 局部上下文學習
4.3.2 全局上下文學習
4.3.3 特征增強
4.4 基于上下文學習的改進算法
4.5 實驗結果與分析
4.5.1 實驗設置
4.5.2 在PASCAL VOC上的性能評估
4.5.3 在FOD上的性能評估
4.5.4 上下文學習網(wǎng)絡中各模塊的作用
4.5.5 不同骨干網(wǎng)絡的影響
4.5.6 上下文和卷積特征圖融合方式的影響
4.6 本章小結
第5章 基于中心和寬高預測的小目標檢測方法
5.1 引言
5.2 相關工作
5.2.1 基于錨框機制的目標檢測
5.2.2 基于關鍵點的目標檢測
5.3 基于中心和寬高預測的小目標檢測方法
5.3.1 算法整體結構
5.3.2 骨干網(wǎng)絡
5.3.3 中心注意力的寬高回歸
5.3.4 級聯(lián)的中心預測
5.3.5 訓練和推理
5.4 實驗結果與分析
5.4.1 實驗設置
5.4.2 在FOD上的性能評估
5.4.3 在MS COCO上的性能評估
5.4.4 不同骨干網(wǎng)絡和測試方式的影響
5.4.5 級聯(lián)中心預測的作用
5.4.6 中心注意力的寬高回歸的作用
5.4.7 級聯(lián)數(shù)量的影響
5.4.8 不同損失權重的影響
5.5 本章小結
第6章 小目標檢測模型應用研究
6.1 實驗設置
6.2 在FOD上的性能評估
6.3 不同模塊對檢測結果的影響
6.4 本章小結
第7章 總結與展望
參考文獻
致謝
作者簡歷及攻讀學位期間發(fā)表的學術論文與研究成果
本文編號:3637589
本文鏈接:http://sikaile.net/shoufeilunwen/xxkjbs/3637589.html
最近更新
教材專著