天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

基于多尺度語義信息融合的目標檢測算法研究

發(fā)布時間:2020-12-24 21:39
  圖像目標檢測是計算機視覺領域內(nèi)的熱點課題,它的主要任務是從輸入圖像中定位感興趣的目標,然后準確地判斷每個感興趣目標的類別。近年來,隨著深度學習技術的火熱發(fā)展,目標檢測技術已經(jīng)廣泛應用于日常生活安全、機器人導航、智能視頻監(jiān)控、交通場景檢測及航天航空等領域。特別是卷積神經(jīng)網(wǎng)絡的成功應用,使目標檢測的性能取得大幅度的提升,并涌現(xiàn)出大量不同的檢測算法和網(wǎng)絡模型,從而目標檢測技術得到快速的發(fā)展。本文對基于深度學習的目標檢測算法進行充分調研的基礎下,分析了經(jīng)典的SSD(Single Shot MultiBox Detector)檢測方法存在的不足并做出了改進,以下是本文的主要工作:(1)本文首先簡要的論述了目標檢測的研究背景、意義及其難點,接著對基于深度學習目標檢測算法的兩大類進行綜述,即基于候選區(qū)域算法和基于回歸算法。對于第一類算法,先介紹了基于區(qū)域的卷積神經(jīng)網(wǎng)絡(Region with Convolutional Neural Network,R-CNN)系列算法的發(fā)展史,然后從四個維度綜述了研究者在RCNN系列算法基礎上所做的改進研究:對特征提取網(wǎng)絡的改進研究、對感興趣區(qū)域池化層的改進研究、... 

【文章來源】:江西理工大學江西省

【文章頁數(shù)】:72 頁

【學位級別】:碩士

【部分圖文】:

基于多尺度語義信息融合的目標檢測算法研究


HyperNet的結構[45]

網(wǎng)絡結構圖,網(wǎng)絡結構,特征圖,尺度


第二章基于深度學習的目標檢測研究綜述15圖2.5HyperNet的結構[45]2017年Tsung-YiLin等人[30]提出了特征金字塔網(wǎng)絡(FeaturePyramidNetwork,F(xiàn)PN),它使用了ResNet101作為特征提取網(wǎng)絡,在此基礎上構造了一種自頂向下帶有橫向連接的層次結構,來產(chǎn)生各個尺度的高層語義特征,并對各個尺度的特征進行單獨的預測。首先將輸入的圖像進行深度卷積操作,然后使用上采樣方式擴張網(wǎng)絡頂端的特征圖形成自頂向下的結構,再通過橫向連接將上采樣的結果和對應相同尺寸的卷積網(wǎng)絡特征圖進行融合,融合后的特征先進行3×3的卷積操作,消除上采樣的混疊效應,再進行單獨的預測。FPN將高層特征圖與底層特征圖相融合,使得融合后的特征圖不僅具有較強的語義信息,還具有較豐富的幾何信息,有利于提高小目標的檢測精度。2018年Bharat等人[46]提出了圖像金字塔的尺度歸一化方法(ScaleNormalizationforImagePyramids,SNIP)用于提高小目標檢測性能。如圖2.6所示,他們借鑒了多尺度訓練思想,使用圖像金字塔網(wǎng)絡將圖像生成三種不同分辨率的輸入圖像,高分辨率圖像只用于小目標檢測,中等分辨率圖像只進行中等目標檢測,低分辨率圖像只進行大目標檢測。具體實現(xiàn)是在訓練時,預先限定了三個尺度范圍,分別對應大、中、小型目標的尺度范圍,然后只對尺度在指定范圍內(nèi)的目標候選區(qū)域進行反向傳播,如在高分辨率圖像中,只對在小目標尺度范圍內(nèi)的目標候選框進行回傳梯度,忽略其他范圍的目標候選框。在此基礎上,Bharat等人對輸入圖像采樣策略進行了優(yōu)化,提出了SNIPER方法[47],有效減少了圖像金字塔的計算開銷。圖2.6SNIP網(wǎng)絡結構[46]

形變,卷積和


分別獲取對象的全局信息和上下文信息,然后有效的結合候選區(qū)域的局部信息、全局信息和上下文信息進行檢測。Zhu等人[49]對CoupleNet算法進一步改進,提出了AttentionCoupleNet算法,該算法設計了一個級聯(lián)的注意力結構用以感知圖像的全局場景,從而生成不知類別的注意力圖,再將注意力圖編碼進網(wǎng)絡中以獲取目標感知特征,并使用數(shù)據(jù)集的實例分割標注輔助訓練,使得檢測器的性能有顯著提升。2017年Dai等人[50,51]提出了形變卷積網(wǎng)絡(DeformationConvolutionNetwork,DCN),設計了可形變卷積和可形變感興趣區(qū)域池化層(如圖2.7所示)。這兩種結構的核心思想都是先通過標準卷積給每個采樣點學習到一個位置偏移量,然后結合位置偏移量再進行卷積或者池化操作?尚巫兙矸e的感受野不再是一成不變的正方形,而是和物體的實際形狀相匹配,旨在解決檢測任務中物體形變問題?尚巫兏信d趣區(qū)域池化層為每個劃分小塊添加一個位置偏移量,使網(wǎng)絡學習了更多的空間位置信息,增強了網(wǎng)絡對物體的定位能力。圖2.7可形變卷積和可形變ROIPooling[50,51]


本文編號:2936353

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/shoufeilunwen/xixikjs/2936353.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權申明:資料由用戶e8b90***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com