天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當前位置:主頁 > 科技論文 > 自動化論文 >

基于無錨點框的目標檢測及實例分割方法研究

發(fā)布時間:2021-03-07 13:14
  深度神經(jīng)網(wǎng)絡作為實現(xiàn)人工智能的重要方法之一,近年來已獲得廣泛應用。其中,卷積神經(jīng)網(wǎng)絡極大的促進了計算機視覺領(lǐng)域的發(fā)展。隨著研究的逐漸深入,計算機已經(jīng)可以實現(xiàn)對圖像從實例級到像素級的處理。目標檢測和實例分割作為最基本也是難度最大的兩個任務,因為受制于龐大的模型和復雜的算法一直無法在實際生產(chǎn)中發(fā)揮有效的作用。本課題基于無錨點框方法提出了更為高效和精確的目標檢測和實例分割方法,在大幅減少模型的超參數(shù)和訓練參數(shù)的同時,通過將檢測框編碼為矢量進行回歸,提出了矢量編碼損失,可以大幅提升在公開數(shù)據(jù)集上的準確度。此外,本課題提出了新的激活函數(shù)以幫助網(wǎng)絡更快速地收斂到全局最優(yōu)值,減少訓練時間。本課題在圖像分類、目標檢測、實例分割的多個公開數(shù)據(jù)集上進行了設計完備的實驗以驗證所提出算法的有效性,結(jié)果表明本課題的方法可以在不增加額外訓練參數(shù)的情況下,更快地得到更準確的檢測框和分割掩膜。首先,研究了現(xiàn)有激活函數(shù)的設計思想。由于激活函數(shù)是一個非線性函數(shù),因此它具有幫助神經(jīng)網(wǎng)絡擬合一個從輸入到輸出的非線性映射的能力。然而在實現(xiàn)非線性的同時還要考慮到激活函數(shù)的計算復雜度、梯度更新幅度、對收斂效果的影響等等。本課題綜合... 

【文章來源】:哈爾濱工業(yè)大學黑龍江省 211工程院校 985工程院校

【文章頁數(shù)】:90 頁

【學位級別】:碩士

【部分圖文】:

基于無錨點框的目標檢測及實例分割方法研究


DenseBox網(wǎng)絡框架

框架圖,框架,置信度


哈爾濱工業(yè)大學工學碩士學位論文4圖1-1DenseBox網(wǎng)絡框架Fig.1-1ThearchitectureofDenseBoxDenseBox[10]的基本架構(gòu)是一個端到端(end-to-end)的全卷積架構(gòu),可以直接回歸出圖像中所有人臉的位置和分類置信度信息而不帶有預設的錨點框。DenseBox[10]算法證實了全卷積網(wǎng)絡(FullyConvolutionalNetwork,F(xiàn)CN)[11]有著可以檢測出遮擋嚴重、不同尺度的目標的能力,而且不需要人為地給出回歸的先驗信息。如圖1-1所示,經(jīng)過全卷積網(wǎng)絡的輸出是兩個分支:一個分支產(chǎn)生多個預測框,另一個分支給出的是置信度的輸出。置信度實際上就是分類網(wǎng)絡得到的當前框是否是人臉的概率值。測試時,輸入還是一張圖片,輸出則是Channel值為5的一副特征圖。每個位置的特征圖對應一個1*1*5的向量,這五個通道分別對應置信分數(shù)、當前位置到包圍框的邊界的四個距離。最后,將輸出的結(jié)果做一個后處理,其采用的是非極大值抑制(NMS)算法[12]。此外,作者還引入了landmarklocalization來幫助提升性能。這種這種算法至今依舊是百度無人車和地平線機器人的核心算法之一。但是,由于這種人臉檢測算法只能檢測回歸框不能區(qū)分類別,所以在實際應用中還是有一定的限制存在。為了在回歸出包圍框的同時也得到類別和置信度,人們做了眾多的研究內(nèi)容。直到三年之后,在2018年,CornerNet[13]被提出之后,基于無錨點框的檢測算法才又回歸到了大眾的視野當中。圖1-2CornerNet網(wǎng)絡框架Fig.1-2ThearchitectureofCornerNet

框架圖,框架,物體,作者


CornerNet[13]的成功,無疑印證了無錨點框算法在檢測領(lǐng)域的確是非常有研究價值的,也引起了學術(shù)界對于這種檢測算法的關(guān)注;诮屈c可以檢測,那么對于不規(guī)則物體,它們的角點不易檢出,要怎么辦呢?ExtremeNet[16]是在CornerNet[13]的基礎上進行了深入思考設計出的新算法。作者認為,許多圖像上的物體不是沿著x或者y坐標軸對齊的,而且將它們在包圍框中進行檢測里面會包含很多背景像素,影響檢測精度,此外,包圍框的表達方式對于姿態(tài)和形狀提供的信息也較少。因此,在CornerNet[13]的基礎上,作者做了如下改進:圖1-3ExtremeNet網(wǎng)絡框架Fig.1-3ThearchitectureofExtremeNet將物體的檢測從兩個角點作為關(guān)鍵點改成了四個邊的中心點作為關(guān)鍵點。再加上中心的定位信息,可以更精確的找到目標的位置,因此有了更好的效果。此外,作者還嘗試了把中心點換成GroundTruth的位置信息,發(fā)現(xiàn)效果的提升

【參考文獻】:
期刊論文
[1]卷積神經(jīng)網(wǎng)絡研究綜述[J]. 李彥冬,郝宗波,雷航.  計算機應用. 2016(09)
[2]深度卷積神經(jīng)網(wǎng)絡在計算機視覺中的應用研究綜述[J]. 盧宏濤,張秦川.  數(shù)據(jù)采集與處理. 2016(01)
[3]一種用于道路避障的雙目視覺圖像分割方法[J]. 劉正東,高鵬,楊靜宇.  計算機應用研究. 2005(04)
[4]圖像分割的閾值法綜述[J]. 韓思奇,王蕾.  系統(tǒng)工程與電子技術(shù). 2002(06)



本文編號:3069162

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/zidonghuakongzhilunwen/3069162.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶0268f***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com