天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當前位置:主頁 > 科技論文 > 自動化論文 >

基于注意力機制的深度學(xué)習(xí)目標檢測算法的研究

發(fā)布時間:2021-02-27 07:41
  目標檢測探討如何精確的定位并分類物體,它是計算機視覺中的一個重要研究范疇。目標檢測作為基礎(chǔ)性的識別研究,對后續(xù)的行人檢測、人臉識別、自動駕駛等研究都有著至關(guān)重要的影響。雖然關(guān)于目標檢測的研究由來已久,然而依然存在著許多關(guān)鍵問題亟待解決,例如小目標的檢測精度普遍不高、重疊物體檢測困難、一階段目標檢測算法精度較差、實時目標檢測精度與速度的平衡等。本篇論文提出了基于注意力機制的深度學(xué)習(xí)算法來進行目標檢測,注意力機制對提取的特征進行了有針對性的加權(quán),讓目標檢測更加具有目的性,輸出的特征更具有顯著性。設(shè)計并訓(xùn)練了一個新穎的三分支目標檢測模型——TBANet,包含空間網(wǎng)絡(luò)、語義網(wǎng)絡(luò)和上下文網(wǎng)絡(luò),達到空間細節(jié)信息、多級語義信息、上下文信息的高質(zhì)量的獲取,從而實現(xiàn)了精確的目標檢測。本文針對注意力機制進行深入研究。首先介紹了注意力機制、多分支網(wǎng)絡(luò)和網(wǎng)絡(luò)主干網(wǎng)的研究現(xiàn)狀。然后對卷積神經(jīng)網(wǎng)絡(luò)、目標檢測算法、注意力機制的理論進行敘述。之后說明了各種注意力模塊和空間金字塔池化模塊的設(shè)計,并進行了對比實驗,通過實驗說明了所設(shè)計模塊的作用及有效性。所提出的算法在PASCAL VOC 2007測試數(shù)據(jù)集上獲得了83.... 

【文章來源】:內(nèi)蒙古大學(xué)內(nèi)蒙古自治區(qū) 211工程院校

【文章頁數(shù)】:58 頁

【學(xué)位級別】:碩士

【部分圖文】:

基于注意力機制的深度學(xué)習(xí)目標檢測算法的研究


卷積操作示例圖

計算圖,示例,卷積,全連接


基于注意力機制的深度學(xué)習(xí)目標檢測算法的研究8圖2.1卷積操作示例圖Figure2.1Samplediagramofconvolutionoperations池化層(PoolingLayer):卷積神經(jīng)網(wǎng)絡(luò)在某個位置學(xué)習(xí)到圖像的信息后,在別處都可以識別相應(yīng)的信息。但是單純的卷積操作堆疊,參數(shù)量龐大,占用大量資源。為了減少參數(shù)及防止出現(xiàn)過擬合(over-fitting),采用池化操作來對不同位置的特征進行聚合統(tǒng)計,計算圖像一個區(qū)域上的某個特定特征的平均值(或最大值)。使用頻率最多的池化操作有最大池化(maxpooling)和平均池化(meanpooling)。以最大池化為例,其過程如圖2.2所示。圖2.2最大池化操作示例圖Figure2.2Samplediagramofmaxpoolingoperations全連接層(FullyConnectedLayer):在卷積神經(jīng)網(wǎng)絡(luò)中,全連接層位于網(wǎng)絡(luò)的最后幾層,起著分類的作用,它的每個神經(jīng)元與其前一層的所有神經(jīng)元進行全連接,其操作與傳統(tǒng)神經(jīng)網(wǎng)絡(luò)相同。由于全連接層的參數(shù)量大,現(xiàn)在有些研究用平均池化(meanpooling)或者用1×1卷積代替它。

網(wǎng)絡(luò)結(jié)構(gòu)圖,特征圖,卷積,思想


基于注意力機制的深度學(xué)習(xí)目標檢測算法的研究10以原圖中這個區(qū)域的中心點來作為錨點(anchors)的中心點。并畫出每一個錨點框,這樣就產(chǎn)生了候選區(qū)域(錨點相當于畫出候選區(qū)域的模板)。在每個滑動窗口位置,同時預(yù)測多個候選區(qū)域,其中每個位置的最大數(shù)目表示為k。候選區(qū)域被輸入到一個回歸層(reglayer)和一個分類層(clslayer),回歸層用來給邊界框定位,分類層用來分類是不是目標。RPN網(wǎng)絡(luò)結(jié)構(gòu)示意圖如圖2.4所示。圖2.4RPN網(wǎng)絡(luò)結(jié)構(gòu)圖Figure2.4RPNnetworkstructure2.2.2SSD目標檢測算法針對FasterR-CNN檢測速度達不到實時和YOLO[41]精度不高的不足之處,WeiLiu等人提出了新的一階段目標檢測算法SSD,該算法融入了錨點的思想,提出了默認框(defaultboxes)方法,還借鑒了FasterR-CNN用卷積層做預(yù)測的思想(即RPN網(wǎng)絡(luò)的思想)。SSD算法采用了類似傳統(tǒng)圖像金字塔的思想,在網(wǎng)絡(luò)的不同位置均勻的對特征圖進行抽樣,獲得不同長寬比以及尺度的樣本,然后進行分類和回歸。低層特征圖具有豐富細節(jié)信息,而高層則有更多的高級語義信息。因此,靠前的特征圖利于檢測小物體,靠后的則利于大物體的檢測。SSD的主干網(wǎng)是16層的VGG,把原主干網(wǎng)的最后兩個全連接層改為了卷積層,同時在后面增加4個卷積層,利于后續(xù)提取多尺度的特征圖樣本。SSD的網(wǎng)絡(luò)結(jié)構(gòu)如圖2.5所示。圖2.5SSD網(wǎng)絡(luò)結(jié)構(gòu)圖Figure2.5SSDnetworkstructure

【參考文獻】:
期刊論文
[1]基于視覺的目標檢測與跟蹤綜述[J]. 尹宏鵬,陳波,柴毅,劉兆棟.  自動化學(xué)報. 2016(10)
[2]人類視覺注意機制在目標檢測中的應(yīng)用[J]. 桑農(nóng),李正龍,張?zhí)煨?  紅外與激光工程. 2004(01)



本文編號:3053913

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/zidonghuakongzhilunwen/3053913.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶543ea***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com