天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當前位置:主頁 > 科技論文 > 自動化論文 >

基于全卷積神經(jīng)網(wǎng)絡(luò)的航空圖像目標檢測算法研究

發(fā)布時間:2021-01-15 03:36
  基于大規(guī)模數(shù)據(jù)的高分辨率影像目標檢測算法研究,對于航空影像處理領(lǐng)域而言,是一個非常重要的研究方向。航空影像目標檢測算法現(xiàn)在分為兩種:傳統(tǒng)算法和深度學習算法。傳統(tǒng)的目標檢測算法難以適用于大規(guī)模數(shù)據(jù),該類算法通過人工設(shè)計的算子進行特征提取,其特征表達能力有限同時計算冗余耗時。人工設(shè)計的算子極其依賴于專業(yè)領(lǐng)域知識,而且很難從大規(guī)模數(shù)據(jù)中訓練出一個有效的特征提取器,不能充分挖掘海量數(shù)據(jù)之間的聯(lián)系。深度學習算法擁有高效的特征提取能力、強大的特征表達能力和學習優(yōu)化能力,可以為圖像中的目標特征提取算法研究提供有力的支撐。因此,針對航空圖像檢測問題,深度學習算法無論是在速度還是在精度上都有傳統(tǒng)算法不可比擬的優(yōu)勢。本文將基于全卷積神經(jīng)網(wǎng)絡(luò)目標檢測算法,對航空檢測場景開展相關(guān)研究,主要研究內(nèi)容如下。本文針對航空檢測場景普遍存在的尺度不平衡問題提出啟發(fā)式訓練策略,該策略根據(jù)物體的標注先驗信息生成新的訓練樣本,改變物體尺度的總體分布,從數(shù)據(jù)源頭緩解了尺度不平衡問題。本文提出新的錨框聚類算法,該算法綜合考慮樣本與類中心的重疊程度和長寬比例一致程度。該算法和均勻設(shè)置錨框尺度相比,根據(jù)其結(jié)果所設(shè)置的錨框尺度可以獲得... 

【文章來源】:哈爾濱工業(yè)大學黑龍江省 211工程院校 985工程院校

【文章頁數(shù)】:63 頁

【學位級別】:碩士

【部分圖文】:

基于全卷積神經(jīng)網(wǎng)絡(luò)的航空圖像目標檢測算法研究


基于滑動框和傳統(tǒng)機器學習的目標識別系統(tǒng)框圖

架構(gòu)圖,檢測器,目標檢測,場景


哈爾濱工業(yè)大學工程碩士學位論文為兩個主要部分:(1)HOG特征提。簭幕瑒涌蛑刑崛〕龅淖訄D中提取HOG特征;(2)支持向量機:以子圖的HOG特征為輸入,判斷該子圖中是否有待檢物體。比如Cheng[17]和Grabner[18]使用傳統(tǒng)滑窗方法,然后提取HOG特征,最后進行航空圖像目標檢測。相對于模板匹配算法和圖像分析方法而言,傳統(tǒng)機器學習檢測算法具有更高的精確度、更加魯棒以及較強的泛化能力。然而,傳統(tǒng)機器學習方法所采用的滑窗方法會導致嚴重的冗余計算,而且手工設(shè)計算子提取特征,無法表征圖像的更高級別語義信息。例如田徑場地和足球場地具有相似的結(jié)構(gòu)紋理,但是它們完全對應(yīng)不同的抽象語義信息。1.2.2面向自然場景的目標檢測算法研究現(xiàn)狀目標檢測領(lǐng)域吸引著越來越多的研究人員,主要是因為其廣泛的應(yīng)用和巨大的技術(shù)突破。自然場景目標檢測算法的迅猛突破具有重要意義,被廣泛應(yīng)用于現(xiàn)代生活的許多領(lǐng)域,例如監(jiān)視安全性、自主性駕駛、交通監(jiān)控、無人機場景分析以及機器人視覺等。自然場景目標檢測器一般分為兩類,一類是一階段檢測器,例如YOLO[19–21]和SSD[22]。另一類是兩階段檢測器,最有代表性的算法是FasterR-CNN[23]。兩階段檢測器具有較高的定位精度和目標識別能力,而一階段檢測器可實現(xiàn)較高的推理速度。圖1-2兩階段檢測器的基本架構(gòu)圖[23]-3-

示意圖,示意圖,目標檢測,骨干網(wǎng)絡(luò)


哈爾濱工業(yè)大學工程碩士學位論文兩階段檢測器由骨干網(wǎng)絡(luò)Backbone、候選區(qū)域生成網(wǎng)絡(luò)(RegionProposalNet-work,RPN)、頸部網(wǎng)絡(luò)Neck以及頭部網(wǎng)絡(luò)Head四個部分組成,如圖1-2所示為兩階段檢測器的基本架構(gòu)圖。例如,在Faster-RCNN中,第一階段的任務(wù)是提取出候選目標邊界框。然后RoIPooling操作從每個候選框中提取特征,以進行第二階段的分類識別和邊界框回歸任務(wù)。一階段探測器只包含Backbone、Neck和Head三個部分,省去了RPN部分。直接由輸入圖像預(yù)測物體的位置和類別,因此它們非常省時,可以應(yīng)用于實時設(shè)備。DetNet[24]是針對檢測器的骨干網(wǎng)絡(luò)部分改進的,它的作用是對不同大小的物體進行特征提齲不同于FPN[25]使用更多的處理階段,DetNet為保證計算效率,引入低復(fù)雜度的空洞卷積操作,所以能夠做到較高分辨率和較大感受野兼得,DetNet的結(jié)構(gòu)如圖1-3所示。一般而言,檢測任務(wù)的骨干網(wǎng)絡(luò)遷移于圖像分類網(wǎng)絡(luò),當圖像分類網(wǎng)絡(luò)直接應(yīng)用到目標檢測算法中,兩者存在的差異導致分類網(wǎng)絡(luò)并不完全適用于檢測任務(wù)。DetNet不僅對分類識別任務(wù)進行優(yōu)化,同時對定位精度也有顯著提高,緩解了目標檢測中分類識別和定位之間的矛盾,在目標檢測和實例分割兩個任務(wù)中都取得了顯著的提升效果。圖1-3DetNet的結(jié)構(gòu)示意圖[24]FPN[25]相當于是對檢測網(wǎng)絡(luò)的頸部網(wǎng)絡(luò)改進的,它提供了一個實用的特征金字塔算法,針對不同尺度的目標候選區(qū)域使用相對應(yīng)尺度的特征圖。結(jié)構(gòu)如圖1-4所示,該圖展示了FPN結(jié)構(gòu)的檢測網(wǎng)絡(luò),不同尺度的目標的RoI使用相對應(yīng)尺度的特征圖,顯著改善多尺度目標檢測的問題。同時,該網(wǎng)絡(luò)使用的“U型”結(jié)構(gòu)可以增強小目標物體的語義特征,提升檢測器對小目標的檢測效果。-4-


本文編號:2978145

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/zidonghuakongzhilunwen/2978145.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶d869a***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com