基于全卷積神經(jīng)網(wǎng)絡(luò)的航空圖像目標(biāo)檢測算法研究

發(fā)布時間：2021-01-15 03:36

　　基于大規(guī)模數(shù)據(jù)的高分辨率影像目標(biāo)檢測算法研究,對于航空影像處理領(lǐng)域而言,是一個非常重要的研究方向。航空影像目標(biāo)檢測算法現(xiàn)在分為兩種:傳統(tǒng)算法和深度學(xué)習(xí)算法。傳統(tǒng)的目標(biāo)檢測算法難以適用于大規(guī)模數(shù)據(jù),該類算法通過人工設(shè)計的算子進(jìn)行特征提取,其特征表達(dá)能力有限同時計算冗余耗時。人工設(shè)計的算子極其依賴于專業(yè)領(lǐng)域知識,而且很難從大規(guī)模數(shù)據(jù)中訓(xùn)練出一個有效的特征提取器,不能充分挖掘海量數(shù)據(jù)之間的聯(lián)系。深度學(xué)習(xí)算法擁有高效的特征提取能力、強(qiáng)大的特征表達(dá)能力和學(xué)習(xí)優(yōu)化能力,可以為圖像中的目標(biāo)特征提取算法研究提供有力的支撐。因此,針對航空圖像檢測問題,深度學(xué)習(xí)算法無論是在速度還是在精度上都有傳統(tǒng)算法不可比擬的優(yōu)勢。本文將基于全卷積神經(jīng)網(wǎng)絡(luò)目標(biāo)檢測算法,對航空檢測場景開展相關(guān)研究,主要研究內(nèi)容如下。本文針對航空檢測場景普遍存在的尺度不平衡問題提出啟發(fā)式訓(xùn)練策略,該策略根據(jù)物體的標(biāo)注先驗(yàn)信息生成新的訓(xùn)練樣本,改變物體尺度的總體分布,從數(shù)據(jù)源頭緩解了尺度不平衡問題。本文提出新的錨框聚類算法,該算法綜合考慮樣本與類中心的重疊程度和長寬比例一致程度。該算法和均勻設(shè)置錨框尺度相比,根據(jù)其結(jié)果所設(shè)置的錨框尺度可以獲得...

【文章來源】：哈爾濱工業(yè)大學(xué)黑龍江省 211工程院校 985工程院校

【文章頁數(shù)】：63 頁

【學(xué)位級別】：碩士

【部分圖文】：

基于滑動框和傳統(tǒng)機(jī)器學(xué)習(xí)的目標(biāo)識別系統(tǒng)框圖

架構(gòu)圖,檢測器,目標(biāo)檢測,場景

哈爾濱工業(yè)大學(xué)工程碩士學(xué)位論文為兩個主要部分：（1）HOG特征提�。簭幕瑒涌蛑刑崛〕龅淖訄D中提取HOG特征；（2）支持向量機(jī)：以子圖的HOG特征為輸入，判斷該子圖中是否有待檢物體。比如Cheng[17]和Grabner[18]使用傳統(tǒng)滑窗方法，然后提取HOG特征，最后進(jìn)行航空圖像目標(biāo)檢測。相對于模板匹配算法和圖像分析方法而言，傳統(tǒng)機(jī)器學(xué)習(xí)檢測算法具有更高的精確度、更加魯棒以及較強(qiáng)的泛化能力。然而，傳統(tǒng)機(jī)器學(xué)習(xí)方法所采用的滑窗方法會導(dǎo)致嚴(yán)重的冗余計算，而且手工設(shè)計算子提取特征，無法表征圖像的更高級別語義信息。例如田徑場地和足球場地具有相似的結(jié)構(gòu)紋理，但是它們完全對應(yīng)不同的抽象語義信息。1.2.2面向自然場景的目標(biāo)檢測算法研究現(xiàn)狀目標(biāo)檢測領(lǐng)域吸引著越來越多的研究人員，主要是因?yàn)槠鋸V泛的應(yīng)用和巨大的技術(shù)突破。自然場景目標(biāo)檢測算法的迅猛突破具有重要意義，被廣泛應(yīng)用于現(xiàn)代生活的許多領(lǐng)域，例如監(jiān)視安全性、自主性駕駛、交通監(jiān)控、無人機(jī)場景分析以及機(jī)器人視覺等。自然場景目標(biāo)檢測器一般分為兩類，一類是一階段檢測器，例如YOLO[19–21]和SSD[22]。另一類是兩階段檢測器，最有代表性的算法是FasterR-CNN[23]。兩階段檢測器具有較高的定位精度和目標(biāo)識別能力，而一階段檢測器可實(shí)現(xiàn)較高的推理速度。圖1-2兩階段檢測器的基本架構(gòu)圖[23]-3-

示意圖,示意圖,目標(biāo)檢測,骨干網(wǎng)絡(luò)

哈爾濱工業(yè)大學(xué)工程碩士學(xué)位論文兩階段檢測器由骨干網(wǎng)絡(luò)Backbone、候選區(qū)域生成網(wǎng)絡(luò)（RegionProposalNet-work，RPN）、頸部網(wǎng)絡(luò)Neck以及頭部網(wǎng)絡(luò)Head四個部分組成，如圖1-2所示為兩階段檢測器的基本架構(gòu)圖。例如，在Faster-RCNN中，第一階段的任務(wù)是提取出候選目標(biāo)邊界框。然后RoIPooling操作從每個候選框中提取特征，以進(jìn)行第二階段的分類識別和邊界框回歸任務(wù)。一階段探測器只包含Backbone、Neck和Head三個部分，省去了RPN部分。直接由輸入圖像預(yù)測物體的位置和類別，因此它們非常省時，可以應(yīng)用于實(shí)時設(shè)備。DetNet[24]是針對檢測器的骨干網(wǎng)絡(luò)部分改進(jìn)的，它的作用是對不同大小的物體進(jìn)行特征提齲不同于FPN[25]使用更多的處理階段，DetNet為保證計算效率，引入低復(fù)雜度的空洞卷積操作，所以能夠做到較高分辨率和較大感受野兼得，DetNet的結(jié)構(gòu)如圖1-3所示。一般而言，檢測任務(wù)的骨干網(wǎng)絡(luò)遷移于圖像分類網(wǎng)絡(luò)，當(dāng)圖像分類網(wǎng)絡(luò)直接應(yīng)用到目標(biāo)檢測算法中，兩者存在的差異導(dǎo)致分類網(wǎng)絡(luò)并不完全適用于檢測任務(wù)。DetNet不僅對分類識別任務(wù)進(jìn)行優(yōu)化，同時對定位精度也有顯著提高，緩解了目標(biāo)檢測中分類識別和定位之間的矛盾，在目標(biāo)檢測和實(shí)例分割兩個任務(wù)中都取得了顯著的提升效果。圖1-3DetNet的結(jié)構(gòu)示意圖[24]FPN[25]相當(dāng)于是對檢測網(wǎng)絡(luò)的頸部網(wǎng)絡(luò)改進(jìn)的，它提供了一個實(shí)用的特征金字塔算法，針對不同尺度的目標(biāo)候選區(qū)域使用相對應(yīng)尺度的特征圖。結(jié)構(gòu)如圖1-4所示，該圖展示了FPN結(jié)構(gòu)的檢測網(wǎng)絡(luò)，不同尺度的目標(biāo)的RoI使用相對應(yīng)尺度的特征圖，顯著改善多尺度目標(biāo)檢測的問題。同時，該網(wǎng)絡(luò)使用的“U型”結(jié)構(gòu)可以增強(qiáng)小目標(biāo)物體的語義特征，提升檢測器對小目標(biāo)的檢測效果。-4-

本文編號：2978145

資料下載

論文發(fā)表

支付寶下載

Download by Alipay
微信下載

Download by Wechat
會員下載

Download by Member

本文鏈接：http://sikaile.net/kejilunwen/zidonghuakongzhilunwen/2978145.html

上一篇：基于UVM的LPDDR4控制器的驗(yàn)證
下一篇：硅微陀螺儀閉環(huán)檢測技術(shù)研究

論文發(fā)表

·知網(wǎng)|萬方|維普|龍?jiān)磡省級|國家級|科技核心|北大核心|南大核心CSSCI|EI|SCI|SSCI|

天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

基于全卷積神經(jīng)網(wǎng)絡(luò)的航空圖像目標(biāo)檢測算法研究