基于全卷積神經(jīng)網(wǎng)絡(luò)的航空圖像目標(biāo)檢測算法研究
發(fā)布時間:2021-01-15 03:36
基于大規(guī)模數(shù)據(jù)的高分辨率影像目標(biāo)檢測算法研究,對于航空影像處理領(lǐng)域而言,是一個非常重要的研究方向。航空影像目標(biāo)檢測算法現(xiàn)在分為兩種:傳統(tǒng)算法和深度學(xué)習(xí)算法。傳統(tǒng)的目標(biāo)檢測算法難以適用于大規(guī)模數(shù)據(jù),該類算法通過人工設(shè)計的算子進(jìn)行特征提取,其特征表達(dá)能力有限同時計算冗余耗時。人工設(shè)計的算子極其依賴于專業(yè)領(lǐng)域知識,而且很難從大規(guī)模數(shù)據(jù)中訓(xùn)練出一個有效的特征提取器,不能充分挖掘海量數(shù)據(jù)之間的聯(lián)系。深度學(xué)習(xí)算法擁有高效的特征提取能力、強(qiáng)大的特征表達(dá)能力和學(xué)習(xí)優(yōu)化能力,可以為圖像中的目標(biāo)特征提取算法研究提供有力的支撐。因此,針對航空圖像檢測問題,深度學(xué)習(xí)算法無論是在速度還是在精度上都有傳統(tǒng)算法不可比擬的優(yōu)勢。本文將基于全卷積神經(jīng)網(wǎng)絡(luò)目標(biāo)檢測算法,對航空檢測場景開展相關(guān)研究,主要研究內(nèi)容如下。本文針對航空檢測場景普遍存在的尺度不平衡問題提出啟發(fā)式訓(xùn)練策略,該策略根據(jù)物體的標(biāo)注先驗(yàn)信息生成新的訓(xùn)練樣本,改變物體尺度的總體分布,從數(shù)據(jù)源頭緩解了尺度不平衡問題。本文提出新的錨框聚類算法,該算法綜合考慮樣本與類中心的重疊程度和長寬比例一致程度。該算法和均勻設(shè)置錨框尺度相比,根據(jù)其結(jié)果所設(shè)置的錨框尺度可以獲得...
【文章來源】:哈爾濱工業(yè)大學(xué)黑龍江省 211工程院校 985工程院校
【文章頁數(shù)】:63 頁
【學(xué)位級別】:碩士
【部分圖文】:
基于滑動框和傳統(tǒng)機(jī)器學(xué)習(xí)的目標(biāo)識別系統(tǒng)框圖
哈爾濱工業(yè)大學(xué)工程碩士學(xué)位論文為兩個主要部分:(1)HOG特征提。簭幕瑒涌蛑刑崛〕龅淖訄D中提取HOG特征;(2)支持向量機(jī):以子圖的HOG特征為輸入,判斷該子圖中是否有待檢物體。比如Cheng[17]和Grabner[18]使用傳統(tǒng)滑窗方法,然后提取HOG特征,最后進(jìn)行航空圖像目標(biāo)檢測。相對于模板匹配算法和圖像分析方法而言,傳統(tǒng)機(jī)器學(xué)習(xí)檢測算法具有更高的精確度、更加魯棒以及較強(qiáng)的泛化能力。然而,傳統(tǒng)機(jī)器學(xué)習(xí)方法所采用的滑窗方法會導(dǎo)致嚴(yán)重的冗余計算,而且手工設(shè)計算子提取特征,無法表征圖像的更高級別語義信息。例如田徑場地和足球場地具有相似的結(jié)構(gòu)紋理,但是它們完全對應(yīng)不同的抽象語義信息。1.2.2面向自然場景的目標(biāo)檢測算法研究現(xiàn)狀目標(biāo)檢測領(lǐng)域吸引著越來越多的研究人員,主要是因?yàn)槠鋸V泛的應(yīng)用和巨大的技術(shù)突破。自然場景目標(biāo)檢測算法的迅猛突破具有重要意義,被廣泛應(yīng)用于現(xiàn)代生活的許多領(lǐng)域,例如監(jiān)視安全性、自主性駕駛、交通監(jiān)控、無人機(jī)場景分析以及機(jī)器人視覺等。自然場景目標(biāo)檢測器一般分為兩類,一類是一階段檢測器,例如YOLO[19–21]和SSD[22]。另一類是兩階段檢測器,最有代表性的算法是FasterR-CNN[23]。兩階段檢測器具有較高的定位精度和目標(biāo)識別能力,而一階段檢測器可實(shí)現(xiàn)較高的推理速度。圖1-2兩階段檢測器的基本架構(gòu)圖[23]-3-
哈爾濱工業(yè)大學(xué)工程碩士學(xué)位論文兩階段檢測器由骨干網(wǎng)絡(luò)Backbone、候選區(qū)域生成網(wǎng)絡(luò)(RegionProposalNet-work,RPN)、頸部網(wǎng)絡(luò)Neck以及頭部網(wǎng)絡(luò)Head四個部分組成,如圖1-2所示為兩階段檢測器的基本架構(gòu)圖。例如,在Faster-RCNN中,第一階段的任務(wù)是提取出候選目標(biāo)邊界框。然后RoIPooling操作從每個候選框中提取特征,以進(jìn)行第二階段的分類識別和邊界框回歸任務(wù)。一階段探測器只包含Backbone、Neck和Head三個部分,省去了RPN部分。直接由輸入圖像預(yù)測物體的位置和類別,因此它們非常省時,可以應(yīng)用于實(shí)時設(shè)備。DetNet[24]是針對檢測器的骨干網(wǎng)絡(luò)部分改進(jìn)的,它的作用是對不同大小的物體進(jìn)行特征提齲不同于FPN[25]使用更多的處理階段,DetNet為保證計算效率,引入低復(fù)雜度的空洞卷積操作,所以能夠做到較高分辨率和較大感受野兼得,DetNet的結(jié)構(gòu)如圖1-3所示。一般而言,檢測任務(wù)的骨干網(wǎng)絡(luò)遷移于圖像分類網(wǎng)絡(luò),當(dāng)圖像分類網(wǎng)絡(luò)直接應(yīng)用到目標(biāo)檢測算法中,兩者存在的差異導(dǎo)致分類網(wǎng)絡(luò)并不完全適用于檢測任務(wù)。DetNet不僅對分類識別任務(wù)進(jìn)行優(yōu)化,同時對定位精度也有顯著提高,緩解了目標(biāo)檢測中分類識別和定位之間的矛盾,在目標(biāo)檢測和實(shí)例分割兩個任務(wù)中都取得了顯著的提升效果。圖1-3DetNet的結(jié)構(gòu)示意圖[24]FPN[25]相當(dāng)于是對檢測網(wǎng)絡(luò)的頸部網(wǎng)絡(luò)改進(jìn)的,它提供了一個實(shí)用的特征金字塔算法,針對不同尺度的目標(biāo)候選區(qū)域使用相對應(yīng)尺度的特征圖。結(jié)構(gòu)如圖1-4所示,該圖展示了FPN結(jié)構(gòu)的檢測網(wǎng)絡(luò),不同尺度的目標(biāo)的RoI使用相對應(yīng)尺度的特征圖,顯著改善多尺度目標(biāo)檢測的問題。同時,該網(wǎng)絡(luò)使用的“U型”結(jié)構(gòu)可以增強(qiáng)小目標(biāo)物體的語義特征,提升檢測器對小目標(biāo)的檢測效果。-4-
本文編號:2978145
【文章來源】:哈爾濱工業(yè)大學(xué)黑龍江省 211工程院校 985工程院校
【文章頁數(shù)】:63 頁
【學(xué)位級別】:碩士
【部分圖文】:
基于滑動框和傳統(tǒng)機(jī)器學(xué)習(xí)的目標(biāo)識別系統(tǒng)框圖
哈爾濱工業(yè)大學(xué)工程碩士學(xué)位論文為兩個主要部分:(1)HOG特征提。簭幕瑒涌蛑刑崛〕龅淖訄D中提取HOG特征;(2)支持向量機(jī):以子圖的HOG特征為輸入,判斷該子圖中是否有待檢物體。比如Cheng[17]和Grabner[18]使用傳統(tǒng)滑窗方法,然后提取HOG特征,最后進(jìn)行航空圖像目標(biāo)檢測。相對于模板匹配算法和圖像分析方法而言,傳統(tǒng)機(jī)器學(xué)習(xí)檢測算法具有更高的精確度、更加魯棒以及較強(qiáng)的泛化能力。然而,傳統(tǒng)機(jī)器學(xué)習(xí)方法所采用的滑窗方法會導(dǎo)致嚴(yán)重的冗余計算,而且手工設(shè)計算子提取特征,無法表征圖像的更高級別語義信息。例如田徑場地和足球場地具有相似的結(jié)構(gòu)紋理,但是它們完全對應(yīng)不同的抽象語義信息。1.2.2面向自然場景的目標(biāo)檢測算法研究現(xiàn)狀目標(biāo)檢測領(lǐng)域吸引著越來越多的研究人員,主要是因?yàn)槠鋸V泛的應(yīng)用和巨大的技術(shù)突破。自然場景目標(biāo)檢測算法的迅猛突破具有重要意義,被廣泛應(yīng)用于現(xiàn)代生活的許多領(lǐng)域,例如監(jiān)視安全性、自主性駕駛、交通監(jiān)控、無人機(jī)場景分析以及機(jī)器人視覺等。自然場景目標(biāo)檢測器一般分為兩類,一類是一階段檢測器,例如YOLO[19–21]和SSD[22]。另一類是兩階段檢測器,最有代表性的算法是FasterR-CNN[23]。兩階段檢測器具有較高的定位精度和目標(biāo)識別能力,而一階段檢測器可實(shí)現(xiàn)較高的推理速度。圖1-2兩階段檢測器的基本架構(gòu)圖[23]-3-
哈爾濱工業(yè)大學(xué)工程碩士學(xué)位論文兩階段檢測器由骨干網(wǎng)絡(luò)Backbone、候選區(qū)域生成網(wǎng)絡(luò)(RegionProposalNet-work,RPN)、頸部網(wǎng)絡(luò)Neck以及頭部網(wǎng)絡(luò)Head四個部分組成,如圖1-2所示為兩階段檢測器的基本架構(gòu)圖。例如,在Faster-RCNN中,第一階段的任務(wù)是提取出候選目標(biāo)邊界框。然后RoIPooling操作從每個候選框中提取特征,以進(jìn)行第二階段的分類識別和邊界框回歸任務(wù)。一階段探測器只包含Backbone、Neck和Head三個部分,省去了RPN部分。直接由輸入圖像預(yù)測物體的位置和類別,因此它們非常省時,可以應(yīng)用于實(shí)時設(shè)備。DetNet[24]是針對檢測器的骨干網(wǎng)絡(luò)部分改進(jìn)的,它的作用是對不同大小的物體進(jìn)行特征提齲不同于FPN[25]使用更多的處理階段,DetNet為保證計算效率,引入低復(fù)雜度的空洞卷積操作,所以能夠做到較高分辨率和較大感受野兼得,DetNet的結(jié)構(gòu)如圖1-3所示。一般而言,檢測任務(wù)的骨干網(wǎng)絡(luò)遷移于圖像分類網(wǎng)絡(luò),當(dāng)圖像分類網(wǎng)絡(luò)直接應(yīng)用到目標(biāo)檢測算法中,兩者存在的差異導(dǎo)致分類網(wǎng)絡(luò)并不完全適用于檢測任務(wù)。DetNet不僅對分類識別任務(wù)進(jìn)行優(yōu)化,同時對定位精度也有顯著提高,緩解了目標(biāo)檢測中分類識別和定位之間的矛盾,在目標(biāo)檢測和實(shí)例分割兩個任務(wù)中都取得了顯著的提升效果。圖1-3DetNet的結(jié)構(gòu)示意圖[24]FPN[25]相當(dāng)于是對檢測網(wǎng)絡(luò)的頸部網(wǎng)絡(luò)改進(jìn)的,它提供了一個實(shí)用的特征金字塔算法,針對不同尺度的目標(biāo)候選區(qū)域使用相對應(yīng)尺度的特征圖。結(jié)構(gòu)如圖1-4所示,該圖展示了FPN結(jié)構(gòu)的檢測網(wǎng)絡(luò),不同尺度的目標(biāo)的RoI使用相對應(yīng)尺度的特征圖,顯著改善多尺度目標(biāo)檢測的問題。同時,該網(wǎng)絡(luò)使用的“U型”結(jié)構(gòu)可以增強(qiáng)小目標(biāo)物體的語義特征,提升檢測器對小目標(biāo)的檢測效果。-4-
本文編號:2978145
本文鏈接:http://sikaile.net/kejilunwen/zidonghuakongzhilunwen/2978145.html
最近更新
教材專著