基于無(wú)人機(jī)航拍圖像的道路檢測(cè)
發(fā)布時(shí)間:2021-08-23 23:11
無(wú)人機(jī)航拍圖像有高分辨率和數(shù)據(jù)易獲得性等特點(diǎn),但航拍圖像中存在著道路復(fù)雜性和類別多樣性等多種問(wèn)題,利用生成對(duì)抗網(wǎng)絡(luò)在目標(biāo)檢測(cè)上的強(qiáng)大特征表達(dá)能力,研究如何在無(wú)人機(jī)航拍圖像上準(zhǔn)確檢測(cè)道路已成為重要研究方向之一。近年來(lái),在無(wú)人機(jī)航拍圖像上進(jìn)行道路信息檢測(cè)已經(jīng)有了許多研究,但由于道路的不同部分在寬度和形狀上不盡相同,如村道和山路等;不同類型道路具有不同顏色和紋理特征,如街道和土路等;同時(shí),道路區(qū)域拍攝時(shí)被建筑、樹(shù)木等諸多物體遮擋,使得道路信息的準(zhǔn)確檢測(cè)仍然是航拍圖像檢測(cè)領(lǐng)域的研究難點(diǎn)。本文利用條件生成對(duì)抗網(wǎng)絡(luò)方法構(gòu)建了一種航拍圖像道路信息檢測(cè)模型。具體研究?jī)?nèi)容如下:(1)研究和改進(jìn)用于提取無(wú)人機(jī)航拍圖像道路信息的生成對(duì)抗網(wǎng)絡(luò)模型。針對(duì)航拍圖像道路提取結(jié)果精度問(wèn)題以及網(wǎng)絡(luò)規(guī)模太大難以應(yīng)用的缺陷,提出了一種基于U-Net思想改進(jìn)生成器網(wǎng)絡(luò)結(jié)構(gòu)的道路檢測(cè)模型,主要分為三點(diǎn):一是在網(wǎng)絡(luò)結(jié)構(gòu)下采樣中引入殘差思想,通過(guò)跳遠(yuǎn)連接能夠使得特征信息直接到達(dá)更深層次的卷積網(wǎng)絡(luò),獲取細(xì)節(jié)特征;二是在下采樣的底層引入一種全局金字塔池化模塊,其能通過(guò)聚合上下文信息,提高分割精度;三是為防止在下采樣過(guò)程中道路信息的丟失...
【文章來(lái)源】:西北師范大學(xué)甘肅省
【文章頁(yè)數(shù)】:46 頁(yè)
【學(xué)位級(jí)別】:碩士
【部分圖文】:
GAN訓(xùn)練過(guò)程
第2章基礎(chǔ)理論與技術(shù)7與原始的編碼器-解碼器結(jié)構(gòu)的生成網(wǎng)絡(luò)相比,U-Net的優(yōu)點(diǎn)是結(jié)合數(shù)據(jù)增強(qiáng)的方法可以支持少量的訓(xùn)練數(shù)據(jù)訓(xùn)練模型,其在編碼層和解碼層跳遠(yuǎn)連接結(jié)構(gòu)決定著網(wǎng)絡(luò)結(jié)構(gòu)本身就可以實(shí)現(xiàn)像素級(jí)的目標(biāo)檢測(cè),得到的結(jié)果也更加能夠反應(yīng)圖像的原始信息[28]。U-Net網(wǎng)絡(luò)結(jié)構(gòu)如圖2-2所示。主要由卷積層、最大池化層(下采樣)、反卷積層(上采樣)以及ReLU非線性激活函數(shù)組成[29]。圖2-2U-net網(wǎng)絡(luò)結(jié)構(gòu)2.1.3深度卷積判別網(wǎng)絡(luò)卷積神經(jīng)網(wǎng)絡(luò)[30](ConvolutionalNeuralNetworks,CNN)是一類包含多層多卷積計(jì)算的深度學(xué)習(xí)網(wǎng)絡(luò),一直以來(lái)作為計(jì)算機(jī)視覺(jué)主要網(wǎng)絡(luò)結(jié)構(gòu)。卷積神經(jīng)網(wǎng)絡(luò)擁有表征學(xué)習(xí)的能力,能夠使用不同層次的網(wǎng)絡(luò)結(jié)構(gòu)對(duì)輸入信息進(jìn)行平移不變分類,因此,卷積神經(jīng)網(wǎng)絡(luò)常用來(lái)作為生成對(duì)抗網(wǎng)絡(luò)的判別器與生成器互相優(yōu)化。CNN主要包括輸入層,卷積層,池化層,全連接層和輸出層[31]。(1)輸入層使用梯度下降算法進(jìn)行學(xué)習(xí),卷積神經(jīng)網(wǎng)絡(luò)的輸入特征與其他神經(jīng)網(wǎng)絡(luò)算法類似,都需要進(jìn)行標(biāo)準(zhǔn)化處理。具體的,在卷積神經(jīng)網(wǎng)絡(luò)輸入初始數(shù)據(jù)樣本前,需在初始通道維度對(duì)輸入數(shù)據(jù)進(jìn)行歸一化處理,若輸入數(shù)據(jù)為像素,則將分布于
西北師范大學(xué)碩士學(xué)位論文10圖2-3殘差學(xué)習(xí)卷積單元結(jié)合殘差網(wǎng)絡(luò)模塊能有效解決模型梯度減少、梯度消失的問(wèn)題,通過(guò)跳躍連接到更深層次,使得模型能夠充分學(xué)習(xí)到道路圖像的分布,從而提高分割的效果[43]。2.3全局金字塔池化模塊全局金字塔池化模塊來(lái)源于金字塔場(chǎng)景解析網(wǎng)絡(luò)(PyramidSceneParsingNet,PSPNet),其能夠通過(guò)聚合特征圖中不同區(qū)域的背景信息,提高模型獲取全局信息的能力[44]。在進(jìn)行目標(biāo)檢測(cè)時(shí)通常會(huì)出現(xiàn)如下情況:(1)語(yǔ)境關(guān)系不匹配。語(yǔ)境關(guān)系是普遍存在的,尤其對(duì)復(fù)雜場(chǎng)景的理解至關(guān)重要,有些物體常是一起出現(xiàn)的,例如:汽車通常是在道路上行駛,而不是在河里。(2)類別混淆。道路區(qū)域和建筑物的外觀十分相似,在這種情況下,對(duì)于物體的檢測(cè)結(jié)果不可能既是道路又或是建筑物,只能通過(guò)類別之間的關(guān)系解決。(3)不明顯的類別。特征圖中包含不同尺寸的目標(biāo)信息。一些小的物體,如路燈和指示牌,很難被分割出來(lái)。相對(duì)大的一些物體,如自行車和摩托車,外觀相似,由于忽略了全局場(chǎng)景類別,導(dǎo)致他們很難區(qū)分開(kāi)。在語(yǔ)義分割中,許多錯(cuò)誤都與感受野獲取的全局信息和語(yǔ)境關(guān)系有著關(guān)聯(lián)。因此,擁有適當(dāng)?shù)膱?chǎng)景級(jí)全局信息的深度網(wǎng)絡(luò)可以大大提高場(chǎng)景解析的能力。全局金字塔池化模塊如圖2-4所示。
【參考文獻(xiàn)】:
期刊論文
[1]基于生成對(duì)抗網(wǎng)絡(luò)的遙感圖像去云算法[J]. 李華瑩,林道玉,張捷,劉必欣. 計(jì)算機(jī)與現(xiàn)代化. 2019(11)
[2]基于編碼器-解碼器的半監(jiān)督圖像語(yǔ)義分割[J]. 劉貝貝,華蓓. 計(jì)算機(jī)系統(tǒng)應(yīng)用. 2019(11)
[3]基于快速M(fèi)USIC算法的道路雙黃線檢測(cè)[J]. 張新雨,雷海棟,王思米. 傳感技術(shù)學(xué)報(bào). 2019(11)
[4]基于混合自動(dòng)編碼器道路語(yǔ)義分割方法研究[J]. 周飛,唐建,楊成松,芮挺. 計(jì)算機(jī)工程與科學(xué). 2019(08)
[5]多形態(tài)幾何約束的道路障礙物檢測(cè)新方法[J]. 吳宏濤. 山西交通科技. 2019(04)
[6]基于生成對(duì)抗網(wǎng)絡(luò)的無(wú)人機(jī)圖像道路提取[J]. 何磊,李玉霞,彭博,吳煥萍. 電子科技大學(xué)學(xué)報(bào). 2019(04)
[7]基于生成對(duì)抗網(wǎng)絡(luò)的圖像翻譯現(xiàn)狀研究[J]. 顏貝,張建林. 國(guó)外電子測(cè)量技術(shù). 2019(06)
[8]基于深層神經(jīng)網(wǎng)絡(luò)的道路交通標(biāo)志檢測(cè)識(shí)別方法研究[J]. 王斯健,李志鵬. 科技資訊. 2019(17)
[9]基于生成對(duì)抗網(wǎng)絡(luò)的圖像恢復(fù)與SLAM容錯(cuò)研究[J]. 王凱,岳泊暄,傅駿偉,梁軍. 浙江大學(xué)學(xué)報(bào)(工學(xué)版). 2019(01)
[10]基于條件生成對(duì)抗網(wǎng)絡(luò)的咬翼片圖像分割[J]. 蔣蕓,譚寧,張海,彭婷婷. 計(jì)算機(jī)工程. 2019(04)
博士論文
[1]無(wú)人機(jī)飛行途中視覺(jué)導(dǎo)航關(guān)鍵技術(shù)研究[D]. 宋琳.西北工業(yè)大學(xué) 2015
[2]基于超小型無(wú)人機(jī)的地面目標(biāo)實(shí)時(shí)圖像跟蹤[D]. 丁衛(wèi).上海大學(xué) 2007
碩士論文
[1]基于無(wú)人機(jī)航拍圖像的道路檢測(cè)[D]. 侯陽(yáng)陽(yáng).南京理工大學(xué) 2017
[2]基于FPGA的哈特曼光斑圖像處理算法設(shè)計(jì)[D]. 劉國(guó)成.中國(guó)科學(xué)技術(shù)大學(xué) 2016
[3]基于多特征融合的無(wú)人機(jī)航拍圖像識(shí)別研究[D]. 王建榮.成都理工大學(xué) 2015
[4]基于航拍圖像的目標(biāo)檢測(cè)系統(tǒng)設(shè)計(jì)與實(shí)現(xiàn)[D]. 韓露.北京理工大學(xué) 2015
本文編號(hào):3358773
【文章來(lái)源】:西北師范大學(xué)甘肅省
【文章頁(yè)數(shù)】:46 頁(yè)
【學(xué)位級(jí)別】:碩士
【部分圖文】:
GAN訓(xùn)練過(guò)程
第2章基礎(chǔ)理論與技術(shù)7與原始的編碼器-解碼器結(jié)構(gòu)的生成網(wǎng)絡(luò)相比,U-Net的優(yōu)點(diǎn)是結(jié)合數(shù)據(jù)增強(qiáng)的方法可以支持少量的訓(xùn)練數(shù)據(jù)訓(xùn)練模型,其在編碼層和解碼層跳遠(yuǎn)連接結(jié)構(gòu)決定著網(wǎng)絡(luò)結(jié)構(gòu)本身就可以實(shí)現(xiàn)像素級(jí)的目標(biāo)檢測(cè),得到的結(jié)果也更加能夠反應(yīng)圖像的原始信息[28]。U-Net網(wǎng)絡(luò)結(jié)構(gòu)如圖2-2所示。主要由卷積層、最大池化層(下采樣)、反卷積層(上采樣)以及ReLU非線性激活函數(shù)組成[29]。圖2-2U-net網(wǎng)絡(luò)結(jié)構(gòu)2.1.3深度卷積判別網(wǎng)絡(luò)卷積神經(jīng)網(wǎng)絡(luò)[30](ConvolutionalNeuralNetworks,CNN)是一類包含多層多卷積計(jì)算的深度學(xué)習(xí)網(wǎng)絡(luò),一直以來(lái)作為計(jì)算機(jī)視覺(jué)主要網(wǎng)絡(luò)結(jié)構(gòu)。卷積神經(jīng)網(wǎng)絡(luò)擁有表征學(xué)習(xí)的能力,能夠使用不同層次的網(wǎng)絡(luò)結(jié)構(gòu)對(duì)輸入信息進(jìn)行平移不變分類,因此,卷積神經(jīng)網(wǎng)絡(luò)常用來(lái)作為生成對(duì)抗網(wǎng)絡(luò)的判別器與生成器互相優(yōu)化。CNN主要包括輸入層,卷積層,池化層,全連接層和輸出層[31]。(1)輸入層使用梯度下降算法進(jìn)行學(xué)習(xí),卷積神經(jīng)網(wǎng)絡(luò)的輸入特征與其他神經(jīng)網(wǎng)絡(luò)算法類似,都需要進(jìn)行標(biāo)準(zhǔn)化處理。具體的,在卷積神經(jīng)網(wǎng)絡(luò)輸入初始數(shù)據(jù)樣本前,需在初始通道維度對(duì)輸入數(shù)據(jù)進(jìn)行歸一化處理,若輸入數(shù)據(jù)為像素,則將分布于
西北師范大學(xué)碩士學(xué)位論文10圖2-3殘差學(xué)習(xí)卷積單元結(jié)合殘差網(wǎng)絡(luò)模塊能有效解決模型梯度減少、梯度消失的問(wèn)題,通過(guò)跳躍連接到更深層次,使得模型能夠充分學(xué)習(xí)到道路圖像的分布,從而提高分割的效果[43]。2.3全局金字塔池化模塊全局金字塔池化模塊來(lái)源于金字塔場(chǎng)景解析網(wǎng)絡(luò)(PyramidSceneParsingNet,PSPNet),其能夠通過(guò)聚合特征圖中不同區(qū)域的背景信息,提高模型獲取全局信息的能力[44]。在進(jìn)行目標(biāo)檢測(cè)時(shí)通常會(huì)出現(xiàn)如下情況:(1)語(yǔ)境關(guān)系不匹配。語(yǔ)境關(guān)系是普遍存在的,尤其對(duì)復(fù)雜場(chǎng)景的理解至關(guān)重要,有些物體常是一起出現(xiàn)的,例如:汽車通常是在道路上行駛,而不是在河里。(2)類別混淆。道路區(qū)域和建筑物的外觀十分相似,在這種情況下,對(duì)于物體的檢測(cè)結(jié)果不可能既是道路又或是建筑物,只能通過(guò)類別之間的關(guān)系解決。(3)不明顯的類別。特征圖中包含不同尺寸的目標(biāo)信息。一些小的物體,如路燈和指示牌,很難被分割出來(lái)。相對(duì)大的一些物體,如自行車和摩托車,外觀相似,由于忽略了全局場(chǎng)景類別,導(dǎo)致他們很難區(qū)分開(kāi)。在語(yǔ)義分割中,許多錯(cuò)誤都與感受野獲取的全局信息和語(yǔ)境關(guān)系有著關(guān)聯(lián)。因此,擁有適當(dāng)?shù)膱?chǎng)景級(jí)全局信息的深度網(wǎng)絡(luò)可以大大提高場(chǎng)景解析的能力。全局金字塔池化模塊如圖2-4所示。
【參考文獻(xiàn)】:
期刊論文
[1]基于生成對(duì)抗網(wǎng)絡(luò)的遙感圖像去云算法[J]. 李華瑩,林道玉,張捷,劉必欣. 計(jì)算機(jī)與現(xiàn)代化. 2019(11)
[2]基于編碼器-解碼器的半監(jiān)督圖像語(yǔ)義分割[J]. 劉貝貝,華蓓. 計(jì)算機(jī)系統(tǒng)應(yīng)用. 2019(11)
[3]基于快速M(fèi)USIC算法的道路雙黃線檢測(cè)[J]. 張新雨,雷海棟,王思米. 傳感技術(shù)學(xué)報(bào). 2019(11)
[4]基于混合自動(dòng)編碼器道路語(yǔ)義分割方法研究[J]. 周飛,唐建,楊成松,芮挺. 計(jì)算機(jī)工程與科學(xué). 2019(08)
[5]多形態(tài)幾何約束的道路障礙物檢測(cè)新方法[J]. 吳宏濤. 山西交通科技. 2019(04)
[6]基于生成對(duì)抗網(wǎng)絡(luò)的無(wú)人機(jī)圖像道路提取[J]. 何磊,李玉霞,彭博,吳煥萍. 電子科技大學(xué)學(xué)報(bào). 2019(04)
[7]基于生成對(duì)抗網(wǎng)絡(luò)的圖像翻譯現(xiàn)狀研究[J]. 顏貝,張建林. 國(guó)外電子測(cè)量技術(shù). 2019(06)
[8]基于深層神經(jīng)網(wǎng)絡(luò)的道路交通標(biāo)志檢測(cè)識(shí)別方法研究[J]. 王斯健,李志鵬. 科技資訊. 2019(17)
[9]基于生成對(duì)抗網(wǎng)絡(luò)的圖像恢復(fù)與SLAM容錯(cuò)研究[J]. 王凱,岳泊暄,傅駿偉,梁軍. 浙江大學(xué)學(xué)報(bào)(工學(xué)版). 2019(01)
[10]基于條件生成對(duì)抗網(wǎng)絡(luò)的咬翼片圖像分割[J]. 蔣蕓,譚寧,張海,彭婷婷. 計(jì)算機(jī)工程. 2019(04)
博士論文
[1]無(wú)人機(jī)飛行途中視覺(jué)導(dǎo)航關(guān)鍵技術(shù)研究[D]. 宋琳.西北工業(yè)大學(xué) 2015
[2]基于超小型無(wú)人機(jī)的地面目標(biāo)實(shí)時(shí)圖像跟蹤[D]. 丁衛(wèi).上海大學(xué) 2007
碩士論文
[1]基于無(wú)人機(jī)航拍圖像的道路檢測(cè)[D]. 侯陽(yáng)陽(yáng).南京理工大學(xué) 2017
[2]基于FPGA的哈特曼光斑圖像處理算法設(shè)計(jì)[D]. 劉國(guó)成.中國(guó)科學(xué)技術(shù)大學(xué) 2016
[3]基于多特征融合的無(wú)人機(jī)航拍圖像識(shí)別研究[D]. 王建榮.成都理工大學(xué) 2015
[4]基于航拍圖像的目標(biāo)檢測(cè)系統(tǒng)設(shè)計(jì)與實(shí)現(xiàn)[D]. 韓露.北京理工大學(xué) 2015
本文編號(hào):3358773
本文鏈接:http://sikaile.net/shoufeilunwen/benkebiyelunwen/3358773.html
最近更新
教材專著