基于中高分辨率遙感影像人工地表提取方法研究
發(fā)布時間:2021-04-14 06:47
隨著空間傳感器技術(shù)的發(fā)展,遙感技術(shù)逐漸成為一種重要的地表觀測手段。深度學(xué)習(xí)方法在計算機視覺領(lǐng)域,自然語言處理領(lǐng)域中都獲得了長足的發(fā)展與良好的效果。近年來,在地表覆蓋分類,遙感圖像變化檢測,遙感圖像目標(biāo)檢測等遙感圖像處理領(lǐng)域中也逐漸在引入深度學(xué)習(xí)算法。不同于傳統(tǒng)的遙感圖像處理方法,如遙感指數(shù)閾值提取、支持向量機、決策樹分類器等方法人為地構(gòu)建特征,深度學(xué)習(xí)通過神經(jīng)網(wǎng)絡(luò)中可學(xué)習(xí)的權(quán)重來自動提取圖像特征并對圖像特征加以利用,同時也能更好的擬合數(shù)據(jù)的本質(zhì)特征。本文針對深度學(xué)習(xí)的語義分割方法在遙感圖像的地表覆蓋分類和人工地表覆蓋提取的應(yīng)用進行了研究并提出了一些改進的方法。本文主要研究了如何將計算機視覺領(lǐng)域中語義分割方法遷移到遙感圖像人工地表覆蓋提取任務(wù)上并針對遙感影像進行改進。其次,本文通過融入稀疏化的Non-local空間注意力來對語義編碼器的性能進行改進。通過融入通道注意力機制到深層特征與淺層特征解碼器中對語義信息解碼中來優(yōu)化解碼性能。再次,考慮到樣本中的類別分布不均的問題,在交叉熵?fù)p失函數(shù)中引入了在線難例挖掘算法方法幫助模型收斂。最后,本文根據(jù)遙感圖像特點結(jié)合使用了多元數(shù)據(jù)融合的方法對深度學(xué)...
【文章來源】:電子科技大學(xué)四川省 211工程院校 985工程院校 教育部直屬院校
【文章頁數(shù)】:82 頁
【學(xué)位級別】:碩士
【部分圖文】:
批歸一化操作過程[73]
電子科技大學(xué)碩士學(xué)位論文12LeNet-5由于模型體量太小,雖然在手寫字體識別上能由不錯的效果,但是對于如今繁雜的計算機視覺任務(wù),其結(jié)構(gòu)并不能滿足需求。而AlexNet在2012年的ImageNet分類任務(wù)一舉顛覆了傳統(tǒng)的計算機視覺認(rèn)知,但是深度仍然不足。牛津大學(xué)視覺組和GoogleDeepMind團隊隨后于2014年提出VGG網(wǎng)絡(luò)[74],但是隨著網(wǎng)絡(luò)層數(shù)的加深,深層特征難以提取,同時也會帶來梯度爆炸問題。何凱明團隊最后提出恒等殘差映射結(jié)構(gòu),一舉將ResNet[75]的網(wǎng)絡(luò)層數(shù)提升到152層,同時也避免了梯度彌散的問題。ResNet的殘差結(jié)構(gòu)如下圖2-2所示:圖2-2殘差結(jié)構(gòu)[75]本實驗主要采用ResNet-50和ResNet-101作為骨架(Backbone)網(wǎng)絡(luò),其參數(shù)結(jié)構(gòu)如下表2-1所示:表2-1ResNet網(wǎng)絡(luò)結(jié)構(gòu)[75]LayerNameOutputSize50-Layer101-LayerConv1256x2567x7,64s=2Pool1128x1283x3maxpool,s=2Block1/conv_x[1×1,643×3,641×1,256]×3[1×1,643×3,641×1,256]×3Block2/conv_x64x64[1×1,1283×3,1281×1,512]×4[1×1,1283×3,1281×1,512]×4Block3/conv_x32x32[1×1,2563×3,2561×1,1024]×6[1×1,2563×3,2561×1,1024]×23Block4/conv_x32x32[1×1,5123×3,5121×1,2048]×3[1×1,5123×3,5121×1,2048]×3ResNet這種殘差連接方式極大地避免了深層網(wǎng)絡(luò)反向傳播的梯度彌散問題,同時這種結(jié)構(gòu)也適用于在語義分割的語義編碼器部分,通過在語義碼器部分融入殘差結(jié)構(gòu)能有效地幫助模型對深層特征和和語義編碼特征進行融合編碼。
第二章基于深度卷積神經(jīng)網(wǎng)絡(luò)的語義分割方法132.2基于深度學(xué)習(xí)的語義分割方法2.2.1編碼器解碼器結(jié)構(gòu)語義分割模型起源于全卷積網(wǎng)絡(luò),他將骨架網(wǎng)絡(luò)最后的全連接層替換為卷積層,實現(xiàn)了像素級的分割任務(wù),目前流行的語義分割網(wǎng)絡(luò)大多都可以分為兩個模塊,編碼器(Encoder)和解碼器(Decoder),編碼器包含兩個部分即為前端的骨架網(wǎng)絡(luò),大多大同小異,和后端語義編碼器,也稱為語義分割頭,這些語義分割模型的性能差異主要體現(xiàn)在后端的語義編碼器以及解碼器的設(shè)計上。骨架網(wǎng)絡(luò)使用池化操作逐漸縮減數(shù)據(jù)的空間尺度,語義編碼器對骨架網(wǎng)絡(luò)提取的特征進行語義編碼獲取語義信息,而解碼器通過反卷積層或者其他的解碼方式來逐步回復(fù)目標(biāo)的細(xì)節(jié)和相應(yīng)的空間信息。編碼解碼器結(jié)構(gòu)如下圖2-3所示:圖2-3編碼器解碼器結(jié)構(gòu)通過設(shè)計優(yōu)秀的語義編碼器可以更有效的提取出深層特征的語義信息進行編碼,而設(shè)計優(yōu)秀的解碼器能更好的從編碼器輸出的編碼特征中提取出有效的特征信息并對其進行解碼。2.2.2全卷積網(wǎng)絡(luò)通常的卷積神經(jīng)網(wǎng)絡(luò)再卷積后會使用若干個全連接層(FullyConnectedLayer,FCLayer)用于產(chǎn)生一個固定長度的特征向量,而這個特征向量通常用于圖像的分類或者回歸任務(wù),不能滿足語義分割的像素級分類需求。全卷積網(wǎng)絡(luò)對圖像進行像素級的分類,從而解決了語義級別的圖像分割(SemanticSegmentation)問題。與經(jīng)典的分類卷積神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)在卷積層之后使用全連接層得到固定長度的特征
【參考文獻】:
期刊論文
[1]基于深度學(xué)習(xí)的高分辨率遙感影像分類研究[J]. 劉大偉,韓玲,韓曉勇. 光學(xué)學(xué)報. 2016(04)
[2]隨機森林在高光譜遙感數(shù)據(jù)中降維與分類的應(yīng)用[J]. 楊珺雯,張錦水,朱秀芳,謝登峰,袁周米琪. 北京師范大學(xué)學(xué)報(自然科學(xué)版). 2015(S1)
[3]基于面向?qū)ο蠓诸惙ǖ母叻直媛蔬b感滑坡信息提取[J]. 張毅,譚龍,陳冠,郭鵬,喬良,孟興民. 蘭州大學(xué)學(xué)報(自然科學(xué)版). 2014(05)
[4]基于Roberts邊緣檢測的面向?qū)ο蠼ㄖ镄畔⑻崛J]. 趙月云,王波. 城市勘測. 2012(02)
[5]基于稀疏表示及光譜信息的高光譜遙感圖像分類[J]. 宋相法,焦李成. 電子與信息學(xué)報. 2012(02)
[6]遙感影像變化檢測自適應(yīng)閾值分割的Kriging方法[J]. 申邵洪,萬幼川,龔浩,賴祖龍. 武漢大學(xué)學(xué)報(信息科學(xué)版). 2009(08)
[7]基于PCA和SVM的高光譜遙感圖像分類研究[J]. 張亮. 光學(xué)技術(shù). 2008(S1)
[8]一種快速提取不透水面的新型遙感指數(shù)[J]. 徐涵秋. 武漢大學(xué)學(xué)報(信息科學(xué)版). 2008(11)
[9]基于SVM算法和紋理特征提取的遙感圖像分類[J]. 丁海勇,卞正富. 計算機工程與設(shè)計. 2008(08)
[10]基于決策樹的遙感影像分類方法研究[J]. 李爽,張二勛. 地域研究與開發(fā). 2003(01)
碩士論文
[1]基于彩色航空影像的陰影檢測算法研究[D]. 王軍利.武漢大學(xué) 2005
本文編號:3136870
【文章來源】:電子科技大學(xué)四川省 211工程院校 985工程院校 教育部直屬院校
【文章頁數(shù)】:82 頁
【學(xué)位級別】:碩士
【部分圖文】:
批歸一化操作過程[73]
電子科技大學(xué)碩士學(xué)位論文12LeNet-5由于模型體量太小,雖然在手寫字體識別上能由不錯的效果,但是對于如今繁雜的計算機視覺任務(wù),其結(jié)構(gòu)并不能滿足需求。而AlexNet在2012年的ImageNet分類任務(wù)一舉顛覆了傳統(tǒng)的計算機視覺認(rèn)知,但是深度仍然不足。牛津大學(xué)視覺組和GoogleDeepMind團隊隨后于2014年提出VGG網(wǎng)絡(luò)[74],但是隨著網(wǎng)絡(luò)層數(shù)的加深,深層特征難以提取,同時也會帶來梯度爆炸問題。何凱明團隊最后提出恒等殘差映射結(jié)構(gòu),一舉將ResNet[75]的網(wǎng)絡(luò)層數(shù)提升到152層,同時也避免了梯度彌散的問題。ResNet的殘差結(jié)構(gòu)如下圖2-2所示:圖2-2殘差結(jié)構(gòu)[75]本實驗主要采用ResNet-50和ResNet-101作為骨架(Backbone)網(wǎng)絡(luò),其參數(shù)結(jié)構(gòu)如下表2-1所示:表2-1ResNet網(wǎng)絡(luò)結(jié)構(gòu)[75]LayerNameOutputSize50-Layer101-LayerConv1256x2567x7,64s=2Pool1128x1283x3maxpool,s=2Block1/conv_x[1×1,643×3,641×1,256]×3[1×1,643×3,641×1,256]×3Block2/conv_x64x64[1×1,1283×3,1281×1,512]×4[1×1,1283×3,1281×1,512]×4Block3/conv_x32x32[1×1,2563×3,2561×1,1024]×6[1×1,2563×3,2561×1,1024]×23Block4/conv_x32x32[1×1,5123×3,5121×1,2048]×3[1×1,5123×3,5121×1,2048]×3ResNet這種殘差連接方式極大地避免了深層網(wǎng)絡(luò)反向傳播的梯度彌散問題,同時這種結(jié)構(gòu)也適用于在語義分割的語義編碼器部分,通過在語義碼器部分融入殘差結(jié)構(gòu)能有效地幫助模型對深層特征和和語義編碼特征進行融合編碼。
第二章基于深度卷積神經(jīng)網(wǎng)絡(luò)的語義分割方法132.2基于深度學(xué)習(xí)的語義分割方法2.2.1編碼器解碼器結(jié)構(gòu)語義分割模型起源于全卷積網(wǎng)絡(luò),他將骨架網(wǎng)絡(luò)最后的全連接層替換為卷積層,實現(xiàn)了像素級的分割任務(wù),目前流行的語義分割網(wǎng)絡(luò)大多都可以分為兩個模塊,編碼器(Encoder)和解碼器(Decoder),編碼器包含兩個部分即為前端的骨架網(wǎng)絡(luò),大多大同小異,和后端語義編碼器,也稱為語義分割頭,這些語義分割模型的性能差異主要體現(xiàn)在后端的語義編碼器以及解碼器的設(shè)計上。骨架網(wǎng)絡(luò)使用池化操作逐漸縮減數(shù)據(jù)的空間尺度,語義編碼器對骨架網(wǎng)絡(luò)提取的特征進行語義編碼獲取語義信息,而解碼器通過反卷積層或者其他的解碼方式來逐步回復(fù)目標(biāo)的細(xì)節(jié)和相應(yīng)的空間信息。編碼解碼器結(jié)構(gòu)如下圖2-3所示:圖2-3編碼器解碼器結(jié)構(gòu)通過設(shè)計優(yōu)秀的語義編碼器可以更有效的提取出深層特征的語義信息進行編碼,而設(shè)計優(yōu)秀的解碼器能更好的從編碼器輸出的編碼特征中提取出有效的特征信息并對其進行解碼。2.2.2全卷積網(wǎng)絡(luò)通常的卷積神經(jīng)網(wǎng)絡(luò)再卷積后會使用若干個全連接層(FullyConnectedLayer,FCLayer)用于產(chǎn)生一個固定長度的特征向量,而這個特征向量通常用于圖像的分類或者回歸任務(wù),不能滿足語義分割的像素級分類需求。全卷積網(wǎng)絡(luò)對圖像進行像素級的分類,從而解決了語義級別的圖像分割(SemanticSegmentation)問題。與經(jīng)典的分類卷積神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)在卷積層之后使用全連接層得到固定長度的特征
【參考文獻】:
期刊論文
[1]基于深度學(xué)習(xí)的高分辨率遙感影像分類研究[J]. 劉大偉,韓玲,韓曉勇. 光學(xué)學(xué)報. 2016(04)
[2]隨機森林在高光譜遙感數(shù)據(jù)中降維與分類的應(yīng)用[J]. 楊珺雯,張錦水,朱秀芳,謝登峰,袁周米琪. 北京師范大學(xué)學(xué)報(自然科學(xué)版). 2015(S1)
[3]基于面向?qū)ο蠓诸惙ǖ母叻直媛蔬b感滑坡信息提取[J]. 張毅,譚龍,陳冠,郭鵬,喬良,孟興民. 蘭州大學(xué)學(xué)報(自然科學(xué)版). 2014(05)
[4]基于Roberts邊緣檢測的面向?qū)ο蠼ㄖ镄畔⑻崛J]. 趙月云,王波. 城市勘測. 2012(02)
[5]基于稀疏表示及光譜信息的高光譜遙感圖像分類[J]. 宋相法,焦李成. 電子與信息學(xué)報. 2012(02)
[6]遙感影像變化檢測自適應(yīng)閾值分割的Kriging方法[J]. 申邵洪,萬幼川,龔浩,賴祖龍. 武漢大學(xué)學(xué)報(信息科學(xué)版). 2009(08)
[7]基于PCA和SVM的高光譜遙感圖像分類研究[J]. 張亮. 光學(xué)技術(shù). 2008(S1)
[8]一種快速提取不透水面的新型遙感指數(shù)[J]. 徐涵秋. 武漢大學(xué)學(xué)報(信息科學(xué)版). 2008(11)
[9]基于SVM算法和紋理特征提取的遙感圖像分類[J]. 丁海勇,卞正富. 計算機工程與設(shè)計. 2008(08)
[10]基于決策樹的遙感影像分類方法研究[J]. 李爽,張二勛. 地域研究與開發(fā). 2003(01)
碩士論文
[1]基于彩色航空影像的陰影檢測算法研究[D]. 王軍利.武漢大學(xué) 2005
本文編號:3136870
本文鏈接:http://sikaile.net/guanlilunwen/gongchengguanli/3136870.html
最近更新
教材專著