結合數(shù)據(jù)增廣和遷移學習的高分辨率遙感影像場景分類
發(fā)布時間:2021-09-25 17:25
深度學習在計算機視覺領域取得了顯著的成果,如圖像分類、人臉識別、圖像檢索等。對于遙感領域而言,獲取用于訓練CNN的有標簽數(shù)據(jù)集通常是一個重大挑戰(zhàn)。本文研究了如何將CNN用于高分辨率遙感影像的場景分類,為了克服缺乏大量有標簽遙感影像數(shù)據(jù)集的問題,結合CNN采用了兩種技術:數(shù)據(jù)增廣和遷移學習。在UC Merced Land Use數(shù)據(jù)集上,驗證了VGG16、VGG19、Res Net50、InceptionV3、Dense Net121等5種網(wǎng)絡的性能,分別達到了98. 10%、96. 19%、99. 05%、97. 62%、99. 52%的分類準確率。
【文章來源】:測繪通報. 2020,(02)北大核心CSCD
【文章頁數(shù)】:6 頁
【部分圖文】:
卷積神經(jīng)網(wǎng)絡結構
遙感影像特征的有效提取和表達是場景分類中的重點,相比于傳統(tǒng)的特征提取方法(如SIFT、HOG、GIST等),CNN能夠對輸入圖像逐層提取從底層到高層的特征,創(chuàng)立底層信號到高層語義特征的映射信息,充分降低了高分影像底層視覺表達與高層語義信息之間的“鴻溝”。CNN用于遙感影像場景分類的流程如圖2所示。模型主要包括兩個部分:特征提取和分類。首先將有標簽數(shù)據(jù)集隨機分為訓練數(shù)據(jù)集和測試數(shù)據(jù)集,訓練數(shù)據(jù)集輸入CNN模型后,經(jīng)過前向傳播(feed forward,FF)得到模型輸出;然后計算模型輸出和實際數(shù)據(jù)標簽的誤差,根據(jù)誤差求導計算梯度,通過反向傳播(back propagation,BP)更新網(wǎng)絡,如此往復便可訓練出優(yōu)化的CNN模型;最后通過Softmax分類器獲得分類結果。
由于訓練CNN模型需要足夠數(shù)量的有標簽數(shù)據(jù),但實際應用中收集如此多的有標簽遙感影像數(shù)據(jù)集是個難題。面對遙感領域有標簽數(shù)據(jù)集匱乏的問題,筆者采用遷移學習[14](transfer learning)方法,運用已有知識和模型學習相關領域問題,可有效解決有標簽遙感影像數(shù)據(jù)不足的問題。ImageNet是當下最大的圖像識別數(shù)據(jù)庫,樣本多樣性強且類別覆蓋范圍廣。高分辨率遙感影像在圖像紋理、線條、色彩、結構上的特征與ImageNet圖像有很多的相似之處,因此,本文使用遷移學習策略,將從ImageNet上學習到的權重作為模型的初始權重,而不是隨機確定初始權重從頭開始訓練;然后使用UC Merced Land Use數(shù)據(jù)集對預訓練CNN模型進行微調(finetune),使用一個較小的學習率(learning rate)通過繼續(xù)反向傳播對CNN網(wǎng)絡的權重進行優(yōu)化,可以微調網(wǎng)絡的所有層,或者凍結前面的幾層,僅微調網(wǎng)絡中較高的層,使得僅需少量的有標簽遙感影像數(shù)據(jù)便可獲得很好的分類效果。該策略不僅能有效解決小樣本數(shù)據(jù)訓練模型易產(chǎn)生的過擬合問題,同時也能夠大大縮減模型訓練的時間。使用遷移學習策略進行遙感影像場景分類的流程如圖3所示。2 試驗及結果分析
【參考文獻】:
期刊論文
[1]基于CNN模型的遙感圖像復雜場景分類[J]. 張康,黑保琴,李盛陽,邵雨陽. 國土資源遙感. 2018(04)
[2]融合全局和局部深度特征的高分辨率遙感影像場景分類方法[J]. 龔希,吳亮,謝忠,陳占龍,劉袁緣,俞侃. 光學學報. 2019(03)
[3]基于深度學習AlexNet的遙感影像地表覆蓋分類評價研究[J]. 黨宇,張繼賢,鄧喀中,趙有松,余凡. 地球信息科學學報. 2017(11)
[4]基于CNN模型的高分辨率遙感圖像目標識別[J]. 曲景影,孫顯,高鑫. 國外電子測量技術. 2016(08)
[5]高分辨率對地觀測的若干前沿科學問題[J]. 李德仁,童慶禧,李榮興,龔健雅,張良培. 中國科學:地球科學. 2012(06)
本文編號:3410140
【文章來源】:測繪通報. 2020,(02)北大核心CSCD
【文章頁數(shù)】:6 頁
【部分圖文】:
卷積神經(jīng)網(wǎng)絡結構
遙感影像特征的有效提取和表達是場景分類中的重點,相比于傳統(tǒng)的特征提取方法(如SIFT、HOG、GIST等),CNN能夠對輸入圖像逐層提取從底層到高層的特征,創(chuàng)立底層信號到高層語義特征的映射信息,充分降低了高分影像底層視覺表達與高層語義信息之間的“鴻溝”。CNN用于遙感影像場景分類的流程如圖2所示。模型主要包括兩個部分:特征提取和分類。首先將有標簽數(shù)據(jù)集隨機分為訓練數(shù)據(jù)集和測試數(shù)據(jù)集,訓練數(shù)據(jù)集輸入CNN模型后,經(jīng)過前向傳播(feed forward,FF)得到模型輸出;然后計算模型輸出和實際數(shù)據(jù)標簽的誤差,根據(jù)誤差求導計算梯度,通過反向傳播(back propagation,BP)更新網(wǎng)絡,如此往復便可訓練出優(yōu)化的CNN模型;最后通過Softmax分類器獲得分類結果。
由于訓練CNN模型需要足夠數(shù)量的有標簽數(shù)據(jù),但實際應用中收集如此多的有標簽遙感影像數(shù)據(jù)集是個難題。面對遙感領域有標簽數(shù)據(jù)集匱乏的問題,筆者采用遷移學習[14](transfer learning)方法,運用已有知識和模型學習相關領域問題,可有效解決有標簽遙感影像數(shù)據(jù)不足的問題。ImageNet是當下最大的圖像識別數(shù)據(jù)庫,樣本多樣性強且類別覆蓋范圍廣。高分辨率遙感影像在圖像紋理、線條、色彩、結構上的特征與ImageNet圖像有很多的相似之處,因此,本文使用遷移學習策略,將從ImageNet上學習到的權重作為模型的初始權重,而不是隨機確定初始權重從頭開始訓練;然后使用UC Merced Land Use數(shù)據(jù)集對預訓練CNN模型進行微調(finetune),使用一個較小的學習率(learning rate)通過繼續(xù)反向傳播對CNN網(wǎng)絡的權重進行優(yōu)化,可以微調網(wǎng)絡的所有層,或者凍結前面的幾層,僅微調網(wǎng)絡中較高的層,使得僅需少量的有標簽遙感影像數(shù)據(jù)便可獲得很好的分類效果。該策略不僅能有效解決小樣本數(shù)據(jù)訓練模型易產(chǎn)生的過擬合問題,同時也能夠大大縮減模型訓練的時間。使用遷移學習策略進行遙感影像場景分類的流程如圖3所示。2 試驗及結果分析
【參考文獻】:
期刊論文
[1]基于CNN模型的遙感圖像復雜場景分類[J]. 張康,黑保琴,李盛陽,邵雨陽. 國土資源遙感. 2018(04)
[2]融合全局和局部深度特征的高分辨率遙感影像場景分類方法[J]. 龔希,吳亮,謝忠,陳占龍,劉袁緣,俞侃. 光學學報. 2019(03)
[3]基于深度學習AlexNet的遙感影像地表覆蓋分類評價研究[J]. 黨宇,張繼賢,鄧喀中,趙有松,余凡. 地球信息科學學報. 2017(11)
[4]基于CNN模型的高分辨率遙感圖像目標識別[J]. 曲景影,孫顯,高鑫. 國外電子測量技術. 2016(08)
[5]高分辨率對地觀測的若干前沿科學問題[J]. 李德仁,童慶禧,李榮興,龔健雅,張良培. 中國科學:地球科學. 2012(06)
本文編號:3410140
本文鏈接:http://sikaile.net/guanlilunwen/gongchengguanli/3410140.html
最近更新
教材專著