基于生成對抗網(wǎng)絡(luò)的遙感圖像場景分類研究
發(fā)布時間:2020-07-21 14:15
【摘要】:遙感圖像分類有著重要的應(yīng)用需求,被廣泛應(yīng)用于自然災(zāi)害檢測、土地資源利用與覆蓋管理等;谏疃忍卣鲗W習的方法由于能夠自動提取特征,不需要大量工程技能和領(lǐng)域?qū)<抑R,而且通過多層提取可以學習到更好的特征表達,因此成為研究熱點。生成對抗網(wǎng)絡(luò)(GAN)作為近年來最具潛力的深度學習方法,將其引入遙感圖像分類領(lǐng)域是一個新的思路。采用合適的數(shù)據(jù)增廣方法和提高判別器的特征提取能力是開展圖像分類研究的關(guān)鍵技術(shù)與難點,本文以GAN理論為基礎(chǔ),針對遙感圖像場景分類提出了更具泛化性能的分類模型。主要研究內(nèi)容包括:分析了現(xiàn)有遙感圖像數(shù)據(jù)集的局限,以及分類方法存在的不足,指出其數(shù)據(jù)集較小,以及由于本身紋理特征難以提取有判別力的特征的困難。通過對GAN現(xiàn)狀的分析,指出其特征提取過程是無監(jiān)督這一局限,以及訓練過程不穩(wěn)定會影響分類結(jié)果這一困難。對機器學習中半監(jiān)督學習的特點進行了分析,指出半監(jiān)督學習在GAN中的適用性。結(jié)合半監(jiān)督學習和GAN,充分利用標簽信息和生成的數(shù)據(jù),對屬于無監(jiān)督特征提取的原始GAN做了改進,建立了基于半監(jiān)督特征提取的生成對抗網(wǎng)絡(luò)分類模型。與現(xiàn)有的監(jiān)督特征提取和無監(jiān)督特征提取的方法相比,半監(jiān)督學習對于網(wǎng)絡(luò)特征提取能力的提高起到了一定的作用,其分類結(jié)果有所提高。通過對原始GAN存在的問題進行分析,指出原始GAN存在訓練不穩(wěn)定、生成圖像多樣性不足的問題,其根本原因在于損失函數(shù)設(shè)計不合理。而WGAN-GP中引入了Wasserstein距離以及梯度懲罰,很好地度量了生成分布和真實分布之間的距離。在WGAN-GP的基礎(chǔ)上,建立了基于WGAN-GP的分類模型。與原始GAN相比,采用合理的損失函數(shù)能夠提高生成圖像質(zhì)量以及多樣性,訓練結(jié)果趨于穩(wěn)定。通過對經(jīng)驗風險最小化理論和鄰域風險最小化理論的分析,指出前者在數(shù)據(jù)量不足的情況下存在的過擬合問題,以及在鄰域風險最小化理論的基礎(chǔ)上提出的mixup數(shù)據(jù)增強方法具有與數(shù)據(jù)無關(guān)的優(yōu)越性。針對半監(jiān)督特征提取網(wǎng)絡(luò)設(shè)計了基于mixup數(shù)據(jù)增廣的生成對抗網(wǎng)絡(luò),該方法有效增廣了數(shù)據(jù),且穩(wěn)定了訓練過程,提高了分類結(jié)果。
【學位授予單位】:華中科技大學
【學位級別】:碩士
【學位授予年份】:2019
【分類號】:TP751;TP18
【圖文】:
華 中 科 技 大 學 碩 士 學 位 論 文一種研究潮流,即語義級遙感圖像場景分類(semantic-levelremotesensing ine classification)。語義級遙感圖像場景分類旨在用特定的語義來標記每個。這里的場景圖像通常是從大規(guī)模遙感圖像中截取的局部圖像塊,這些場包含的類別通常有商業(yè)領(lǐng)域、工業(yè)區(qū)、住宅區(qū)等等,如圖 1-1。
2 生成對抗網(wǎng)絡(luò)基本原理對抗樣本與對抗訓練014 年,Szegedy C 等[33]發(fā)現(xiàn)對于一個訓練好的網(wǎng)絡(luò)模型,將訓練微小的改變,比如加噪聲,會導致模型輸出錯誤的分類結(jié)果。而往人眼識別不出來,但是卻會影響到網(wǎng)絡(luò)的分類結(jié)果,這種在原動,就能使得模型出現(xiàn)誤分類的樣本,被稱為對抗樣本。如圖 2 MNIST 數(shù)據(jù)集中隨機選取的,奇數(shù)列是原始圖像,偶數(shù)列是對本。針對特定模型生成的對抗樣本如圖 2-1(a)其準確率為 0%的樣本如圖 2-1(b)仍然有 51%的準確率。
圖 2-3 GAN 算法的概率解釋圖 2-4 GAN 算法的模型構(gòu)成生成對抗網(wǎng)絡(luò)(Generative Adversarial Networks,GAN)模型啟發(fā)自博弈
本文編號:2764526
【學位授予單位】:華中科技大學
【學位級別】:碩士
【學位授予年份】:2019
【分類號】:TP751;TP18
【圖文】:
華 中 科 技 大 學 碩 士 學 位 論 文一種研究潮流,即語義級遙感圖像場景分類(semantic-levelremotesensing ine classification)。語義級遙感圖像場景分類旨在用特定的語義來標記每個。這里的場景圖像通常是從大規(guī)模遙感圖像中截取的局部圖像塊,這些場包含的類別通常有商業(yè)領(lǐng)域、工業(yè)區(qū)、住宅區(qū)等等,如圖 1-1。
2 生成對抗網(wǎng)絡(luò)基本原理對抗樣本與對抗訓練014 年,Szegedy C 等[33]發(fā)現(xiàn)對于一個訓練好的網(wǎng)絡(luò)模型,將訓練微小的改變,比如加噪聲,會導致模型輸出錯誤的分類結(jié)果。而往人眼識別不出來,但是卻會影響到網(wǎng)絡(luò)的分類結(jié)果,這種在原動,就能使得模型出現(xiàn)誤分類的樣本,被稱為對抗樣本。如圖 2 MNIST 數(shù)據(jù)集中隨機選取的,奇數(shù)列是原始圖像,偶數(shù)列是對本。針對特定模型生成的對抗樣本如圖 2-1(a)其準確率為 0%的樣本如圖 2-1(b)仍然有 51%的準確率。
圖 2-3 GAN 算法的概率解釋圖 2-4 GAN 算法的模型構(gòu)成生成對抗網(wǎng)絡(luò)(Generative Adversarial Networks,GAN)模型啟發(fā)自博弈
【參考文獻】
相關(guān)期刊論文 前1條
1 劉建偉;劉媛;羅雄麟;;半監(jiān)督學習方法[J];計算機學報;2015年08期
本文編號:2764526
本文鏈接:http://sikaile.net/kejilunwen/zidonghuakongzhilunwen/2764526.html
最近更新
教材專著