基于生成對(duì)抗網(wǎng)絡(luò)的圖像數(shù)據(jù)增強(qiáng)方法研究
發(fā)布時(shí)間:2021-09-03 06:53
傳統(tǒng)數(shù)據(jù)增強(qiáng)發(fā)展至今衍生出許多方法,但由于始終都是在原始圖像上進(jìn)行變換,對(duì)于分類(lèi)性能的提升依然十分有限,即使后來(lái)出現(xiàn)了 AutoAugment等自動(dòng)化搜索數(shù)據(jù)增強(qiáng)策略,也只是簡(jiǎn)化了策略選擇流程,本質(zhì)上并未對(duì)數(shù)據(jù)集的分類(lèi)性能帶來(lái)很大的提升。隨著生成對(duì)抗網(wǎng)絡(luò)(GAN)的興起,GAN可以根據(jù)已有數(shù)據(jù)集的高維特征進(jìn)行組合,生成與原始數(shù)據(jù)集完全不同的圖像,相比于傳統(tǒng)的數(shù)據(jù)增強(qiáng)方法,可以為神經(jīng)網(wǎng)絡(luò)提供更多的圖像特征,經(jīng)過(guò)精心設(shè)計(jì)的生成對(duì)抗網(wǎng)絡(luò)可以生成與原始圖像相似且清晰的圖像,但同時(shí)GAN也存在訓(xùn)練不穩(wěn)定、生成圖像質(zhì)量不高、無(wú)法生成指定標(biāo)簽圖像、生成圖像中包含噪聲數(shù)據(jù)等問(wèn)題,因此本文針對(duì)這些問(wèn)題提出了一種基于生成對(duì)抗網(wǎng)絡(luò)的數(shù)據(jù)增強(qiáng)方法,主要研究成果如下:1.針對(duì)普通GAN訓(xùn)練不穩(wěn)定、生成圖像質(zhì)量不高、無(wú)法指定生成圖像類(lèi)別等問(wèn)題,結(jié)合WGAN-GP和ACGAN的優(yōu)點(diǎn)設(shè)計(jì)了一種生成對(duì)抗網(wǎng)絡(luò)模型DAGAN-GP,結(jié)合梯度懲罰(gradientpenalty)設(shè)計(jì)了新的損失函數(shù)。同時(shí)引入了一系列的優(yōu)化策略:標(biāo)簽平滑(label smoothing)、小批量判別(Minibatch Discriminati...
【文章來(lái)源】:華中師范大學(xué)湖北省 211工程院校 教育部直屬院校
【文章頁(yè)數(shù)】:69 頁(yè)
【學(xué)位級(jí)別】:碩士
【部分圖文】:
圖1.1本文提出的DAGAN-GP模型框架??主要改進(jìn)有如下幾點(diǎn):引入梯度懲罰(radientenalt),設(shè)計(jì)了新的損失函數(shù);??
碩士學(xué)位論文??MASTER'S?THF.SIS??據(jù)集的質(zhì)量,本文最終數(shù)據(jù)增強(qiáng)具體流程如圖1.2所示。最后通過(guò)在各實(shí)驗(yàn)數(shù)據(jù)集??上的對(duì)比實(shí)驗(yàn)驗(yàn)證了算法在數(shù)據(jù)選擇上的有效性。??;?*???*?VGG19????I?|原始數(shù)捤集?|—?—?{?vggi9-f?| ̄>|?Eyy-urr?| ̄ ̄?|?增翻據(jù)集]|??—*|?DAGAK-GP?| ̄ ̄生成數(shù)據(jù)集?|—??數(shù)據(jù)生成?i特征提取?數(shù)據(jù)迭擇;增強(qiáng)結(jié)果??圖1.2本文所提出的結(jié)合DAGAN-GP和ENN-IHT的數(shù)據(jù)增強(qiáng)方法流程圖??1.4論文組織結(jié)構(gòu)??本文分為五章,具體組織結(jié)構(gòu)安排如下:??第一章,緒論,主要闡述了基于生成對(duì)抗網(wǎng)絡(luò)進(jìn)行數(shù)據(jù)增強(qiáng)的研究背景與研究??意義,通過(guò)梳理文獻(xiàn)和領(lǐng)域內(nèi)的研宄成果,分析對(duì)比了當(dāng)前該領(lǐng)域的現(xiàn)狀,在本章??的結(jié)尾主要闡述了本文的成果和論文組織結(jié)構(gòu)安排。??第二章,圖像數(shù)據(jù)增強(qiáng)技術(shù),重點(diǎn)闡述了關(guān)于數(shù)據(jù)增強(qiáng)的部分技術(shù)及其原理,??首先介紹了傳統(tǒng)數(shù)據(jù)增強(qiáng)的方法,然后詳細(xì)闡述了生成對(duì)抗網(wǎng)絡(luò)的原理和常見(jiàn)變體,??及其在數(shù)據(jù)增強(qiáng)方面的應(yīng)用。??第三章,基于ACGAN和WGAN-GP的數(shù)據(jù)增強(qiáng)算法,闡述了?DAGAN-GP的??原理,詳細(xì)介紹了?DAGAN-GP的模型結(jié)構(gòu)和優(yōu)化方法。選取了合適的GAN評(píng)價(jià)指??標(biāo),并在兩個(gè)常用圖像識(shí)別數(shù)據(jù)集上進(jìn)行了實(shí)驗(yàn)驗(yàn)證。最后設(shè)置對(duì)照組驗(yàn)證了??DAGAN-GP在數(shù)據(jù)增強(qiáng)上的效果。??第四章,基于編輯最近鄰和實(shí)例硬度閾值的數(shù)據(jù)選擇算法,針對(duì)DAGAN-GP??生成的部分圖像質(zhì)量不高而影響分類(lèi)性能的問(wèn)題,提出了一種數(shù)據(jù)選擇方法ENN-??IHT,并在實(shí)驗(yàn)數(shù)據(jù)集上進(jìn)行驗(yàn)證。??第五章,總結(jié)與展
#碩士學(xué)位論文??MASTER'S?THESIS?????2圖像數(shù)據(jù)增強(qiáng)技術(shù)??隨著研宄人員的不斷深入,各種圖像數(shù)據(jù)增強(qiáng)方法層出不窮。傳統(tǒng)增強(qiáng)方法從??簡(jiǎn)單的空間變換如平移、旋轉(zhuǎn)等,發(fā)展到更復(fù)雜的頻域變換如RGB變換、極坐標(biāo)??變換等。生成式模型從自編碼器發(fā)展到變分自編碼器,到現(xiàn)在的生成對(duì)抗網(wǎng)絡(luò)。本??章對(duì)傳統(tǒng)圖像數(shù)據(jù)增強(qiáng)、自編碼器、生成對(duì)抗網(wǎng)絡(luò)等數(shù)據(jù)增強(qiáng)方法的原理和發(fā)展進(jìn)??行介紹,同時(shí)進(jìn)行對(duì)比,奠定本文的理論基矗??2.1傳統(tǒng)圖像數(shù)據(jù)增強(qiáng)??2.1.1幾何變換類(lèi)??常見(jiàn)的幾何變換類(lèi)一般就是對(duì)圖像進(jìn)行簡(jiǎn)單的變換,包括翻轉(zhuǎn),旋轉(zhuǎn),裁剪,??等各類(lèi)操作。圖2.1展示了一些常見(jiàn)的操作效果:??(a)上下翻轉(zhuǎn)和左右翻轉(zhuǎn)?(b)隨機(jī)旋轉(zhuǎn)??%m\?m??(C)隨機(jī)裁剪?(d)縮放拉伸??圖2.1常見(jiàn)的幾種幾何變換操作??2.1.2顏色變換類(lèi)??與2.1.1節(jié)中介紹的幾何變換不同的是顏色變化會(huì)改變圖像本身的內(nèi)容。此類(lèi)??變換主要是通過(guò)顏色變換來(lái)的將數(shù)據(jù)增強(qiáng),奴前得到廣泛應(yīng)用的有噪聲、擦除、填??充等等。??顏色變換最常見(jiàn)的是基于噪聲的,它主要就是添加一些噪聲在原本的圖像上,??7??
【參考文獻(xiàn)】:
期刊論文
[1]基于生成式對(duì)抗神經(jīng)網(wǎng)絡(luò)的手寫(xiě)文字圖像補(bǔ)全[J]. 李農(nóng)勤,楊維信. 圖學(xué)學(xué)報(bào). 2019(05)
[2]結(jié)合全卷積網(wǎng)絡(luò)與CycleGAN的圖像實(shí)例風(fēng)格遷移[J]. 劉哲良,朱瑋,袁梓洋. 中國(guó)圖象圖形學(xué)報(bào). 2019(08)
[3]生成對(duì)抗網(wǎng)絡(luò)圖像處理綜述[J]. 朱秀昌,唐貴進(jìn). 南京郵電大學(xué)學(xué)報(bào)(自然科學(xué)版). 2019(03)
[4]基于GAN生成對(duì)抗網(wǎng)絡(luò)的圖像去噪及去噪原理的探究[J]. 梁威鵬,洪盛偉. 科技資訊. 2019(13)
[5]基于GAN的圖像超分辨率方法研究[J]. 王旺,徐俊武. 軟件導(dǎo)刊. 2019(06)
[6]基于深度卷積神經(jīng)網(wǎng)絡(luò)的街景門(mén)牌號(hào)識(shí)別方法[J]. 韓鵬承,胡西川. 現(xiàn)代計(jì)算機(jī)(專(zhuān)業(yè)版). 2018(20)
[7]MNIST郵政編碼手寫(xiě)數(shù)字識(shí)別的研究[J]. 崔海霞,楊紅,劉佐濂. 廣州大學(xué)學(xué)報(bào)(自然科學(xué)版). 2009(04)
本文編號(hào):3380634
【文章來(lái)源】:華中師范大學(xué)湖北省 211工程院校 教育部直屬院校
【文章頁(yè)數(shù)】:69 頁(yè)
【學(xué)位級(jí)別】:碩士
【部分圖文】:
圖1.1本文提出的DAGAN-GP模型框架??主要改進(jìn)有如下幾點(diǎn):引入梯度懲罰(radientenalt),設(shè)計(jì)了新的損失函數(shù);??
碩士學(xué)位論文??MASTER'S?THF.SIS??據(jù)集的質(zhì)量,本文最終數(shù)據(jù)增強(qiáng)具體流程如圖1.2所示。最后通過(guò)在各實(shí)驗(yàn)數(shù)據(jù)集??上的對(duì)比實(shí)驗(yàn)驗(yàn)證了算法在數(shù)據(jù)選擇上的有效性。??;?*???*?VGG19????I?|原始數(shù)捤集?|—?—?{?vggi9-f?| ̄>|?Eyy-urr?| ̄ ̄?|?增翻據(jù)集]|??—*|?DAGAK-GP?| ̄ ̄生成數(shù)據(jù)集?|—??數(shù)據(jù)生成?i特征提取?數(shù)據(jù)迭擇;增強(qiáng)結(jié)果??圖1.2本文所提出的結(jié)合DAGAN-GP和ENN-IHT的數(shù)據(jù)增強(qiáng)方法流程圖??1.4論文組織結(jié)構(gòu)??本文分為五章,具體組織結(jié)構(gòu)安排如下:??第一章,緒論,主要闡述了基于生成對(duì)抗網(wǎng)絡(luò)進(jìn)行數(shù)據(jù)增強(qiáng)的研究背景與研究??意義,通過(guò)梳理文獻(xiàn)和領(lǐng)域內(nèi)的研宄成果,分析對(duì)比了當(dāng)前該領(lǐng)域的現(xiàn)狀,在本章??的結(jié)尾主要闡述了本文的成果和論文組織結(jié)構(gòu)安排。??第二章,圖像數(shù)據(jù)增強(qiáng)技術(shù),重點(diǎn)闡述了關(guān)于數(shù)據(jù)增強(qiáng)的部分技術(shù)及其原理,??首先介紹了傳統(tǒng)數(shù)據(jù)增強(qiáng)的方法,然后詳細(xì)闡述了生成對(duì)抗網(wǎng)絡(luò)的原理和常見(jiàn)變體,??及其在數(shù)據(jù)增強(qiáng)方面的應(yīng)用。??第三章,基于ACGAN和WGAN-GP的數(shù)據(jù)增強(qiáng)算法,闡述了?DAGAN-GP的??原理,詳細(xì)介紹了?DAGAN-GP的模型結(jié)構(gòu)和優(yōu)化方法。選取了合適的GAN評(píng)價(jià)指??標(biāo),并在兩個(gè)常用圖像識(shí)別數(shù)據(jù)集上進(jìn)行了實(shí)驗(yàn)驗(yàn)證。最后設(shè)置對(duì)照組驗(yàn)證了??DAGAN-GP在數(shù)據(jù)增強(qiáng)上的效果。??第四章,基于編輯最近鄰和實(shí)例硬度閾值的數(shù)據(jù)選擇算法,針對(duì)DAGAN-GP??生成的部分圖像質(zhì)量不高而影響分類(lèi)性能的問(wèn)題,提出了一種數(shù)據(jù)選擇方法ENN-??IHT,并在實(shí)驗(yàn)數(shù)據(jù)集上進(jìn)行驗(yàn)證。??第五章,總結(jié)與展
#碩士學(xué)位論文??MASTER'S?THESIS?????2圖像數(shù)據(jù)增強(qiáng)技術(shù)??隨著研宄人員的不斷深入,各種圖像數(shù)據(jù)增強(qiáng)方法層出不窮。傳統(tǒng)增強(qiáng)方法從??簡(jiǎn)單的空間變換如平移、旋轉(zhuǎn)等,發(fā)展到更復(fù)雜的頻域變換如RGB變換、極坐標(biāo)??變換等。生成式模型從自編碼器發(fā)展到變分自編碼器,到現(xiàn)在的生成對(duì)抗網(wǎng)絡(luò)。本??章對(duì)傳統(tǒng)圖像數(shù)據(jù)增強(qiáng)、自編碼器、生成對(duì)抗網(wǎng)絡(luò)等數(shù)據(jù)增強(qiáng)方法的原理和發(fā)展進(jìn)??行介紹,同時(shí)進(jìn)行對(duì)比,奠定本文的理論基矗??2.1傳統(tǒng)圖像數(shù)據(jù)增強(qiáng)??2.1.1幾何變換類(lèi)??常見(jiàn)的幾何變換類(lèi)一般就是對(duì)圖像進(jìn)行簡(jiǎn)單的變換,包括翻轉(zhuǎn),旋轉(zhuǎn),裁剪,??等各類(lèi)操作。圖2.1展示了一些常見(jiàn)的操作效果:??(a)上下翻轉(zhuǎn)和左右翻轉(zhuǎn)?(b)隨機(jī)旋轉(zhuǎn)??%m\?m??(C)隨機(jī)裁剪?(d)縮放拉伸??圖2.1常見(jiàn)的幾種幾何變換操作??2.1.2顏色變換類(lèi)??與2.1.1節(jié)中介紹的幾何變換不同的是顏色變化會(huì)改變圖像本身的內(nèi)容。此類(lèi)??變換主要是通過(guò)顏色變換來(lái)的將數(shù)據(jù)增強(qiáng),奴前得到廣泛應(yīng)用的有噪聲、擦除、填??充等等。??顏色變換最常見(jiàn)的是基于噪聲的,它主要就是添加一些噪聲在原本的圖像上,??7??
【參考文獻(xiàn)】:
期刊論文
[1]基于生成式對(duì)抗神經(jīng)網(wǎng)絡(luò)的手寫(xiě)文字圖像補(bǔ)全[J]. 李農(nóng)勤,楊維信. 圖學(xué)學(xué)報(bào). 2019(05)
[2]結(jié)合全卷積網(wǎng)絡(luò)與CycleGAN的圖像實(shí)例風(fēng)格遷移[J]. 劉哲良,朱瑋,袁梓洋. 中國(guó)圖象圖形學(xué)報(bào). 2019(08)
[3]生成對(duì)抗網(wǎng)絡(luò)圖像處理綜述[J]. 朱秀昌,唐貴進(jìn). 南京郵電大學(xué)學(xué)報(bào)(自然科學(xué)版). 2019(03)
[4]基于GAN生成對(duì)抗網(wǎng)絡(luò)的圖像去噪及去噪原理的探究[J]. 梁威鵬,洪盛偉. 科技資訊. 2019(13)
[5]基于GAN的圖像超分辨率方法研究[J]. 王旺,徐俊武. 軟件導(dǎo)刊. 2019(06)
[6]基于深度卷積神經(jīng)網(wǎng)絡(luò)的街景門(mén)牌號(hào)識(shí)別方法[J]. 韓鵬承,胡西川. 現(xiàn)代計(jì)算機(jī)(專(zhuān)業(yè)版). 2018(20)
[7]MNIST郵政編碼手寫(xiě)數(shù)字識(shí)別的研究[J]. 崔海霞,楊紅,劉佐濂. 廣州大學(xué)學(xué)報(bào)(自然科學(xué)版). 2009(04)
本文編號(hào):3380634
本文鏈接:http://sikaile.net/kejilunwen/zidonghuakongzhilunwen/3380634.html
最近更新
教材專(zhuān)著