基于條件生成對(duì)抗網(wǎng)絡(luò)的圖像特征解混與多屬性編輯研究
發(fā)布時(shí)間:2022-07-16 17:35
圖像生成模型的學(xué)習(xí)是計(jì)算機(jī)視覺領(lǐng)域的一個(gè)關(guān)鍵問題。模型旨在擬合圖像數(shù)據(jù)的分布,使其能夠生成不在數(shù)據(jù)集中但符合分布的新樣本。由于圖像分布處于高維空間且十分復(fù)雜,該任務(wù)具有一定難度。隨著深度學(xué)習(xí)的發(fā)展,相繼出現(xiàn)了一系列深度生成模型,其中生成對(duì)抗網(wǎng)絡(luò)(Generative Adversarial Network,GAN)和變分自編碼器(Variational Auto-Encoder,VAE)是兩種廣泛使用的方法。為控制生成的圖像符合指定條件,可在模型中引入額外的條件。本文針對(duì)條件圖像生成任務(wù),從增強(qiáng)生成圖質(zhì)量和多樣性方面入手,對(duì)于條件是類別標(biāo)簽和圖像的情況分別展開研究。本文的研究?jī)?nèi)容及創(chuàng)新點(diǎn)如下:(1)對(duì)于條件是類別標(biāo)簽的情況,在條件變分自編碼器(Conditional Varia-tional Auto-Encoder,CVAE)和條件生成對(duì)抗網(wǎng)絡(luò)(Conditional Generative Adver-sarial Network,CGAN)的混合模型CVAE-GAN的基礎(chǔ)上,提出使用兩個(gè)獨(dú)立的編碼器將特征空間解混為標(biāo)簽相關(guān)和無關(guān)兩個(gè)部分。為解決VAE中的后驗(yàn)崩潰問題,在標(biāo)簽相關(guān)特征...
【文章頁數(shù)】:86 頁
【學(xué)位級(jí)別】:碩士
【文章目錄】:
摘要
Abstract
第一章 緒論
1.1 研究背景與意義
1.2 國(guó)內(nèi)外研究現(xiàn)狀
1.3 數(shù)據(jù)集介紹
1.4 本文研究?jī)?nèi)容及全文組織結(jié)構(gòu)
1.4.1 研究?jī)?nèi)容
1.4.2 全文組織結(jié)構(gòu)
第二章 基礎(chǔ)知識(shí)和相關(guān)技術(shù)
2.1 卷積神經(jīng)網(wǎng)絡(luò)
2.1.1 經(jīng)典網(wǎng)絡(luò)框架
2.2 分布距離度量與圖像評(píng)價(jià)指標(biāo)
2.2.1 分布距離度量
2.2.2 圖像評(píng)價(jià)指標(biāo)
2.3 變分自編碼器
2.3.1 VAE
2.3.2 CVAE
2.4 生成對(duì)抗網(wǎng)絡(luò)
2.4.1 GAN
2.4.2 WGAN
2.4.3 WGAN-GP
2.4.4 SNGAN
2.4.5 CGAN
2.5 VAE與GAN的結(jié)合
2.5.1 VAE/GAN
2.5.2 CVAE-GAN
2.6 圖到圖轉(zhuǎn)換
2.6.1 Star GAN
2.6.2 STGAN
2.6.3 UGAN
2.7 本章小結(jié)
第三章 基于CGAN的圖像特征解混算法
3.1 引言
3.2 圖像特征解混算法
3.2.1 VAE部分的問題描述
3.2.2 標(biāo)簽無關(guān)分支
3.2.3 標(biāo)簽相關(guān)分支
3.2.4 解碼器與判別器
3.2.5 訓(xùn)練過程
3.2.6 半監(jiān)督學(xué)習(xí)拓展
3.3 實(shí)驗(yàn)
3.3.1 人工合成數(shù)據(jù)集示例
3.3.2 圖像生成
3.3.3 特征空間解混分析
3.3.4 半監(jiān)督圖像生成
3.3.5 圖像修復(fù)
3.4 本章小結(jié)
第四章 基于CGAN的多屬性編輯算法
4.1 引言
4.2 多屬性編輯算法
4.2.1 網(wǎng)絡(luò)框架
4.2.2 兩階段訓(xùn)練策略
4.2.3 訓(xùn)練過程
4.3 實(shí)驗(yàn)
4.3.1 實(shí)驗(yàn)細(xì)節(jié)
4.3.2 域插值訓(xùn)練的分析
4.3.3 多解碼器的分析
4.3.4 效果定性評(píng)估
4.3.5 效果定量評(píng)估
4.4 本章小結(jié)
第五章 總結(jié)與展望
5.1 本文總結(jié)
5.2 展望
參考文獻(xiàn)
附錄一 中英文對(duì)照縮略詞表
附錄二 圖像特征解混算法中的數(shù)學(xué)推導(dǎo)
攻讀碩士期間所取得的研究成果
致謝
本文編號(hào):3662959
【文章頁數(shù)】:86 頁
【學(xué)位級(jí)別】:碩士
【文章目錄】:
摘要
Abstract
第一章 緒論
1.1 研究背景與意義
1.2 國(guó)內(nèi)外研究現(xiàn)狀
1.3 數(shù)據(jù)集介紹
1.4 本文研究?jī)?nèi)容及全文組織結(jié)構(gòu)
1.4.1 研究?jī)?nèi)容
1.4.2 全文組織結(jié)構(gòu)
第二章 基礎(chǔ)知識(shí)和相關(guān)技術(shù)
2.1 卷積神經(jīng)網(wǎng)絡(luò)
2.1.1 經(jīng)典網(wǎng)絡(luò)框架
2.2 分布距離度量與圖像評(píng)價(jià)指標(biāo)
2.2.1 分布距離度量
2.2.2 圖像評(píng)價(jià)指標(biāo)
2.3 變分自編碼器
2.3.1 VAE
2.3.2 CVAE
2.4 生成對(duì)抗網(wǎng)絡(luò)
2.4.1 GAN
2.4.2 WGAN
2.4.3 WGAN-GP
2.4.4 SNGAN
2.4.5 CGAN
2.5 VAE與GAN的結(jié)合
2.5.1 VAE/GAN
2.5.2 CVAE-GAN
2.6 圖到圖轉(zhuǎn)換
2.6.1 Star GAN
2.6.2 STGAN
2.6.3 UGAN
2.7 本章小結(jié)
第三章 基于CGAN的圖像特征解混算法
3.1 引言
3.2 圖像特征解混算法
3.2.1 VAE部分的問題描述
3.2.2 標(biāo)簽無關(guān)分支
3.2.3 標(biāo)簽相關(guān)分支
3.2.4 解碼器與判別器
3.2.5 訓(xùn)練過程
3.2.6 半監(jiān)督學(xué)習(xí)拓展
3.3 實(shí)驗(yàn)
3.3.1 人工合成數(shù)據(jù)集示例
3.3.2 圖像生成
3.3.3 特征空間解混分析
3.3.4 半監(jiān)督圖像生成
3.3.5 圖像修復(fù)
3.4 本章小結(jié)
第四章 基于CGAN的多屬性編輯算法
4.1 引言
4.2 多屬性編輯算法
4.2.1 網(wǎng)絡(luò)框架
4.2.2 兩階段訓(xùn)練策略
4.2.3 訓(xùn)練過程
4.3 實(shí)驗(yàn)
4.3.1 實(shí)驗(yàn)細(xì)節(jié)
4.3.2 域插值訓(xùn)練的分析
4.3.3 多解碼器的分析
4.3.4 效果定性評(píng)估
4.3.5 效果定量評(píng)估
4.4 本章小結(jié)
第五章 總結(jié)與展望
5.1 本文總結(jié)
5.2 展望
參考文獻(xiàn)
附錄一 中英文對(duì)照縮略詞表
附錄二 圖像特征解混算法中的數(shù)學(xué)推導(dǎo)
攻讀碩士期間所取得的研究成果
致謝
本文編號(hào):3662959
本文鏈接:http://sikaile.net/kejilunwen/shengwushengchang/3662959.html
最近更新
教材專著