基于深度學(xué)習(xí)的人物圖像生成模型研究
發(fā)布時(shí)間:2021-05-08 06:03
隨著深度學(xué)習(xí)與卷積神經(jīng)網(wǎng)絡(luò)的發(fā)展,計(jì)算機(jī)視覺(jué)領(lǐng)域的研究范圍也得到了擴(kuò)展,其中很重要的一項(xiàng)包括生成式模型的研究。生成式模型體現(xiàn)了計(jì)算機(jī)對(duì)大量樣本數(shù)據(jù)進(jìn)行建模的能力。盡管目前已經(jīng)有不少的生成式模型陸續(xù)被提出,但這些模型用于圖像生成時(shí),生成圖像的質(zhì)量依然沒(méi)有達(dá)到令人滿(mǎn)意的效果,尤其是空間結(jié)構(gòu)比較復(fù)雜的圖像,例如全身人物圖像。針對(duì)以上提出的一些問(wèn)題,本篇論文中提出了兩種人物圖像生成模型,一種是基于姿勢(shì)的人物圖像生成模型,另一種是基于單張圖像的人物姿勢(shì)變換模型。雖然兩種模型在名字上有些差異,其本質(zhì)都是根據(jù)不同的輸入條件生成一張人物圖像。第一種模型接收一張簡(jiǎn)單的人體姿勢(shì)圖(2維骨架圖)作為輸入,輸出一張對(duì)應(yīng)姿勢(shì)的人物圖像。該模型采用的是一個(gè)條件式生成對(duì)抗網(wǎng)絡(luò)的結(jié)構(gòu);第二種模型則接收兩個(gè)條件作為輸入,一張目標(biāo)姿勢(shì)圖和一張真實(shí)人物圖像,輸出對(duì)應(yīng)姿勢(shì)的真實(shí)人物圖像,且要保留輸入人物圖像的外貌信息,這樣就實(shí)現(xiàn)了人物的姿勢(shì)轉(zhuǎn)換。該模型是在上一個(gè)模型的基礎(chǔ)上融合一個(gè)變分自動(dòng)編碼器的結(jié)構(gòu),形成了一個(gè)混合式的生成模型,因此,該模型同時(shí)擁有生成對(duì)抗網(wǎng)絡(luò)和變分自動(dòng)編碼器的優(yōu)點(diǎn)。此外,為了提高生成圖像的質(zhì)量,兩個(gè)模型中...
【文章來(lái)源】:湖南大學(xué)湖南省 211工程院校 985工程院校 教育部直屬院校
【文章頁(yè)數(shù)】:62 頁(yè)
【學(xué)位級(jí)別】:碩士
【文章目錄】:
摘要
Abstract
第1章 緒論
1.1 研究背景
1.2 國(guó)內(nèi)外研究現(xiàn)狀
1.2.1 基于自回歸模型的圖像生成
1.2.2 基于變分自動(dòng)編碼器的圖像生成
1.2.3 基于生成對(duì)抗網(wǎng)絡(luò)的圖像生成
1.2.4 人物圖像生成
1.3 研究意義與主要研究工作
1.4 論文組織結(jié)構(gòu)
第2章 理論基礎(chǔ)及相關(guān)技術(shù)
2.1 神經(jīng)網(wǎng)絡(luò)的前向傳播
2.2 神經(jīng)網(wǎng)絡(luò)的優(yōu)化算法
2.3 卷積神經(jīng)網(wǎng)絡(luò)
2.4 殘差網(wǎng)絡(luò)
2.5 小結(jié)
第3章 基于姿勢(shì)的人物圖片生成
3.1 算法思想
3.2 模型搭建
3.2.1 生成網(wǎng)絡(luò)
3.2.2 判別網(wǎng)絡(luò)
3.3 目標(biāo)函數(shù)
3.3.1 內(nèi)容損失函數(shù)
3.3.2 總體目標(biāo)函數(shù)
3.4 實(shí)驗(yàn)細(xì)節(jié)
3.4.1 訓(xùn)練流程
3.4.2 參數(shù)設(shè)置
3.5 實(shí)驗(yàn)結(jié)果
3.6 小結(jié)
第4章 基于單張圖片的人物姿勢(shì)變換
4.1 算法思想
4.2 模型搭建
4.3 目標(biāo)函數(shù)
4.3.1 格拉姆矩陣與風(fēng)格損失函數(shù)
4.3.2 標(biāo)準(zhǔn)風(fēng)格損失函數(shù)的缺陷
4.3.3 多尺度風(fēng)格損失
4.3.4 總體目標(biāo)函數(shù)
4.4 實(shí)現(xiàn)細(xì)節(jié)
4.5 實(shí)驗(yàn)結(jié)果
4.6 小結(jié)
第5章 對(duì)比實(shí)驗(yàn)與結(jié)果分析
5.1 實(shí)驗(yàn)環(huán)境
5.2 數(shù)據(jù)預(yù)處理
5.2.1 DeepFashion數(shù)據(jù)集
5.2.2 人體姿態(tài)估計(jì)
5.3 評(píng)估標(biāo)準(zhǔn)
5.3.1 峰值信噪比(PSNR)
5.3.2 結(jié)構(gòu)相似性指數(shù)(SSIM)
5.3.3 Inception Score
5.4對(duì)比實(shí)驗(yàn)
5.5 局限性
5.6 小結(jié)
結(jié)論
參考文獻(xiàn)
致謝
附錄A 發(fā)表論文和參加科研情況說(shuō)明
本文編號(hào):3174813
【文章來(lái)源】:湖南大學(xué)湖南省 211工程院校 985工程院校 教育部直屬院校
【文章頁(yè)數(shù)】:62 頁(yè)
【學(xué)位級(jí)別】:碩士
【文章目錄】:
摘要
Abstract
第1章 緒論
1.1 研究背景
1.2 國(guó)內(nèi)外研究現(xiàn)狀
1.2.1 基于自回歸模型的圖像生成
1.2.2 基于變分自動(dòng)編碼器的圖像生成
1.2.3 基于生成對(duì)抗網(wǎng)絡(luò)的圖像生成
1.2.4 人物圖像生成
1.3 研究意義與主要研究工作
1.4 論文組織結(jié)構(gòu)
第2章 理論基礎(chǔ)及相關(guān)技術(shù)
2.1 神經(jīng)網(wǎng)絡(luò)的前向傳播
2.2 神經(jīng)網(wǎng)絡(luò)的優(yōu)化算法
2.3 卷積神經(jīng)網(wǎng)絡(luò)
2.4 殘差網(wǎng)絡(luò)
2.5 小結(jié)
第3章 基于姿勢(shì)的人物圖片生成
3.1 算法思想
3.2 模型搭建
3.2.1 生成網(wǎng)絡(luò)
3.2.2 判別網(wǎng)絡(luò)
3.3 目標(biāo)函數(shù)
3.3.1 內(nèi)容損失函數(shù)
3.3.2 總體目標(biāo)函數(shù)
3.4 實(shí)驗(yàn)細(xì)節(jié)
3.4.1 訓(xùn)練流程
3.4.2 參數(shù)設(shè)置
3.5 實(shí)驗(yàn)結(jié)果
3.6 小結(jié)
第4章 基于單張圖片的人物姿勢(shì)變換
4.1 算法思想
4.2 模型搭建
4.3 目標(biāo)函數(shù)
4.3.1 格拉姆矩陣與風(fēng)格損失函數(shù)
4.3.2 標(biāo)準(zhǔn)風(fēng)格損失函數(shù)的缺陷
4.3.3 多尺度風(fēng)格損失
4.3.4 總體目標(biāo)函數(shù)
4.4 實(shí)現(xiàn)細(xì)節(jié)
4.5 實(shí)驗(yàn)結(jié)果
4.6 小結(jié)
第5章 對(duì)比實(shí)驗(yàn)與結(jié)果分析
5.1 實(shí)驗(yàn)環(huán)境
5.2 數(shù)據(jù)預(yù)處理
5.2.1 DeepFashion數(shù)據(jù)集
5.2.2 人體姿態(tài)估計(jì)
5.3 評(píng)估標(biāo)準(zhǔn)
5.3.1 峰值信噪比(PSNR)
5.3.2 結(jié)構(gòu)相似性指數(shù)(SSIM)
5.3.3 Inception Score
5.4對(duì)比實(shí)驗(yàn)
5.5 局限性
5.6 小結(jié)
結(jié)論
參考文獻(xiàn)
致謝
附錄A 發(fā)表論文和參加科研情況說(shuō)明
本文編號(hào):3174813
本文鏈接:http://sikaile.net/kejilunwen/shengwushengchang/3174813.html
最近更新
教材專(zhuān)著