基于深度學(xué)習(xí)的服裝圖像生成與交互式編輯
發(fā)布時間:2021-12-18 04:30
一直以來,如何讓計算機(jī)生成真實的圖像是人工智能領(lǐng)域的一個研究難題。圖像是人們?nèi)粘W(xué)習(xí),工作和生活中常見的媒體承載。圖像合成以及編輯的需求也日益增加,要求也越來越高。無論是大眾流行的修圖還是專業(yè)設(shè)計師的設(shè)計圖都需要這一技術(shù)的支持。近年來的研究表明,基于深度學(xué)習(xí)的算法在圖像編輯和圖像合成任務(wù)中取得了明顯的突破。深度神經(jīng)網(wǎng)絡(luò)通過學(xué)習(xí)圖像中的語義信息以及潛在的編碼特征來理解以及生成圖像。由于圖像生成是像素級別的任務(wù),分辨率越高任務(wù)越困難。本文將基于深度神經(jīng)網(wǎng)絡(luò),研究由服裝輪廓圖生成高質(zhì)量分辨率的服裝圖像生成算法來輔助服裝設(shè)計流程。我們主要的工作在于:1.提出了一種新的紋理表達(dá)方式,紋理雙色線(Bi-Colored edge)。這種表達(dá)方能夠在圖像生成質(zhì)量和交互復(fù)雜性中達(dá)到一個良好的平衡。已有的服裝圖像生成算法都是提供小塊的紋理圖案給網(wǎng)絡(luò),試圖讓網(wǎng)絡(luò)鋪滿到整個衣服區(qū)域。盡管這種方式不需要復(fù)雜的交互,但是無法生成高質(zhì)量的、紋理清晰的服裝圖案。為此我們提出了紋理雙色線這種新的紋理表達(dá)方式。我們將通過實驗證明,這種新的表達(dá)方式能夠生成紋理可控、細(xì)節(jié)可控的真實高清圖像。2.提出了一個陰影增強(qiáng)器。我們發(fā)現(xiàn)...
【文章來源】:華南理工大學(xué)廣東省 211工程院校 985工程院校 教育部直屬院校
【文章頁數(shù)】:59 頁
【學(xué)位級別】:碩士
【部分圖文】:
引導(dǎo)式填充任務(wù)的訓(xùn)練數(shù)據(jù)集制作流程[12]
華南理工大學(xué)碩士學(xué)位論文8圖2-1自編碼器的網(wǎng)絡(luò)結(jié)構(gòu)自編碼器將圖片編碼為低維的向量表示,然后解碼器將這些向量恢復(fù)出圖片。這只能到達(dá)圖片存儲的作用,無法生成新的數(shù)據(jù)。因為我們無法生成合理的低維向量用于解碼器生成數(shù)據(jù),解碼器只能生成編碼器“見過”的圖片。為了解決這個問題,我們可以對編碼器的輸出添加約束,也就是強(qiáng)迫它產(chǎn)生的低維向量服從標(biāo)準(zhǔn)正態(tài)分布。這正是變分編碼器相對自編碼器的改進(jìn)之處。2.1.2變分編碼器變分編碼器和自編碼器的網(wǎng)絡(luò)框架是相同的,也是由編碼器和解碼器構(gòu)成,區(qū)別在于編碼器的輸出不同。自編碼器產(chǎn)生的潛在編碼只能表示輸入的圖片,不滿足某一分布,導(dǎo)致我們不能采樣合理的潛在變量,從而無法生成新的數(shù)據(jù)。變分編碼器通過對輸出編碼的約束,使其滿足標(biāo)準(zhǔn)正態(tài)分布。這樣做的一個目的是使得編碼之后的向量即服從一個已知的分布,又可以保留原圖像的特征。這樣我們生成一張新圖片就很容易了,只需要從這個已知分布中采樣,就能實現(xiàn)數(shù)據(jù)生成的功能。因此變分編碼器不再是學(xué)習(xí)樣本的個體,而是學(xué)習(xí)樣本的分布,試圖將樣本空間投影到一個已知分布的變量空間。圖2-2變分編碼器網(wǎng)絡(luò)結(jié)構(gòu)圖因此變分編碼器能夠真正的生成新的數(shù)據(jù),是一個生成網(wǎng)絡(luò)。但是它不是直接使得編碼器的輸出是一個向量,因為如果是這樣的話,在訓(xùn)練的時候就無法確定重新編碼后得到的是否還對應(yīng)著原來的,網(wǎng)絡(luò)也就無法通過最小化損失函數(shù)(,G())來
華南理工大學(xué)碩士學(xué)位論文8圖2-1自編碼器的網(wǎng)絡(luò)結(jié)構(gòu)自編碼器將圖片編碼為低維的向量表示,然后解碼器將這些向量恢復(fù)出圖片。這只能到達(dá)圖片存儲的作用,無法生成新的數(shù)據(jù)。因為我們無法生成合理的低維向量用于解碼器生成數(shù)據(jù),解碼器只能生成編碼器“見過”的圖片。為了解決這個問題,我們可以對編碼器的輸出添加約束,也就是強(qiáng)迫它產(chǎn)生的低維向量服從標(biāo)準(zhǔn)正態(tài)分布。這正是變分編碼器相對自編碼器的改進(jìn)之處。2.1.2變分編碼器變分編碼器和自編碼器的網(wǎng)絡(luò)框架是相同的,也是由編碼器和解碼器構(gòu)成,區(qū)別在于編碼器的輸出不同。自編碼器產(chǎn)生的潛在編碼只能表示輸入的圖片,不滿足某一分布,導(dǎo)致我們不能采樣合理的潛在變量,從而無法生成新的數(shù)據(jù)。變分編碼器通過對輸出編碼的約束,使其滿足標(biāo)準(zhǔn)正態(tài)分布。這樣做的一個目的是使得編碼之后的向量即服從一個已知的分布,又可以保留原圖像的特征。這樣我們生成一張新圖片就很容易了,只需要從這個已知分布中采樣,就能實現(xiàn)數(shù)據(jù)生成的功能。因此變分編碼器不再是學(xué)習(xí)樣本的個體,而是學(xué)習(xí)樣本的分布,試圖將樣本空間投影到一個已知分布的變量空間。圖2-2變分編碼器網(wǎng)絡(luò)結(jié)構(gòu)圖因此變分編碼器能夠真正的生成新的數(shù)據(jù),是一個生成網(wǎng)絡(luò)。但是它不是直接使得編碼器的輸出是一個向量,因為如果是這樣的話,在訓(xùn)練的時候就無法確定重新編碼后得到的是否還對應(yīng)著原來的,網(wǎng)絡(luò)也就無法通過最小化損失函數(shù)(,G())來
本文編號:3541634
【文章來源】:華南理工大學(xué)廣東省 211工程院校 985工程院校 教育部直屬院校
【文章頁數(shù)】:59 頁
【學(xué)位級別】:碩士
【部分圖文】:
引導(dǎo)式填充任務(wù)的訓(xùn)練數(shù)據(jù)集制作流程[12]
華南理工大學(xué)碩士學(xué)位論文8圖2-1自編碼器的網(wǎng)絡(luò)結(jié)構(gòu)自編碼器將圖片編碼為低維的向量表示,然后解碼器將這些向量恢復(fù)出圖片。這只能到達(dá)圖片存儲的作用,無法生成新的數(shù)據(jù)。因為我們無法生成合理的低維向量用于解碼器生成數(shù)據(jù),解碼器只能生成編碼器“見過”的圖片。為了解決這個問題,我們可以對編碼器的輸出添加約束,也就是強(qiáng)迫它產(chǎn)生的低維向量服從標(biāo)準(zhǔn)正態(tài)分布。這正是變分編碼器相對自編碼器的改進(jìn)之處。2.1.2變分編碼器變分編碼器和自編碼器的網(wǎng)絡(luò)框架是相同的,也是由編碼器和解碼器構(gòu)成,區(qū)別在于編碼器的輸出不同。自編碼器產(chǎn)生的潛在編碼只能表示輸入的圖片,不滿足某一分布,導(dǎo)致我們不能采樣合理的潛在變量,從而無法生成新的數(shù)據(jù)。變分編碼器通過對輸出編碼的約束,使其滿足標(biāo)準(zhǔn)正態(tài)分布。這樣做的一個目的是使得編碼之后的向量即服從一個已知的分布,又可以保留原圖像的特征。這樣我們生成一張新圖片就很容易了,只需要從這個已知分布中采樣,就能實現(xiàn)數(shù)據(jù)生成的功能。因此變分編碼器不再是學(xué)習(xí)樣本的個體,而是學(xué)習(xí)樣本的分布,試圖將樣本空間投影到一個已知分布的變量空間。圖2-2變分編碼器網(wǎng)絡(luò)結(jié)構(gòu)圖因此變分編碼器能夠真正的生成新的數(shù)據(jù),是一個生成網(wǎng)絡(luò)。但是它不是直接使得編碼器的輸出是一個向量,因為如果是這樣的話,在訓(xùn)練的時候就無法確定重新編碼后得到的是否還對應(yīng)著原來的,網(wǎng)絡(luò)也就無法通過最小化損失函數(shù)(,G())來
華南理工大學(xué)碩士學(xué)位論文8圖2-1自編碼器的網(wǎng)絡(luò)結(jié)構(gòu)自編碼器將圖片編碼為低維的向量表示,然后解碼器將這些向量恢復(fù)出圖片。這只能到達(dá)圖片存儲的作用,無法生成新的數(shù)據(jù)。因為我們無法生成合理的低維向量用于解碼器生成數(shù)據(jù),解碼器只能生成編碼器“見過”的圖片。為了解決這個問題,我們可以對編碼器的輸出添加約束,也就是強(qiáng)迫它產(chǎn)生的低維向量服從標(biāo)準(zhǔn)正態(tài)分布。這正是變分編碼器相對自編碼器的改進(jìn)之處。2.1.2變分編碼器變分編碼器和自編碼器的網(wǎng)絡(luò)框架是相同的,也是由編碼器和解碼器構(gòu)成,區(qū)別在于編碼器的輸出不同。自編碼器產(chǎn)生的潛在編碼只能表示輸入的圖片,不滿足某一分布,導(dǎo)致我們不能采樣合理的潛在變量,從而無法生成新的數(shù)據(jù)。變分編碼器通過對輸出編碼的約束,使其滿足標(biāo)準(zhǔn)正態(tài)分布。這樣做的一個目的是使得編碼之后的向量即服從一個已知的分布,又可以保留原圖像的特征。這樣我們生成一張新圖片就很容易了,只需要從這個已知分布中采樣,就能實現(xiàn)數(shù)據(jù)生成的功能。因此變分編碼器不再是學(xué)習(xí)樣本的個體,而是學(xué)習(xí)樣本的分布,試圖將樣本空間投影到一個已知分布的變量空間。圖2-2變分編碼器網(wǎng)絡(luò)結(jié)構(gòu)圖因此變分編碼器能夠真正的生成新的數(shù)據(jù),是一個生成網(wǎng)絡(luò)。但是它不是直接使得編碼器的輸出是一個向量,因為如果是這樣的話,在訓(xùn)練的時候就無法確定重新編碼后得到的是否還對應(yīng)著原來的,網(wǎng)絡(luò)也就無法通過最小化損失函數(shù)(,G())來
本文編號:3541634
本文鏈接:http://sikaile.net/projectlw/qgylw/3541634.html
最近更新
教材專著