基于生成對抗網(wǎng)絡(luò)(GAN)自主海報生成的研究
發(fā)布時間:2021-09-04 15:23
圖像生成技術(shù)廣泛的運(yùn)用在日常生活當(dāng)中,也是計算機(jī)視覺領(lǐng)域極為重要的研究方向。由文本到圖像的生成是該方向的一個重要分支,通常的圖像生成任務(wù)只能完成單個類別的圖像合成,無法滿足日益復(fù)雜精細(xì)的生產(chǎn)要求。按照給定條件的文本描述生成內(nèi)容相符合細(xì)節(jié)豐富的圖像變得尤其重要,特別是對于海報設(shè)計工作人員,基于文本生成圖像的技術(shù)模型的自主海報生成,不僅能夠大大減輕海報工作人員的枯燥簡單的海報設(shè)計工作,將他們從大量重復(fù)機(jī)械的勞動中解放出來,而且能夠提升他們的設(shè)計效率,讓設(shè)計者們從事更加富有創(chuàng)造力的工作。通過文本生成符合文本內(nèi)容語義表達(dá)的圖形,首先需要解決計算機(jī)如何能夠理解文本所包含的語義信息,其次將計算機(jī)理解后的文本語義信息轉(zhuǎn)化為對應(yīng)圖形輸出,該任務(wù)具有很強(qiáng)的挑戰(zhàn)性。本文通過對文本生成圖像方法進(jìn)行研究,提出了一種以中文文本為輸入,基于改進(jìn)型對抗生成網(wǎng)絡(luò)的文本生成圖像生成的方法并進(jìn)行了相應(yīng)實驗進(jìn)行驗證。在綜合現(xiàn)有的文本生成圖像的研究發(fā)現(xiàn),當(dāng)前的文本輸入都是基于英文字符作為文本輸入。為了方便國內(nèi)設(shè)計工作人員,論文提出了用中文作為文本圖像生成的文本輸入。使用Word2vec模型產(chǎn)生詞向量,將詞向量輸入到Seq2S...
【文章來源】:長江大學(xué)湖北省
【文章頁數(shù)】:63 頁
【學(xué)位級別】:碩士
【部分圖文】:
變分自編碼器的結(jié)構(gòu)示意圖
第1章緒論6的神經(jīng)網(wǎng)絡(luò)參數(shù),整個訓(xùn)練過程交替進(jìn)行。通常在實驗操作過程當(dāng)中,生成器每經(jīng)過k(k<10)次訓(xùn)練以后,然后再訓(xùn)練判別器。通過這樣不斷對抗博弈的方式,最終生成器可以學(xué)得真實數(shù)據(jù)樣本的潛在分布,生成與真實樣本基本一致的數(shù)據(jù)樣本。圖1-2展示了生成對抗網(wǎng)絡(luò)的模型:圖1-2生成對抗網(wǎng)絡(luò)的結(jié)構(gòu)示意圖Figure1-2Schematicdiagramofgeneratinganadversarialnetwork在生成對抗網(wǎng)絡(luò)出現(xiàn)以前,大部分的深度學(xué)習(xí)模型都是監(jiān)督學(xué)習(xí)方式進(jìn)行,而監(jiān)督學(xué)習(xí)需要大量運(yùn)用大量的人力來標(biāo)注數(shù)據(jù)集,而深度學(xué)習(xí)的數(shù)據(jù)集一般都是非常龐大,而人工標(biāo)注通常效率低下且成本高昂。而生成對抗網(wǎng)絡(luò)是非監(jiān)督的學(xué)習(xí),能夠自發(fā)的學(xué)習(xí)到真實數(shù)據(jù)集的潛在分布規(guī)律,不需要先驗的假設(shè)信息,GAN不需要動用大量人工來標(biāo)注訓(xùn)練數(shù)據(jù)集,制作每條數(shù)據(jù)對應(yīng)的標(biāo)簽,降低了生產(chǎn)成本提高了生產(chǎn)效率,因此GAN在圖像生成領(lǐng)域備受科研人員的青睞。但是生成對抗網(wǎng)絡(luò)自提出來一直存在著訓(xùn)練不穩(wěn)定,模式崩潰和梯度消失等問題,而這些問題亟待解決。生成對抗網(wǎng)絡(luò)自2014年提出以來呈現(xiàn)出爆發(fā)式發(fā)展的趨勢,研究論文主要是圍繞網(wǎng)絡(luò)模型結(jié)構(gòu)更改,理論完善以及實際應(yīng)用展開。在理論方面,MartinArjovsky等人對GAN進(jìn)行深入研究[26](WassersteinGAN)來提高生成對抗網(wǎng)絡(luò)的穩(wěn)定性,WGAN使用Wasserstein距離代替了生成對抗網(wǎng)絡(luò)的Jenson-Shannon散度來度量真實數(shù)據(jù)與生成數(shù)據(jù)分布的差異性,不僅僅消除了梯度消失帶來的訓(xùn)練難題,而且解釋了網(wǎng)絡(luò)模式崩潰的根本原因。WGAN在一定程度上解決了生成對抗網(wǎng)絡(luò)訓(xùn)練困難的問題,但是由于存在Lipschitz條件約束,因此生成對抗網(wǎng)絡(luò)在訓(xùn)練上存在難點(diǎn),WGAN通過將神經(jīng)網(wǎng)絡(luò)的權(quán)重限制在一定范圍之內(nèi)來滿足Lipschitz條件約
第2章深度學(xué)習(xí)理論概述12重值(weight),人工神經(jīng)網(wǎng)絡(luò)就是通過這樣的方式來模擬人腦的運(yùn)行過程。人工神經(jīng)網(wǎng)絡(luò)的架構(gòu),連接方式,權(quán)重值和激活函數(shù)的選擇都會影響神經(jīng)網(wǎng)絡(luò)的輸出結(jié)果。由于神經(jīng)網(wǎng)絡(luò)是由一個個簡單的神經(jīng)元相互連接構(gòu)成,并以此形成了一個大規(guī)模的分布式處理器,具有存儲知識并利用的特性。這些神經(jīng)元高度互聯(lián),促使系統(tǒng)動態(tài)的運(yùn)行。因此人工神經(jīng)網(wǎng)絡(luò)具有并行分布的處理能力,高容錯性,智能化,自適應(yīng)學(xué)習(xí)等特征。在人工神經(jīng)網(wǎng)絡(luò)當(dāng)中,可以處理文字,數(shù)字,圖像或者更加抽象的概念。早期的人工神經(jīng)網(wǎng)絡(luò)要包含三個組成部分:輸入層,隱藏層,輸出層。輸入層接受來自外部的數(shù)據(jù)輸入;隱藏層進(jìn)行綜合運(yùn)算;輸出層輸出系統(tǒng)的結(jié)果。神經(jīng)元之間的連接權(quán)重值大小決定了神經(jīng)元彼此之間聯(lián)系關(guān)系的重要程度。神經(jīng)元是人工神經(jīng)網(wǎng)絡(luò)的基本組成單位,圖2-1是人工神經(jīng)網(wǎng)絡(luò)當(dāng)中神經(jīng)元的模型,如圖2.1所示神經(jīng)元模型由神經(jīng)連接,累加器,激活函數(shù)三部分組成。圖2-1神經(jīng)元的數(shù)學(xué)模型結(jié)構(gòu)Figure2-1Mathematicalmodelstructureofneuron其中123,|,nixxxRxx為輸入,每個輸入上有一個權(quán)值iwR,此外還有一個偏置項bR。是激活函數(shù),a是神經(jīng)元的輸出。單個神經(jīng)元的數(shù)學(xué)模型:1niiiawxb()(2-1)模型的每次學(xué)習(xí)都會適當(dāng)?shù)恼{(diào)整權(quán)重w和偏置b,經(jīng)過激活函數(shù)將輸出a限制在一定的范圍之內(nèi),經(jīng)過多次的參數(shù)調(diào)節(jié)之后,輸出值趨于穩(wěn)定,則神經(jīng)網(wǎng)絡(luò)模型訓(xùn)練完成。
本文編號:3383517
【文章來源】:長江大學(xué)湖北省
【文章頁數(shù)】:63 頁
【學(xué)位級別】:碩士
【部分圖文】:
變分自編碼器的結(jié)構(gòu)示意圖
第1章緒論6的神經(jīng)網(wǎng)絡(luò)參數(shù),整個訓(xùn)練過程交替進(jìn)行。通常在實驗操作過程當(dāng)中,生成器每經(jīng)過k(k<10)次訓(xùn)練以后,然后再訓(xùn)練判別器。通過這樣不斷對抗博弈的方式,最終生成器可以學(xué)得真實數(shù)據(jù)樣本的潛在分布,生成與真實樣本基本一致的數(shù)據(jù)樣本。圖1-2展示了生成對抗網(wǎng)絡(luò)的模型:圖1-2生成對抗網(wǎng)絡(luò)的結(jié)構(gòu)示意圖Figure1-2Schematicdiagramofgeneratinganadversarialnetwork在生成對抗網(wǎng)絡(luò)出現(xiàn)以前,大部分的深度學(xué)習(xí)模型都是監(jiān)督學(xué)習(xí)方式進(jìn)行,而監(jiān)督學(xué)習(xí)需要大量運(yùn)用大量的人力來標(biāo)注數(shù)據(jù)集,而深度學(xué)習(xí)的數(shù)據(jù)集一般都是非常龐大,而人工標(biāo)注通常效率低下且成本高昂。而生成對抗網(wǎng)絡(luò)是非監(jiān)督的學(xué)習(xí),能夠自發(fā)的學(xué)習(xí)到真實數(shù)據(jù)集的潛在分布規(guī)律,不需要先驗的假設(shè)信息,GAN不需要動用大量人工來標(biāo)注訓(xùn)練數(shù)據(jù)集,制作每條數(shù)據(jù)對應(yīng)的標(biāo)簽,降低了生產(chǎn)成本提高了生產(chǎn)效率,因此GAN在圖像生成領(lǐng)域備受科研人員的青睞。但是生成對抗網(wǎng)絡(luò)自提出來一直存在著訓(xùn)練不穩(wěn)定,模式崩潰和梯度消失等問題,而這些問題亟待解決。生成對抗網(wǎng)絡(luò)自2014年提出以來呈現(xiàn)出爆發(fā)式發(fā)展的趨勢,研究論文主要是圍繞網(wǎng)絡(luò)模型結(jié)構(gòu)更改,理論完善以及實際應(yīng)用展開。在理論方面,MartinArjovsky等人對GAN進(jìn)行深入研究[26](WassersteinGAN)來提高生成對抗網(wǎng)絡(luò)的穩(wěn)定性,WGAN使用Wasserstein距離代替了生成對抗網(wǎng)絡(luò)的Jenson-Shannon散度來度量真實數(shù)據(jù)與生成數(shù)據(jù)分布的差異性,不僅僅消除了梯度消失帶來的訓(xùn)練難題,而且解釋了網(wǎng)絡(luò)模式崩潰的根本原因。WGAN在一定程度上解決了生成對抗網(wǎng)絡(luò)訓(xùn)練困難的問題,但是由于存在Lipschitz條件約束,因此生成對抗網(wǎng)絡(luò)在訓(xùn)練上存在難點(diǎn),WGAN通過將神經(jīng)網(wǎng)絡(luò)的權(quán)重限制在一定范圍之內(nèi)來滿足Lipschitz條件約
第2章深度學(xué)習(xí)理論概述12重值(weight),人工神經(jīng)網(wǎng)絡(luò)就是通過這樣的方式來模擬人腦的運(yùn)行過程。人工神經(jīng)網(wǎng)絡(luò)的架構(gòu),連接方式,權(quán)重值和激活函數(shù)的選擇都會影響神經(jīng)網(wǎng)絡(luò)的輸出結(jié)果。由于神經(jīng)網(wǎng)絡(luò)是由一個個簡單的神經(jīng)元相互連接構(gòu)成,并以此形成了一個大規(guī)模的分布式處理器,具有存儲知識并利用的特性。這些神經(jīng)元高度互聯(lián),促使系統(tǒng)動態(tài)的運(yùn)行。因此人工神經(jīng)網(wǎng)絡(luò)具有并行分布的處理能力,高容錯性,智能化,自適應(yīng)學(xué)習(xí)等特征。在人工神經(jīng)網(wǎng)絡(luò)當(dāng)中,可以處理文字,數(shù)字,圖像或者更加抽象的概念。早期的人工神經(jīng)網(wǎng)絡(luò)要包含三個組成部分:輸入層,隱藏層,輸出層。輸入層接受來自外部的數(shù)據(jù)輸入;隱藏層進(jìn)行綜合運(yùn)算;輸出層輸出系統(tǒng)的結(jié)果。神經(jīng)元之間的連接權(quán)重值大小決定了神經(jīng)元彼此之間聯(lián)系關(guān)系的重要程度。神經(jīng)元是人工神經(jīng)網(wǎng)絡(luò)的基本組成單位,圖2-1是人工神經(jīng)網(wǎng)絡(luò)當(dāng)中神經(jīng)元的模型,如圖2.1所示神經(jīng)元模型由神經(jīng)連接,累加器,激活函數(shù)三部分組成。圖2-1神經(jīng)元的數(shù)學(xué)模型結(jié)構(gòu)Figure2-1Mathematicalmodelstructureofneuron其中123,|,nixxxRxx為輸入,每個輸入上有一個權(quán)值iwR,此外還有一個偏置項bR。是激活函數(shù),a是神經(jīng)元的輸出。單個神經(jīng)元的數(shù)學(xué)模型:1niiiawxb()(2-1)模型的每次學(xué)習(xí)都會適當(dāng)?shù)恼{(diào)整權(quán)重w和偏置b,經(jīng)過激活函數(shù)將輸出a限制在一定的范圍之內(nèi),經(jīng)過多次的參數(shù)調(diào)節(jié)之后,輸出值趨于穩(wěn)定,則神經(jīng)網(wǎng)絡(luò)模型訓(xùn)練完成。
本文編號:3383517
本文鏈接:http://sikaile.net/kejilunwen/shengwushengchang/3383517.html
最近更新
教材專著