基于深度神經(jīng)網(wǎng)絡(luò)的視覺(jué)媒體風(fēng)格轉(zhuǎn)換方法研究
發(fā)布時(shí)間:2021-03-02 12:27
隨著物質(zhì)生活的豐富,人們對(duì)精神文化生活的需求越來(lái)越強(qiáng)烈。藝術(shù)創(chuàng)作與娛樂(lè)消費(fèi)作為精神文化的重要一部分,也得到了越來(lái)越多的關(guān)注。傳統(tǒng)藝術(shù)和娛樂(lè)作品的創(chuàng)作嚴(yán)重依賴(lài)于相關(guān)的專(zhuān)業(yè)人員,需要耗費(fèi)巨大的人力成本和時(shí)間成本。近幾年,人工智能技術(shù)得到了巨大的發(fā)展,如何利用人工智能技術(shù)進(jìn)行藝術(shù)和娛樂(lè)內(nèi)容創(chuàng)作也成為了一個(gè)重要的研究問(wèn)題。在傳統(tǒng)計(jì)算機(jī)視覺(jué)領(lǐng)域和圖形學(xué)領(lǐng)域,該問(wèn)題也曾經(jīng)吸引了眾多研究者的關(guān)注。這不僅是因?yàn)槠浔澈笊詈竦睦碚搩r(jià)值,也因?yàn)槠鋸V泛的應(yīng)用前景和巨大的潛在商業(yè)價(jià)值。最近,Gatys,Johnson等人開(kāi)始嘗試將深度神經(jīng)網(wǎng)絡(luò)技術(shù)應(yīng)用于圖片的藝術(shù)風(fēng)格轉(zhuǎn)換,并取得了巨大的成功。這些基于深度神經(jīng)網(wǎng)絡(luò)的風(fēng)格轉(zhuǎn)換算法不僅克服了傳統(tǒng)方法只能處理特定紋理風(fēng)格的缺陷,其產(chǎn)生的風(fēng)格轉(zhuǎn)換結(jié)果也具有很強(qiáng)的語(yǔ)義對(duì)應(yīng)性。但對(duì)于不同的視覺(jué)媒體格式,目前這些方法仍然面對(duì)以下幾點(diǎn)挑戰(zhàn):1)對(duì)于圖片,目前基于前饋網(wǎng)絡(luò)的風(fēng)格轉(zhuǎn)換方法單個(gè)模型只能處理單個(gè)紋理風(fēng)格;2)對(duì)于視頻,如果直接將圖片的風(fēng)格轉(zhuǎn)換網(wǎng)絡(luò)應(yīng)用到視頻的風(fēng)格轉(zhuǎn)換,其轉(zhuǎn)換的結(jié)果會(huì)傷害原始視頻的時(shí)間連續(xù)性并產(chǎn)生抖動(dòng)的效果;3)對(duì)于立體內(nèi)容,目前仍然沒(méi)有算法能夠有效處理立體...
【文章來(lái)源】:中國(guó)科學(xué)技術(shù)大學(xué)安徽省 211工程院校 985工程院校
【文章頁(yè)數(shù)】:125 頁(yè)
【學(xué)位級(jí)別】:博士
【部分圖文】:
圖1.1視覺(jué)媒體三種主要形式的發(fā)展歷史??1??
1.1.1風(fēng)格轉(zhuǎn)換的定義??給定一張內(nèi)容圖片和風(fēng)格圖片,風(fēng)格轉(zhuǎn)換旨在使用風(fēng)格圖片的紋理風(fēng)格對(duì)??內(nèi)容圖片進(jìn)行重渲染的同時(shí)保證不修改其原始的語(yǔ)義結(jié)構(gòu)。例如在圖1.2中,左??圖為德國(guó)圖賓根市的一張普通河邊彩屋圖,中圖為著名畫(huà)家梵高的藝術(shù)作品“星??空”,右圖則是風(fēng)格轉(zhuǎn)換算法根據(jù)梵高“星空”的風(fēng)格對(duì)左圖進(jìn)行風(fēng)格化的結(jié)果,使??其看上去仿佛是由梵高親自作畫(huà)一般,具有和“星空”相同的藝術(shù)風(fēng)格。整個(gè)過(guò)程??完全自動(dòng)化,不需要任何人工的干預(yù)。??內(nèi)容圖片?風(fēng)格圖片?風(fēng)格化結(jié)果??圖1.2風(fēng)格轉(zhuǎn)換的定義??風(fēng)格轉(zhuǎn)換其實(shí)可以被看作是傳統(tǒng)紋理合成(Texture?Synthesis)技術(shù)的一種??特殊形式,背后的核心問(wèn)題都是先對(duì)風(fēng)格或者紋理圖片進(jìn)行統(tǒng)計(jì)建模,然后在某??些約束下進(jìn)行重取樣。只不過(guò)對(duì)于傳統(tǒng)紋理合成,它要求采樣結(jié)果中兩個(gè)相鄰樣??本之間的邊界必須具有平滑過(guò)渡;而對(duì)于風(fēng)格轉(zhuǎn)換,則是要求采樣結(jié)果保持內(nèi)容??圖片的語(yǔ)義結(jié)構(gòu)。??風(fēng)格轉(zhuǎn)換也和傳統(tǒng)計(jì)算機(jī)圖形學(xué)中的非真實(shí)感渲染(Non-Photorealistic?Ren-??dering
?近幾年,隨著4G和智能手機(jī)的發(fā)展,大量的直播平臺(tái)和短視頻應(yīng)用(如??圖1.3所示)變得非常流行。如何將風(fēng)格轉(zhuǎn)換推廣到視頻的實(shí)時(shí)藝術(shù)風(fēng)格??化便成為了一個(gè)非常重要的研究課題。一種最簡(jiǎn)單的視頻風(fēng)格轉(zhuǎn)換方法是??直接將圖片的風(fēng)格化方法逐幀地應(yīng)用在視頻上,然而Ruder等人[8?22]證明??這會(huì)使得風(fēng)格化后的結(jié)果產(chǎn)生強(qiáng)烈的抖動(dòng)效果,嚴(yán)重破壞原始視頻的時(shí)序??連續(xù)性。實(shí)際上對(duì)于視頻的風(fēng)格化來(lái)說(shuō),本質(zhì)上存在一個(gè)相互矛盾的問(wèn)題:??為了保證原始紋理風(fēng)格的保真度,現(xiàn)有圖片風(fēng)格化算法會(huì)對(duì)原始內(nèi)容圖片??的紋理細(xì)節(jié)進(jìn)行加強(qiáng),然而這也會(huì)導(dǎo)致即使不同幀圖片之間有一個(gè)非常微??小的光照、運(yùn)動(dòng)等變化,其產(chǎn)生的風(fēng)格化結(jié)果也會(huì)有非常大的差異。為了??解決這個(gè)問(wèn)題,Ruder等人[221首次引入光流的信息對(duì)相鄰兩幀或者多幀的??風(fēng)格化結(jié)果進(jìn)行約束
【參考文獻(xiàn)】:
碩士論文
[1]基于圖像風(fēng)格變換的邊信息隱寫(xiě)技術(shù)研究[D]. 孫曦.中國(guó)科學(xué)技術(shù)大學(xué) 2017
本文編號(hào):3059260
【文章來(lái)源】:中國(guó)科學(xué)技術(shù)大學(xué)安徽省 211工程院校 985工程院校
【文章頁(yè)數(shù)】:125 頁(yè)
【學(xué)位級(jí)別】:博士
【部分圖文】:
圖1.1視覺(jué)媒體三種主要形式的發(fā)展歷史??1??
1.1.1風(fēng)格轉(zhuǎn)換的定義??給定一張內(nèi)容圖片和風(fēng)格圖片,風(fēng)格轉(zhuǎn)換旨在使用風(fēng)格圖片的紋理風(fēng)格對(duì)??內(nèi)容圖片進(jìn)行重渲染的同時(shí)保證不修改其原始的語(yǔ)義結(jié)構(gòu)。例如在圖1.2中,左??圖為德國(guó)圖賓根市的一張普通河邊彩屋圖,中圖為著名畫(huà)家梵高的藝術(shù)作品“星??空”,右圖則是風(fēng)格轉(zhuǎn)換算法根據(jù)梵高“星空”的風(fēng)格對(duì)左圖進(jìn)行風(fēng)格化的結(jié)果,使??其看上去仿佛是由梵高親自作畫(huà)一般,具有和“星空”相同的藝術(shù)風(fēng)格。整個(gè)過(guò)程??完全自動(dòng)化,不需要任何人工的干預(yù)。??內(nèi)容圖片?風(fēng)格圖片?風(fēng)格化結(jié)果??圖1.2風(fēng)格轉(zhuǎn)換的定義??風(fēng)格轉(zhuǎn)換其實(shí)可以被看作是傳統(tǒng)紋理合成(Texture?Synthesis)技術(shù)的一種??特殊形式,背后的核心問(wèn)題都是先對(duì)風(fēng)格或者紋理圖片進(jìn)行統(tǒng)計(jì)建模,然后在某??些約束下進(jìn)行重取樣。只不過(guò)對(duì)于傳統(tǒng)紋理合成,它要求采樣結(jié)果中兩個(gè)相鄰樣??本之間的邊界必須具有平滑過(guò)渡;而對(duì)于風(fēng)格轉(zhuǎn)換,則是要求采樣結(jié)果保持內(nèi)容??圖片的語(yǔ)義結(jié)構(gòu)。??風(fēng)格轉(zhuǎn)換也和傳統(tǒng)計(jì)算機(jī)圖形學(xué)中的非真實(shí)感渲染(Non-Photorealistic?Ren-??dering
?近幾年,隨著4G和智能手機(jī)的發(fā)展,大量的直播平臺(tái)和短視頻應(yīng)用(如??圖1.3所示)變得非常流行。如何將風(fēng)格轉(zhuǎn)換推廣到視頻的實(shí)時(shí)藝術(shù)風(fēng)格??化便成為了一個(gè)非常重要的研究課題。一種最簡(jiǎn)單的視頻風(fēng)格轉(zhuǎn)換方法是??直接將圖片的風(fēng)格化方法逐幀地應(yīng)用在視頻上,然而Ruder等人[8?22]證明??這會(huì)使得風(fēng)格化后的結(jié)果產(chǎn)生強(qiáng)烈的抖動(dòng)效果,嚴(yán)重破壞原始視頻的時(shí)序??連續(xù)性。實(shí)際上對(duì)于視頻的風(fēng)格化來(lái)說(shuō),本質(zhì)上存在一個(gè)相互矛盾的問(wèn)題:??為了保證原始紋理風(fēng)格的保真度,現(xiàn)有圖片風(fēng)格化算法會(huì)對(duì)原始內(nèi)容圖片??的紋理細(xì)節(jié)進(jìn)行加強(qiáng),然而這也會(huì)導(dǎo)致即使不同幀圖片之間有一個(gè)非常微??小的光照、運(yùn)動(dòng)等變化,其產(chǎn)生的風(fēng)格化結(jié)果也會(huì)有非常大的差異。為了??解決這個(gè)問(wèn)題,Ruder等人[221首次引入光流的信息對(duì)相鄰兩幀或者多幀的??風(fēng)格化結(jié)果進(jìn)行約束
【參考文獻(xiàn)】:
碩士論文
[1]基于圖像風(fēng)格變換的邊信息隱寫(xiě)技術(shù)研究[D]. 孫曦.中國(guó)科學(xué)技術(shù)大學(xué) 2017
本文編號(hào):3059260
本文鏈接:http://sikaile.net/kejilunwen/zidonghuakongzhilunwen/3059260.html
最近更新
教材專(zhuān)著