基于深度學習的圖像與視頻風格化研究與實現(xiàn)
本文關(guān)鍵詞: 深度學習 圖像風格化 卷積神經(jīng)網(wǎng)絡(luò) 遷移學習 視頻風格化 出處:《中國科學院大學(中國科學院工程管理與信息技術(shù)學院)》2017年碩士論文 論文類型:學位論文
【摘要】:深度學習作為當今人工智能領(lǐng)域最熱門的方向,在圖像識別、語義分割、自然語言處理等領(lǐng)域取得了重大突破,顯示出強大的學習和處理能力,甚至在部分領(lǐng)域超過人類的表現(xiàn)。因此,一些研究人員將深度學習應用于圖像生成任務中,并在圖像風格化方面取得了很好的效果。圖像風格化即將一張圖像在保持內(nèi)容不變的同時換成另一種風格,這使得普通人也能拍出藝術(shù)風格的照片。但是當前最好的圖像風格化算法在網(wǎng)絡(luò)訓練、自拍圖像處理、視頻風格化等方面還有很多問題需要解決,本文針對這些問題提出了對應的解決方案。(1)本文設(shè)計了一種圖像風格轉(zhuǎn)換網(wǎng)絡(luò)U-StyleNet,并采用遷移學習的方法解決了網(wǎng)絡(luò)參數(shù)初始化導致輸出圖像有亮塊或黑塊的問題,同時加快了網(wǎng)絡(luò)的訓練速度。(2)本文提出了四種方案解決自拍圖像風格化人臉處理不好的問題,即設(shè)置較大的風格縮放參數(shù)、全局光滑處理、局部光滑處理、精細的風格比重。(3)本文提出了一種快速視頻風格化的方案,詳細介紹了快速視頻風格轉(zhuǎn)換網(wǎng)絡(luò)FV-StyleNet的雙通道多尺度輸入結(jié)構(gòu)。這種設(shè)計參考了現(xiàn)有的光流計算網(wǎng)絡(luò)和圖像風格轉(zhuǎn)換網(wǎng)絡(luò),并將兩者結(jié)合在一起,在風格化的同時考慮兩幀圖像的連續(xù)性,實現(xiàn)了快速而穩(wěn)定的視頻風格化效果。同時,雙通道多尺度輸入的結(jié)構(gòu)具有非常高的并行性,可以充分發(fā)掘GPU的并行計算能力。FV-StyleNet同樣采用遷移學習的訓練方式,首先訓練一個光流網(wǎng)絡(luò),然后在此基礎(chǔ)上訓練視頻風格轉(zhuǎn)換網(wǎng)絡(luò)。本文提出的U-StyleNet成功地解決了風格轉(zhuǎn)換網(wǎng)絡(luò)參數(shù)初始化問題,同時提高了訓練速度。四種優(yōu)化方案提高了自拍圖像風格化的質(zhì)量?焖僖曨l風格化方案FV-StyleNet極大地加速了視頻的風格化,為視頻風格化的應用推廣創(chuàng)造了條件。
[Abstract]:As the most popular direction in the field of artificial intelligence, depth learning has made a great breakthrough in image recognition, semantic segmentation, natural language processing and so on, showing a strong learning and processing ability. Even in some areas it outperforms human performance. Therefore, some researchers apply in-depth learning to image generation tasks. And in the image stylization aspect has obtained the very good effect, the image stylization namely one image while keeping the content invariable at the same time changes another style. However, the best image stylization algorithm in the network training, selfie image processing, video stylization and other aspects need to be solved. This paper proposes a corresponding solution to these problems.) this paper designs an image style conversion network U-StyleNet. The migration learning method is used to solve the problem that there are bright blocks or black blocks in the output images caused by the initialization of network parameters. At the same time, it speeds up the training speed of the network.) in this paper, we propose four solutions to solve the problem of bad face processing in stylized selfie images, that is, setting larger style scaling parameters and global smooth processing. This paper presents a fast video stylization scheme. The two-channel multi-scale input structure of fast video style conversion network (FV-StyleNet) is introduced in detail. This design refers to the existing optical flow computing network and image style conversion network. Combining the two methods, the continuity of the two frames is taken into account while the two frames are stylized, and the fast and stable video styling effect is realized. At the same time, the dual-channel multi-scale input structure has a very high parallelism. We can fully explore the parallel computing power of GPU. FV-StyleNet also adopts the training method of migration learning. First, we can train an optical flow network. Then the video style conversion network is trained on this basis. U-StyleNet proposed in this paper successfully solves the problem of initialization of style conversion network parameters. At the same time, the training speed is improved. Four optimization schemes improve the quality of the stylization of the selfie image. The fast video styling scheme FV-StyleNet greatly speeds up the stylization of the video. It creates conditions for the application and promotion of video stylization.
【學位授予單位】:中國科學院大學(中國科學院工程管理與信息技術(shù)學院)
【學位級別】:碩士
【學位授予年份】:2017
【分類號】:TP391.41;TP18
【相似文獻】
相關(guān)期刊論文 前10條
1 張芊;電視頻道風格化建設(shè)的未來空間[J];采.寫.編;2004年04期
2 彭一凡;張翼;宋明黎;;基于特征跟蹤和融合的人臉風格化動畫的研究[J];計算機技術(shù)與發(fā)展;2009年02期
3 陳竹;;風格化主持芻議[J];湖南科技學院學報;2006年02期
4 張寧;;非真實感渲染生成風格化圖像的方法[J];信息技術(shù);2012年11期
5 周茜,胡珊;淺析電視頻道的專業(yè)化與風格化[J];山東視聽(山東省廣播電視學校學報);2005年03期
6 蔣寶吉;唐棣;;基于三維模型的風格化線條渲染方法[J];計算機科學;2013年10期
7 李陽;李紅平;徐丹;;多變量高斯差分的風格化方法[J];云南大學學報(自然科學版);2014年03期
8 黃華;臧_g;張磊;;圖像和視頻油畫風格化研究[J];計算機科學;2011年06期
9 鄒定賓;電視頻道專業(yè)化過程中的風格化問題[J];電視研究;2001年08期
10 祝瑜;王毅;黃海燕;;手機界面的風格化設(shè)計藝術(shù)研究[J];藝術(shù)與設(shè)計(理論);2007年11期
相關(guān)會議論文 前2條
1 盧少平;張松海;;一種圖像油畫風格化繪制的新算法[A];第四屆全國幾何設(shè)計與計算學術(shù)會議論文集[C];2009年
2 肖亮;錢小燕;吳慧中;韋志輝;;流線形風格化圖像生成算法[A];中國圖學新進展2007——第一屆中國圖學大會暨第十屆華東六省一市工程圖學學術(shù)年會論文集[C];2007年
相關(guān)重要報紙文章 前5條
1 連冕;我們何需“風格化”?[N];中國文化報;2006年
2 卞文志;市場呼喚風格化名牌[N];廠長經(jīng)理日報;2000年
3 卞文志;個性化市場呼喚風格化名牌[N];市場報;2000年
4 記者 朱志升 通訊員 張明山;沙雅推行風格化社會面服務管理工作[N];阿克蘇日報(漢);2012年
5 陳履生;代表性與風格化[N];文藝報;2006年
相關(guān)博士學位論文 前4條
1 趙艷丹;風格化數(shù)字圖像的GPU加速生成和編輯[D];浙江大學;2015年
2 孫美君;中國水墨畫的設(shè)色擴散與風格化繪制研究[D];天津大學;2009年
3 欒青;色彩與結(jié)構(gòu)在圖像編輯和風格化中的應用[D];中國科學技術(shù)大學;2009年
4 劉更代;人體動畫合成及其風格化處理研究[D];浙江大學;2009年
相關(guān)碩士學位論文 前10條
1 鄭海東;人臉風格化繪制評估方法[D];山東大學;2015年
2 楊玲麗;數(shù)字圖像的風格化繪制[D];山東大學;2014年
3 高山曉;基于GPU的實時素描風格化渲染算法研究[D];福建師范大學;2016年
4 張曄嘉;三維模型風格化繪制技術(shù)研究[D];南京大學;2015年
5 操江峰;基于深度學習的圖像與視頻風格化研究與實現(xiàn)[D];中國科學院大學(中國科學院工程管理與信息技術(shù)學院);2017年
6 張小剛;風格化服裝賣場系統(tǒng)的研究[D];江南大學;2008年
7 謝偉斌;基于稠密特征對應關(guān)系的視頻風格化關(guān)鍵技術(shù)與系統(tǒng)[D];中山大學;2012年
8 肖書星;蛋白質(zhì)三維結(jié)構(gòu)的風格化繪制[D];浙江大學;2008年
9 林濤;基于分層稠密對應關(guān)系的視頻風格化技術(shù)和系統(tǒng)[D];中山大學;2013年
10 陶正飛;非均勻圖像卡通風格化技術(shù)研究[D];溫州大學;2014年
,本文編號:1482328
本文鏈接:http://sikaile.net/kejilunwen/ruanjiangongchenglunwen/1482328.html