基于深度學(xué)習(xí)的圖像美學(xué)評論研究
發(fā)布時間:2021-02-09 20:14
圖像美學(xué)質(zhì)量評價的研究目的是為了讓計算機能夠模擬人類的思維和審美對一幅圖像的美學(xué)價值產(chǎn)生判斷,從而輸出評分或者文字描述。而人類的視覺和語言是緊密相連的,看到圖像總能以自然語言的方式表達一些美學(xué)的見解,這些語言中包括對圖像美學(xué)方面的描述例如構(gòu)圖、光影、色彩等,因此對圖像美學(xué)進行語言描述有著非常重要的意義,然而僅有的研究中美學(xué)描述的豐富性和流暢性方面也不夠完善。為了解決現(xiàn)有的美學(xué)描述不完善的問題,本文首先提出了名為Deep Image Aesthetic Reviewer(DIAReviewer)的模型,該模型由CNN、美學(xué)語義添加層和D-Attention組成,這種網(wǎng)絡(luò)結(jié)構(gòu)可以使最終生成的美學(xué)描述更加流暢。本文提出的美學(xué)語義添加層是將CNN提取的圖像特征與從美學(xué)描述中提取的美學(xué)描述特征融合成一個混合美學(xué)特征輸入到D-Attention部分。D-Attention部分將代替?zhèn)鹘y(tǒng)的RNN,作為模型最后的文字輸出部分。為了驗證提出的模型,本文還構(gòu)建了新的美學(xué)字幕的數(shù)據(jù)集(ARD)。經(jīng)過實驗,結(jié)果表明,本文的方法在產(chǎn)生更加流暢的美學(xué)描述方面有一定的性能提升。其次為了解決卷積過程中導(dǎo)致的美學(xué)方面的...
【文章來源】:天津工業(yè)大學(xué)天津市
【文章頁數(shù)】:55 頁
【學(xué)位級別】:碩士
【部分圖文】:
Wang等人[14]生成的圖像美學(xué)描述
鰲⑸?鰲⒍員榷?和明亮度、清晰度和色彩等,以及一些圖像通用的特征如SIFI(尺度不變特征變換匹配)、Hog(方向梯度直方圖)、BOV(Bag-of-Visual-Words)等;與攝影相關(guān)的特征包括:三分法、景深、曝光度、構(gòu)圖、色彩、光線等等。在底層特征中本文首先來介紹主體背景對比特征,該特征主要遵行的是攝影原則里面整幅圖像要簡介的原則,即一張圖像本文想要突出圖像的主體,就要使背景盡可能的簡潔,不要對主體的展現(xiàn)造成干擾,這一點其實也可以從圖像的高頻特征中看出來。下面本文引用Ke等人[42]中的圖更好的說明這一點,如圖2-1所示,是兩幅圖的邊緣特征,根據(jù)邊緣特征本文可以猜想到b圖是一朵畫,a圖可能是辦公室也可能是家中的一個角落,總之不太容易猜不出來圖像中的內(nèi)容。由此可見,b圖的邊緣更加完整,整個圖像更簡潔,a圖則比較凌亂,對應(yīng)的b圖的質(zhì)量想必高于a圖。通過這個邊緣就可以反應(yīng)圖像的簡單性。當(dāng)然對于前背景還有很多的屬性,如曝光、飽和度、色調(diào)等對比度的方法[46-48],這些提取特征的目標都是一致的,主要目標就是提取出前背景的對比信息,只是通過的角度不同而已。圖2-1兩幅圖像的邊緣特征其次介紹顏色分布特征。這個是一個在很多圖像檢索中都會用到的特征,最直接的展現(xiàn)方式就是顏色直方圖。直方圖現(xiàn)在出現(xiàn)的很多,例如本文的攝像機中都會有,還有一些好一點的圖像處理軟件也會有顏色直方圖。對于高質(zhì)量的圖像,都會有一個整體統(tǒng)一的風(fēng)格,或是偏重冷色調(diào),或是偏重暖色調(diào),這些本文都可以直接通過色彩直方圖看出來。與此同時,局部直方圖的復(fù)雜程度也可以反應(yīng)出
第二章圖像美學(xué)描述相關(guān)技術(shù)11一幅圖像的風(fēng)格一致性。色調(diào)也是用來區(qū)分圖像好壞的重要特征。一張好的靜物攝影圖,色調(diào)一般會比較單一如圖2-2所示三張圖像,通過單調(diào)干凈的色調(diào)帶給人簡單、舒適的感覺。Lou等人[22]在Ke等人[42]的基礎(chǔ)上對圖像特征提取進行了補充,添加了另外兩個新的原理,即90配測方案和互補色方案。這兩個方案是設(shè)計學(xué)中的經(jīng)典配色方案。在色調(diào)論中本文可以看出,具有視覺上美感的主色調(diào)搭配方案,常常是區(qū)間相隔90度或者180度左右的。Lou等人[22]提出了具體的計算這個色調(diào)特征的方法:具體計hue的復(fù)雜度,就是要求把圖像轉(zhuǎn)換到HSV空間中,從而通過計算得到H通道。然后將其等分成多個bins,再設(shè)定閾值來計算色調(diào)的種類。圖2-2色調(diào)簡單的圖像對比度和明亮度也是傳統(tǒng)特征提取中經(jīng)常提取的特征,并且這兩個特征總是一起研究。在亮度中,攝影專家總是會提到“50度灰”這個名詞,該名詞的意思是照相機會自動將一張圖像調(diào)整成為50度灰,也就是自動曝光。但是對于一張具有美感的圖像來說,本文往往更加喜歡主題曝光,對于背景本文希望越簡單越好,因此主題和背景的對比度高的,往往圖像更加具有美感。在檢測圖像的亮度和對比度方面,主要采用的是saliencydetecting的原理。該原理的主要方法是把顯著目標當(dāng)作前景,把除了顯著目標以外的地方當(dāng)做背景,通過這種劃分后,計算出來一些前景和背景的指標,進行比較。清晰度和色彩方面,LouandTang等人[22]提出了一個當(dāng)時比較新穎的方法通過暗通道特征來檢測主體區(qū)域的清晰度和色彩,這本身是對暗通道特征的強加使用,不過做出的效果還是很不錯的。與攝影有關(guān)的特征中,主要利用的三分法構(gòu)圖的原理對圖像進行評判。三分法構(gòu)圖能夠使整張圖像的布局更加緊湊,視覺效果更好,
【參考文獻】:
期刊論文
[1]圖像美學(xué)質(zhì)量評價技術(shù)發(fā)展趨勢[J]. 金鑫,周彬,鄒冬青,李曉東,孫紅波,吳樂. 科技導(dǎo)報. 2018(09)
[2]圖像自動標注方法研究綜述[J]. 徐勇,張慧. 現(xiàn)代情報. 2016(03)
[3]可計算圖像美學(xué)研究進展[J]. 王偉凝,蟻靜緘,賀前華. 中國圖象圖形學(xué)報. 2012(08)
[4]基于色彩描述的圖像情感語義查詢[J]. 王偉凝,賀前華. 華南理工大學(xué)學(xué)報(自然科學(xué)版). 2008(01)
本文編號:3026171
【文章來源】:天津工業(yè)大學(xué)天津市
【文章頁數(shù)】:55 頁
【學(xué)位級別】:碩士
【部分圖文】:
Wang等人[14]生成的圖像美學(xué)描述
鰲⑸?鰲⒍員榷?和明亮度、清晰度和色彩等,以及一些圖像通用的特征如SIFI(尺度不變特征變換匹配)、Hog(方向梯度直方圖)、BOV(Bag-of-Visual-Words)等;與攝影相關(guān)的特征包括:三分法、景深、曝光度、構(gòu)圖、色彩、光線等等。在底層特征中本文首先來介紹主體背景對比特征,該特征主要遵行的是攝影原則里面整幅圖像要簡介的原則,即一張圖像本文想要突出圖像的主體,就要使背景盡可能的簡潔,不要對主體的展現(xiàn)造成干擾,這一點其實也可以從圖像的高頻特征中看出來。下面本文引用Ke等人[42]中的圖更好的說明這一點,如圖2-1所示,是兩幅圖的邊緣特征,根據(jù)邊緣特征本文可以猜想到b圖是一朵畫,a圖可能是辦公室也可能是家中的一個角落,總之不太容易猜不出來圖像中的內(nèi)容。由此可見,b圖的邊緣更加完整,整個圖像更簡潔,a圖則比較凌亂,對應(yīng)的b圖的質(zhì)量想必高于a圖。通過這個邊緣就可以反應(yīng)圖像的簡單性。當(dāng)然對于前背景還有很多的屬性,如曝光、飽和度、色調(diào)等對比度的方法[46-48],這些提取特征的目標都是一致的,主要目標就是提取出前背景的對比信息,只是通過的角度不同而已。圖2-1兩幅圖像的邊緣特征其次介紹顏色分布特征。這個是一個在很多圖像檢索中都會用到的特征,最直接的展現(xiàn)方式就是顏色直方圖。直方圖現(xiàn)在出現(xiàn)的很多,例如本文的攝像機中都會有,還有一些好一點的圖像處理軟件也會有顏色直方圖。對于高質(zhì)量的圖像,都會有一個整體統(tǒng)一的風(fēng)格,或是偏重冷色調(diào),或是偏重暖色調(diào),這些本文都可以直接通過色彩直方圖看出來。與此同時,局部直方圖的復(fù)雜程度也可以反應(yīng)出
第二章圖像美學(xué)描述相關(guān)技術(shù)11一幅圖像的風(fēng)格一致性。色調(diào)也是用來區(qū)分圖像好壞的重要特征。一張好的靜物攝影圖,色調(diào)一般會比較單一如圖2-2所示三張圖像,通過單調(diào)干凈的色調(diào)帶給人簡單、舒適的感覺。Lou等人[22]在Ke等人[42]的基礎(chǔ)上對圖像特征提取進行了補充,添加了另外兩個新的原理,即90配測方案和互補色方案。這兩個方案是設(shè)計學(xué)中的經(jīng)典配色方案。在色調(diào)論中本文可以看出,具有視覺上美感的主色調(diào)搭配方案,常常是區(qū)間相隔90度或者180度左右的。Lou等人[22]提出了具體的計算這個色調(diào)特征的方法:具體計hue的復(fù)雜度,就是要求把圖像轉(zhuǎn)換到HSV空間中,從而通過計算得到H通道。然后將其等分成多個bins,再設(shè)定閾值來計算色調(diào)的種類。圖2-2色調(diào)簡單的圖像對比度和明亮度也是傳統(tǒng)特征提取中經(jīng)常提取的特征,并且這兩個特征總是一起研究。在亮度中,攝影專家總是會提到“50度灰”這個名詞,該名詞的意思是照相機會自動將一張圖像調(diào)整成為50度灰,也就是自動曝光。但是對于一張具有美感的圖像來說,本文往往更加喜歡主題曝光,對于背景本文希望越簡單越好,因此主題和背景的對比度高的,往往圖像更加具有美感。在檢測圖像的亮度和對比度方面,主要采用的是saliencydetecting的原理。該原理的主要方法是把顯著目標當(dāng)作前景,把除了顯著目標以外的地方當(dāng)做背景,通過這種劃分后,計算出來一些前景和背景的指標,進行比較。清晰度和色彩方面,LouandTang等人[22]提出了一個當(dāng)時比較新穎的方法通過暗通道特征來檢測主體區(qū)域的清晰度和色彩,這本身是對暗通道特征的強加使用,不過做出的效果還是很不錯的。與攝影有關(guān)的特征中,主要利用的三分法構(gòu)圖的原理對圖像進行評判。三分法構(gòu)圖能夠使整張圖像的布局更加緊湊,視覺效果更好,
【參考文獻】:
期刊論文
[1]圖像美學(xué)質(zhì)量評價技術(shù)發(fā)展趨勢[J]. 金鑫,周彬,鄒冬青,李曉東,孫紅波,吳樂. 科技導(dǎo)報. 2018(09)
[2]圖像自動標注方法研究綜述[J]. 徐勇,張慧. 現(xiàn)代情報. 2016(03)
[3]可計算圖像美學(xué)研究進展[J]. 王偉凝,蟻靜緘,賀前華. 中國圖象圖形學(xué)報. 2012(08)
[4]基于色彩描述的圖像情感語義查詢[J]. 王偉凝,賀前華. 華南理工大學(xué)學(xué)報(自然科學(xué)版). 2008(01)
本文編號:3026171
本文鏈接:http://sikaile.net/kejilunwen/shengwushengchang/3026171.html
最近更新
教材專著