基于多尺度視覺注意機(jī)制的最優(yōu)系列照片選擇方法研究
發(fā)布時間:2021-11-12 12:49
隨著智能手機(jī)、相機(jī)的普及,人們逐漸習(xí)慣通過照片記錄每一個難忘的瞬間。為了確保捕捉到最佳鏡頭,用戶通常會為同一對象或場景拍攝一系列照片。但出于節(jié)省空間的考慮,隨之而來地則是用戶必須從這些幾乎相同的圖像中手動確定保留的對象,這個過程常常耗時費(fèi)力。越來越多的研究者希望計算機(jī)能夠輔助用戶選出相似照片中更具吸引力的照片,即找尋一種促進(jìn)系列照片篩選最優(yōu)圖像的自動評估方法。以往的圖像美學(xué)質(zhì)量評價研究工作大多直接使用頂層卷積層產(chǎn)生的特征對圖像進(jìn)行分類或回歸預(yù)測,這些方法僅采用神經(jīng)網(wǎng)絡(luò)有高級語義信息的特征,處理相似的系列照片傾向于產(chǎn)生類似的預(yù)測結(jié)果,且模型性能不佳。本文致力于將系列照片的美學(xué)質(zhì)量評價工作由單純的分類或回歸任務(wù)轉(zhuǎn)換為圖像排序比較任務(wù),通過將圖像在美感水平上進(jìn)行排序來達(dá)到美學(xué)評價的目的。基于上述背景,在本論文的工作中提出了基于多尺度視覺注意機(jī)制(Multi-Scale Visual Attention Mechanism)的最優(yōu)系列照片選擇方法。首先,本方法采用參數(shù)全共享的孿生卷積神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)學(xué)習(xí)兩幅相似圖像的區(qū)分性特征,以對圖像對做出相對的美學(xué)質(zhì)量評估。其次,我們通過加入較低層次的特征,以...
【文章來源】:山東大學(xué)山東省 211工程院校 985工程院校 教育部直屬院校
【文章頁數(shù)】:56 頁
【學(xué)位級別】:碩士
【部分圖文】:
圖1-1含有多幅圖像的系列照片,每個系列中的橙色框照片是大多數(shù)人所喜歡的照片
?山東大學(xué)碩士學(xué)位論文???mmm??i__m!丨丨?*mmmi?mmmm?mmmm?mmmm?wmmm?mmmm?wmmm?????wmmm?mmmm?mmmm?襄麵《?1?mmm?mm?.?wmm.?mmm?mmt?mmm?mmm?mmm?mmrn?wmtm?mmm?mmm??|桑??!?224X224?|?|?224X?224??*?f?1?J??(a)全連接方式?(b)局部連接方式??圖2-1局部連接與全連接方式??2)權(quán)值共享(shared?weights?and?biases)??權(quán)值共享是卷積層的特性之一。其核心思想是使用一個卷積核與輸入圖像的??不同區(qū)域作卷積,來檢測統(tǒng)計特性相同的特征。即使用同一卷積核卷積映射圖像??中的所有值,不論特征在任意位置均可被捕獲,可以保證特征具備位移不變性。??而使用不同卷積核對應(yīng)不同的權(quán)值參數(shù)可以用來檢測不同特征。如果只用了局部??連接的方法,圖2-1中(b)例舉的方法需要50176x9個權(quán)值參數(shù),而加入權(quán)值共享??方法后,使用一個3x3的卷積核共有9個參數(shù),所以現(xiàn)在僅需要9個權(quán)值,參數(shù)??數(shù)量進(jìn)一步降低。??3)池化(pooling)??為了處理特征信息的冗余,需要對特征的不同位置進(jìn)行統(tǒng)計聚合,這種統(tǒng)計??的操作就是做池化,有時也稱為下采樣、降采樣或欠采樣。池化處理常應(yīng)用于降??低特征維度,壓縮數(shù)據(jù),減少參數(shù)量,減小過擬合風(fēng)險和提高模型容錯性。??如圖2-2所示,常用的池化形式主要有兩種,一種是最大池化,一種是平均池??化,兩種形式都可以看做特殊的卷積過程。如圖示,兩種池化的卷積核在原圖的??滑動步幅全為2。平均池化的每個權(quán)重均相同,等同于對原圖進(jìn)行模
?山東大學(xué)碩士學(xué)位論文???Input?X?/?Kernel?W?Output?Y?Input?X?/?Kernel?W?Output?Y??/C/;r??——/?y—fV?°/ ̄7^——/y—??7.4?J??F?F??(a)最大池化?(b)平均池化??圖2-2池化的兩種形式??此處展示了一個經(jīng)典的卷積神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)如圖2-3所示,該網(wǎng)絡(luò)由兩個卷積層、??兩個池化層和一個全連接層組成。復(fù)用卷積層是為了獲取高級的語義特征。而在??每個卷積層后都緊跟一個池化層對特征再次提煉處理,利用這種特有組合方式衰??減特征的分辨率。最后使用全連接層來完成分類任務(wù),獲得最終的結(jié)果。卷積神??經(jīng)網(wǎng)絡(luò)本質(zhì)上是一種映射,能通過大量學(xué)習(xí)自動地獲得輸入到輸出間的映射關(guān)系。??僅通過設(shè)計卷積神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)并通過一定的獎懲機(jī)制加以訓(xùn)練,該方法便取代了??以往需要人工建立精確數(shù)學(xué)表達(dá)式的方式,更好的完成分類回歸等任務(wù)。??ft??h.??_t??T-lD-i--—r??r??i?convolution?|?pooling?|?convolution?|?pooling?|?fully?connected?|??圖2-3經(jīng)典卷積神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)??2.2多尺度特征融合??在輸入圖像轉(zhuǎn)化為輸出結(jié)果的過程中,圖像進(jìn)入卷積神經(jīng)網(wǎng)絡(luò)后會經(jīng)過多個??卷積層和池化層變成不同層次的特征,其隨著層數(shù)的加深會逐步擴(kuò)大感受野以獲??取高層語義。如圖2-4中所示可以看到靠近輸入端的高分率特征語義層次較低,富??含圖像細(xì)節(jié),但干擾信息較多;靠近輸出端的高層特征有較強(qiáng)概況能力,但分辨??13??
【參考文獻(xiàn)】:
期刊論文
[1]一種用戶偏好的美學(xué)圖像推薦方法[J]. 許永波,蘇士美,樊隆慶. 計算機(jī)應(yīng)用研究. 2019(12)
[2]主動特征學(xué)習(xí)及其在盲圖像質(zhì)量評價中的應(yīng)用[J]. 高飛,高新波. 計算機(jī)學(xué)報. 2014(10)
[3]結(jié)合淺景深與構(gòu)圖的圖像質(zhì)量評價[J]. 顧婷婷,郭延文,殷昆燕. 中國圖象圖形學(xué)報. 2013(05)
[4]圖像質(zhì)量評價方法研究進(jìn)展[J]. 蔣剛毅,黃大江,王旭,郁梅. 電子與信息學(xué)報. 2010(01)
本文編號:3490947
【文章來源】:山東大學(xué)山東省 211工程院校 985工程院校 教育部直屬院校
【文章頁數(shù)】:56 頁
【學(xué)位級別】:碩士
【部分圖文】:
圖1-1含有多幅圖像的系列照片,每個系列中的橙色框照片是大多數(shù)人所喜歡的照片
?山東大學(xué)碩士學(xué)位論文???mmm??i__m!丨丨?*mmmi?mmmm?mmmm?mmmm?wmmm?mmmm?wmmm?????wmmm?mmmm?mmmm?襄麵《?1?mmm?mm?.?wmm.?mmm?mmt?mmm?mmm?mmm?mmrn?wmtm?mmm?mmm??|桑??!?224X224?|?|?224X?224??*?f?1?J??(a)全連接方式?(b)局部連接方式??圖2-1局部連接與全連接方式??2)權(quán)值共享(shared?weights?and?biases)??權(quán)值共享是卷積層的特性之一。其核心思想是使用一個卷積核與輸入圖像的??不同區(qū)域作卷積,來檢測統(tǒng)計特性相同的特征。即使用同一卷積核卷積映射圖像??中的所有值,不論特征在任意位置均可被捕獲,可以保證特征具備位移不變性。??而使用不同卷積核對應(yīng)不同的權(quán)值參數(shù)可以用來檢測不同特征。如果只用了局部??連接的方法,圖2-1中(b)例舉的方法需要50176x9個權(quán)值參數(shù),而加入權(quán)值共享??方法后,使用一個3x3的卷積核共有9個參數(shù),所以現(xiàn)在僅需要9個權(quán)值,參數(shù)??數(shù)量進(jìn)一步降低。??3)池化(pooling)??為了處理特征信息的冗余,需要對特征的不同位置進(jìn)行統(tǒng)計聚合,這種統(tǒng)計??的操作就是做池化,有時也稱為下采樣、降采樣或欠采樣。池化處理常應(yīng)用于降??低特征維度,壓縮數(shù)據(jù),減少參數(shù)量,減小過擬合風(fēng)險和提高模型容錯性。??如圖2-2所示,常用的池化形式主要有兩種,一種是最大池化,一種是平均池??化,兩種形式都可以看做特殊的卷積過程。如圖示,兩種池化的卷積核在原圖的??滑動步幅全為2。平均池化的每個權(quán)重均相同,等同于對原圖進(jìn)行模
?山東大學(xué)碩士學(xué)位論文???Input?X?/?Kernel?W?Output?Y?Input?X?/?Kernel?W?Output?Y??/C/;r??——/?y—fV?°/ ̄7^——/y—??7.4?J??F?F??(a)最大池化?(b)平均池化??圖2-2池化的兩種形式??此處展示了一個經(jīng)典的卷積神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)如圖2-3所示,該網(wǎng)絡(luò)由兩個卷積層、??兩個池化層和一個全連接層組成。復(fù)用卷積層是為了獲取高級的語義特征。而在??每個卷積層后都緊跟一個池化層對特征再次提煉處理,利用這種特有組合方式衰??減特征的分辨率。最后使用全連接層來完成分類任務(wù),獲得最終的結(jié)果。卷積神??經(jīng)網(wǎng)絡(luò)本質(zhì)上是一種映射,能通過大量學(xué)習(xí)自動地獲得輸入到輸出間的映射關(guān)系。??僅通過設(shè)計卷積神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)并通過一定的獎懲機(jī)制加以訓(xùn)練,該方法便取代了??以往需要人工建立精確數(shù)學(xué)表達(dá)式的方式,更好的完成分類回歸等任務(wù)。??ft??h.??_t??T-lD-i--—r??r??i?convolution?|?pooling?|?convolution?|?pooling?|?fully?connected?|??圖2-3經(jīng)典卷積神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)??2.2多尺度特征融合??在輸入圖像轉(zhuǎn)化為輸出結(jié)果的過程中,圖像進(jìn)入卷積神經(jīng)網(wǎng)絡(luò)后會經(jīng)過多個??卷積層和池化層變成不同層次的特征,其隨著層數(shù)的加深會逐步擴(kuò)大感受野以獲??取高層語義。如圖2-4中所示可以看到靠近輸入端的高分率特征語義層次較低,富??含圖像細(xì)節(jié),但干擾信息較多;靠近輸出端的高層特征有較強(qiáng)概況能力,但分辨??13??
【參考文獻(xiàn)】:
期刊論文
[1]一種用戶偏好的美學(xué)圖像推薦方法[J]. 許永波,蘇士美,樊隆慶. 計算機(jī)應(yīng)用研究. 2019(12)
[2]主動特征學(xué)習(xí)及其在盲圖像質(zhì)量評價中的應(yīng)用[J]. 高飛,高新波. 計算機(jī)學(xué)報. 2014(10)
[3]結(jié)合淺景深與構(gòu)圖的圖像質(zhì)量評價[J]. 顧婷婷,郭延文,殷昆燕. 中國圖象圖形學(xué)報. 2013(05)
[4]圖像質(zhì)量評價方法研究進(jìn)展[J]. 蔣剛毅,黃大江,王旭,郁梅. 電子與信息學(xué)報. 2010(01)
本文編號:3490947
本文鏈接:http://sikaile.net/kejilunwen/zidonghuakongzhilunwen/3490947.html
最近更新
教材專著