基于深度學(xué)習(xí)的人臉美麗吸引力評價與分析
發(fā)布時間:2022-02-04 17:09
人臉美麗吸引力長期以來受到了來自社會科學(xué)和自然科學(xué)不同領(lǐng)域的關(guān)注和研究。心理學(xué)上的研究表明人臉吸引力表征與評價具有某種的數(shù)據(jù)驅(qū)動性與客觀性,這為機器實現(xiàn)人臉吸引力的智能評價提供了可能性。近年來,隨著機器學(xué)習(xí)尤其是深度學(xué)習(xí)的發(fā)展,人臉美麗吸引力受到了許多學(xué)者的關(guān)注,人臉吸引力評價系統(tǒng)也逐漸在輔助醫(yī)療美容、社交網(wǎng)站的個性化推薦和人臉美化系統(tǒng)等不同的場景中得到廣泛應(yīng)用。本課題將從不同的角度來研究人臉美麗吸引力評價的特征學(xué)習(xí)和預(yù)測模型,構(gòu)建智能化人臉吸引力評價系統(tǒng)。具體來說,針對傳統(tǒng)機器學(xué)習(xí)方法中特征工程與分類器分階段優(yōu)化的不足,人臉吸引力標(biāo)準(zhǔn)數(shù)據(jù)庫評價范式單一,人臉吸引力評價方法缺乏相對審美機制、人臉屬性信息的引導(dǎo)、以及個性化評價等因素的建模,本文基于深度學(xué)習(xí)方法,從構(gòu)建人臉美麗數(shù)據(jù)庫、人臉美麗評價算法以及個性化人臉美麗評價算法這幾個方向進(jìn)行展開研究,從而實現(xiàn)了讓機器具有和人類一樣的審美感知能力。本文的主要工作和創(chuàng)新點主要包括以下幾個方面:(1)針對目前缺乏規(guī)模較大的、屬性多樣的人臉美麗數(shù)據(jù)庫的難題,本文構(gòu)建了一個多范式的人臉美麗吸引力數(shù)據(jù)庫(SCUT-FBP5500數(shù)據(jù)庫)。更大規(guī)模的數(shù)據(jù)...
【文章來源】:華南理工大學(xué)廣東省211工程院校985工程院校教育部直屬院校
【文章頁數(shù)】:143 頁
【學(xué)位級別】:博士
【部分圖文】:
圖2-1?LeNet-5網(wǎng)絡(luò)結(jié)構(gòu)[_??——
;2)不需要對圖??像做過多的預(yù)處理,以圖像像素值就可以作為輸入,避免了復(fù)雜的特征過程;3)?CNN??特征對于圖像的縮放、平移、旋轉(zhuǎn)等畸變具有不變性,所以具有很強的泛化性能^目前??的卷積神經(jīng)網(wǎng)絡(luò)中主要包含有卷積層、激活層、池化層、全連後層等基本單元接下來,??我們對這幾個塞本單元分別進(jìn)行詳細(xì)的介紹。??(1)卷積層??杏彳??—0、、'、'、-、、??_|:二_:與??■跋二???^?°?^?輸入大�。剑叮�,??0?>?1?卷碰大小=3x3,??步長=3??圖2-2二維卷積示意圖??卷積層的功能是對輸入數(shù)據(jù)進(jìn)行提取特征,其內(nèi)部包含有多個卷積核。每個卷積核??在工作時,會以一定步長掃過輸入的特征圖,在每一步掃描時卷積核對輸入特征中的感??受野區(qū)域進(jìn)行按元素相乘再求和,求和的值作為輸出特征圖中相對應(yīng)的神經(jīng)元。因此可??以說,輸入特征圖中不同空間位置的神經(jīng)元共享同一個卷積核,并且輸出特征圖中每個??祌經(jīng)元都與前一層中感受野區(qū)域內(nèi)的多個神經(jīng)元相連,這就是卷積層權(quán)值共享、局部連??接的特性。為了更直觀地理解,圖2-2中展示了當(dāng)輸入特征圖大�。叮�,卷積核大小為??3?X?3,步長為3時的^維卷積本意_圓.》??由于現(xiàn)實中卷積核都是三維的,我們將二維卷積拓展到三維卷積。假設(shè)一個H維卷??積核的空間尺寸為/cx/c,通道個數(shù)為C?(同時也代表輸入特征的通道數(shù)),則該卷積核??在工作時,每一步掃描都會對輸入特征的所有通道的/c?x?大小的感受野區(qū)域進(jìn)行矩陣??元素乘法求和。也就是說,每一次卷積都會產(chǎn)生Cx/cx/c次乘法操作》圖2-3中展示了??19??
?華南理工大學(xué)博士學(xué)位論文???最大池化是指將特征圖根據(jù)池化區(qū)域大孝步長、填充等參數(shù)劃分成著于個子g域,??對每個子域取最大值作為輸出。平均池化則是對每個子區(qū)域取平均值作為輸出圖2-??4分別展示了輸入特征大小為6?X?6,池化區(qū)域3?X?3,步長為3的最大池化和平均池化。??平均池化??最大池化??><??1,6?^.1?z??彳412?rlj?全局平均池化??圖2-4不同的池化方式示意圖??全局〒均池化[116]則是指不再劃分子區(qū)域,將整張?zhí)卣鲌D當(dāng)成池化區(qū)域進(jìn)行乎均池??化的操作,類似操作還有全JI最大池化。這種全局池化的做法可以保證固定的輸出大小,??將特征圖從任何空間大小降為1?x?1。因此,全局池化一般放在模型中第一層全連接層的??前面,對特征圖進(jìn)行統(tǒng)一降維,從而可以對模型輸入任何尺寸的圖片,而不再需要改變??全連接層的神經(jīng)元數(shù)量了(因為全連接層的輸入神經(jīng)元個數(shù)是固定的)。??根據(jù)以上的描述,總結(jié)出池化層具有以下的特點與優(yōu)勢:1)特征不變性,對輸入特??征的平移和旋轉(zhuǎn)具有不變性,更加關(guān)注具有某些特征而不是特征的位置;2)在空間尺度??上對特征進(jìn)行下采樣,減小了輸出尺寸,從而減少了參數(shù)量和計算開銷,使模型可以向??更深更寬的維度進(jìn)行擴展;3)模型的參數(shù)量減少,將在一定程度上防止過擬合。??(4)全連接層??一般來說,卷積神經(jīng)網(wǎng)絡(luò)中的卷積層和池化層的作用是對輸入圖像進(jìn)行特征提取,??而全連接層是對所提取的特征進(jìn)行非線性組合從而達(dá)到預(yù)測的目的。■此,全連接層一??般作為卷積神經(jīng)網(wǎng)絡(luò)的最后部分。全連接層實際上相當(dāng)于感知器中的隱含層、可通過公??式(2-5)進(jìn)行表示:??22??
【參考文獻(xiàn)】:
博士論文
[1]人臉圖像的自適應(yīng)美化與渲染研究[D]. 梁凌宇.華南理工大學(xué) 2014
[2]人臉美麗吸引力的特征分析與機器學(xué)習(xí)[D]. 毛慧蕓.華南理工大學(xué) 2011
碩士論文
[1]基于深度學(xué)習(xí)的人臉美麗吸引力預(yù)測[D]. 許杰.華南理工大學(xué) 2017
[2]人臉美麗的特征分析及其云系統(tǒng)設(shè)計[D]. 謝多睿.華南理工大學(xué) 2017
本文編號:3613602
【文章來源】:華南理工大學(xué)廣東省211工程院校985工程院校教育部直屬院校
【文章頁數(shù)】:143 頁
【學(xué)位級別】:博士
【部分圖文】:
圖2-1?LeNet-5網(wǎng)絡(luò)結(jié)構(gòu)[_??——
;2)不需要對圖??像做過多的預(yù)處理,以圖像像素值就可以作為輸入,避免了復(fù)雜的特征過程;3)?CNN??特征對于圖像的縮放、平移、旋轉(zhuǎn)等畸變具有不變性,所以具有很強的泛化性能^目前??的卷積神經(jīng)網(wǎng)絡(luò)中主要包含有卷積層、激活層、池化層、全連後層等基本單元接下來,??我們對這幾個塞本單元分別進(jìn)行詳細(xì)的介紹。??(1)卷積層??杏彳??—0、、'、'、-、、??_|:二_:與??■跋二???^?°?^?輸入大�。剑叮�,??0?>?1?卷碰大小=3x3,??步長=3??圖2-2二維卷積示意圖??卷積層的功能是對輸入數(shù)據(jù)進(jìn)行提取特征,其內(nèi)部包含有多個卷積核。每個卷積核??在工作時,會以一定步長掃過輸入的特征圖,在每一步掃描時卷積核對輸入特征中的感??受野區(qū)域進(jìn)行按元素相乘再求和,求和的值作為輸出特征圖中相對應(yīng)的神經(jīng)元。因此可??以說,輸入特征圖中不同空間位置的神經(jīng)元共享同一個卷積核,并且輸出特征圖中每個??祌經(jīng)元都與前一層中感受野區(qū)域內(nèi)的多個神經(jīng)元相連,這就是卷積層權(quán)值共享、局部連??接的特性。為了更直觀地理解,圖2-2中展示了當(dāng)輸入特征圖大�。叮�,卷積核大小為??3?X?3,步長為3時的^維卷積本意_圓.》??由于現(xiàn)實中卷積核都是三維的,我們將二維卷積拓展到三維卷積。假設(shè)一個H維卷??積核的空間尺寸為/cx/c,通道個數(shù)為C?(同時也代表輸入特征的通道數(shù)),則該卷積核??在工作時,每一步掃描都會對輸入特征的所有通道的/c?x?大小的感受野區(qū)域進(jìn)行矩陣??元素乘法求和。也就是說,每一次卷積都會產(chǎn)生Cx/cx/c次乘法操作》圖2-3中展示了??19??
?華南理工大學(xué)博士學(xué)位論文???最大池化是指將特征圖根據(jù)池化區(qū)域大孝步長、填充等參數(shù)劃分成著于個子g域,??對每個子域取最大值作為輸出。平均池化則是對每個子區(qū)域取平均值作為輸出圖2-??4分別展示了輸入特征大小為6?X?6,池化區(qū)域3?X?3,步長為3的最大池化和平均池化。??平均池化??最大池化??><??1,6?^.1?z??彳412?rlj?全局平均池化??圖2-4不同的池化方式示意圖??全局〒均池化[116]則是指不再劃分子區(qū)域,將整張?zhí)卣鲌D當(dāng)成池化區(qū)域進(jìn)行乎均池??化的操作,類似操作還有全JI最大池化。這種全局池化的做法可以保證固定的輸出大小,??將特征圖從任何空間大小降為1?x?1。因此,全局池化一般放在模型中第一層全連接層的??前面,對特征圖進(jìn)行統(tǒng)一降維,從而可以對模型輸入任何尺寸的圖片,而不再需要改變??全連接層的神經(jīng)元數(shù)量了(因為全連接層的輸入神經(jīng)元個數(shù)是固定的)。??根據(jù)以上的描述,總結(jié)出池化層具有以下的特點與優(yōu)勢:1)特征不變性,對輸入特??征的平移和旋轉(zhuǎn)具有不變性,更加關(guān)注具有某些特征而不是特征的位置;2)在空間尺度??上對特征進(jìn)行下采樣,減小了輸出尺寸,從而減少了參數(shù)量和計算開銷,使模型可以向??更深更寬的維度進(jìn)行擴展;3)模型的參數(shù)量減少,將在一定程度上防止過擬合。??(4)全連接層??一般來說,卷積神經(jīng)網(wǎng)絡(luò)中的卷積層和池化層的作用是對輸入圖像進(jìn)行特征提取,??而全連接層是對所提取的特征進(jìn)行非線性組合從而達(dá)到預(yù)測的目的。■此,全連接層一??般作為卷積神經(jīng)網(wǎng)絡(luò)的最后部分。全連接層實際上相當(dāng)于感知器中的隱含層、可通過公??式(2-5)進(jìn)行表示:??22??
【參考文獻(xiàn)】:
博士論文
[1]人臉圖像的自適應(yīng)美化與渲染研究[D]. 梁凌宇.華南理工大學(xué) 2014
[2]人臉美麗吸引力的特征分析與機器學(xué)習(xí)[D]. 毛慧蕓.華南理工大學(xué) 2011
碩士論文
[1]基于深度學(xué)習(xí)的人臉美麗吸引力預(yù)測[D]. 許杰.華南理工大學(xué) 2017
[2]人臉美麗的特征分析及其云系統(tǒng)設(shè)計[D]. 謝多睿.華南理工大學(xué) 2017
本文編號:3613602
本文鏈接:http://sikaile.net/shoufeilunwen/xxkjbs/3613602.html
最近更新
教材專著