具有新特性非負矩陣分解用于有遮擋人臉識別
發(fā)布時間:2021-04-12 16:51
非負矩陣分解(Non-negative Matrix Factorization,NMF)作為一種有效的數(shù)據(jù)降維和特征提取算法,已經(jīng)在諸多領(lǐng)域獲得了廣泛的應(yīng)用。而深度學習(Deep Learning),尤其是基于注意力機制(Attention Mechanism)的深度學習網(wǎng)絡(luò),也已經(jīng)成為當下最火熱的智能學習算法。本文在對NMF、注意力機制和深度學習進行深入研究后,提出了一種基于注意力機制的人臉屬性預測方法,并更進一步提出了一種基于屬性嵌入的改進非負矩陣分解算法。(1)本文提出了一種基于對稱注意力機制的人臉屬性預測網(wǎng)絡(luò)(Face Attribute Prediction Network with Symmetric Attention Mechanism,FAP-SA)。該網(wǎng)絡(luò)向基本的注意力機制中引入對稱性約束,并將獲得的注意力模塊并行嵌入傳統(tǒng)的卷積神經(jīng)網(wǎng)絡(luò),構(gòu)建了能對多種人臉屬性進行預測的統(tǒng)一框架。并且,對FAP-SA網(wǎng)絡(luò)的目標函數(shù)構(gòu)建和訓練過程也給出了描述。最后,將該網(wǎng)絡(luò)在標準的人臉屬性預測數(shù)據(jù)庫上進行微調(diào),之后進行了人臉屬性特征可視化實驗和人臉屬性預測實驗。實驗結(jié)果表明,所提出F...
【文章來源】:西安電子科技大學陜西省 211工程院校 教育部直屬院校
【文章頁數(shù)】:82 頁
【學位級別】:碩士
【部分圖文】:
傳統(tǒng)神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)示意圖
工神經(jīng)元能夠響應(yīng)部分周圍單元,對于處理海量統(tǒng)神經(jīng)網(wǎng)絡(luò)具有類似結(jié)構(gòu),均由可學習權(quán)重和偏規(guī)格的輸入,然后執(zhí)行點積計算,最后輸出對于同的地方在于,CNN 利用輸入的特點,將神。例如,輸入 RGB 圖像大小為224 224 3,則。圖 2.1 和圖 2.2 分別展示了傳統(tǒng)神經(jīng)網(wǎng)絡(luò)和 C圖 2.1 傳統(tǒng)神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)示意圖
圖 2.3 DeepID1 網(wǎng)絡(luò)結(jié)構(gòu)示意圖(2) DeepID2 網(wǎng)絡(luò)DeepID2[44]網(wǎng)絡(luò)對比于 DeepID1 在性能上有著較大提升。主要的原因在于DeepID2 網(wǎng)絡(luò)在 DeepID1 的基礎(chǔ)上添加了驗證信號。具體來說,DeepID1 網(wǎng)絡(luò)使用的是識別信號,即網(wǎng)絡(luò)最后一層的目標函數(shù)中Softmax 使用的是邏輯回歸 ( LogisticRegression );而 DeepID2 在目標函數(shù)中加上驗證信號,這兩種信號進行了加權(quán)組合。在 LFW 數(shù)據(jù)庫上獲得了 99.15%的人臉驗證精度。網(wǎng)絡(luò)的識別信號通過最小化交叉熵損失來訓練,表示如下: 1Ident , , log log nid i i iif t p p p (2-31)其中, f 代表DeepID2特征向量;t代表目標類別;id 代表Softmax層的參數(shù);ip 為目標概率分布, ip 是實際概率分布;其中對于目標類別t來講 1tp ,對于其他類別
【參考文獻】:
期刊論文
[1]基于非負矩陣分解的類標簽映射集成學習[J]. 高亮,潘積遠,于佳平. 科學技術(shù)與工程. 2018(01)
[2]基于改進的Fisher準則的多示例學習視頻人臉識別算法[J]. 王玉,申鉉京,陳海鵬. 自動化學報. 2018(12)
[3]基于深度學習與隨機森林的人臉年齡與性別分類研究[J]. 董蘭芳,張軍挺. 計算機工程. 2018(05)
本文編號:3133635
【文章來源】:西安電子科技大學陜西省 211工程院校 教育部直屬院校
【文章頁數(shù)】:82 頁
【學位級別】:碩士
【部分圖文】:
傳統(tǒng)神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)示意圖
工神經(jīng)元能夠響應(yīng)部分周圍單元,對于處理海量統(tǒng)神經(jīng)網(wǎng)絡(luò)具有類似結(jié)構(gòu),均由可學習權(quán)重和偏規(guī)格的輸入,然后執(zhí)行點積計算,最后輸出對于同的地方在于,CNN 利用輸入的特點,將神。例如,輸入 RGB 圖像大小為224 224 3,則。圖 2.1 和圖 2.2 分別展示了傳統(tǒng)神經(jīng)網(wǎng)絡(luò)和 C圖 2.1 傳統(tǒng)神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)示意圖
圖 2.3 DeepID1 網(wǎng)絡(luò)結(jié)構(gòu)示意圖(2) DeepID2 網(wǎng)絡(luò)DeepID2[44]網(wǎng)絡(luò)對比于 DeepID1 在性能上有著較大提升。主要的原因在于DeepID2 網(wǎng)絡(luò)在 DeepID1 的基礎(chǔ)上添加了驗證信號。具體來說,DeepID1 網(wǎng)絡(luò)使用的是識別信號,即網(wǎng)絡(luò)最后一層的目標函數(shù)中Softmax 使用的是邏輯回歸 ( LogisticRegression );而 DeepID2 在目標函數(shù)中加上驗證信號,這兩種信號進行了加權(quán)組合。在 LFW 數(shù)據(jù)庫上獲得了 99.15%的人臉驗證精度。網(wǎng)絡(luò)的識別信號通過最小化交叉熵損失來訓練,表示如下: 1Ident , , log log nid i i iif t p p p (2-31)其中, f 代表DeepID2特征向量;t代表目標類別;id 代表Softmax層的參數(shù);ip 為目標概率分布, ip 是實際概率分布;其中對于目標類別t來講 1tp ,對于其他類別
【參考文獻】:
期刊論文
[1]基于非負矩陣分解的類標簽映射集成學習[J]. 高亮,潘積遠,于佳平. 科學技術(shù)與工程. 2018(01)
[2]基于改進的Fisher準則的多示例學習視頻人臉識別算法[J]. 王玉,申鉉京,陳海鵬. 自動化學報. 2018(12)
[3]基于深度學習與隨機森林的人臉年齡與性別分類研究[J]. 董蘭芳,張軍挺. 計算機工程. 2018(05)
本文編號:3133635
本文鏈接:http://sikaile.net/kejilunwen/shengwushengchang/3133635.html
最近更新
教材專著