基于深度學習的臉耳多模態(tài)身份驗證研究與系統(tǒng)設計
發(fā)布時間:2020-12-14 07:56
隨著人工智能技術的快速發(fā)展,生物特征識別技術在教育、醫(yī)療、軍事、金融等各個領域得到廣泛應用。盡管如此,在實際應用場合中,基于單一生物特征的生物特征識別系統(tǒng)常受到噪聲干擾、非普遍性和抗哄騙能力差等諸多因素的制約,而利用多種生物特征信息的多模態(tài)生物特征識別系統(tǒng)可在一定程度上緩解單模態(tài)生物特征識別系統(tǒng)的部分缺陷,并且通過多模態(tài)生物特征融合顯著提高系統(tǒng)識別性能。人臉識別采用非接觸式圖像采集,符合人類視覺識別習慣,并可隱蔽操作,應用場景和范圍比指紋、虹膜識別等更加豐富和廣泛。但人臉易受光照、姿態(tài)、表情、化妝和年齡等因素影響,人耳位于人臉附近,耳形狀穩(wěn)定,幾乎不受表情和年齡的影響,結合人臉與人耳進行多模態(tài)識別,可提高系統(tǒng)的準確性和抗干擾能力,并增加可識別的角度范圍。本文著重研究基于深度學習的人臉人耳檢測技術和多模態(tài)融合識別,并設計和實現了一個基于臉耳多模態(tài)識別的考生簽到系統(tǒng)。在人臉人耳檢測方面,本文將頭部圖像劃分和定義為人臉區(qū)域、人耳區(qū)域和頭部區(qū)域,標注三類目標訓練樣本,采用Mask Scoring R-CNN檢測技術框架進行訓練和檢測。由于人耳目標較小,訓練樣本有限,誤檢率較高。針對該問題,提出...
【文章來源】:西華大學四川省
【文章頁數】:75 頁
【學位級別】:碩士
【部分圖文】:
常見的用于生物特征識別的生物特征示例
西華大學碩士學位論文13圖2.1MaskScoringR-CNN流程圖Fig.2.1FlowchartofMaskScoringR-CNN2.1.1主干網絡在目標檢測中,特征提取至關重要,在MaskScoringR-CNN中主干網絡(Backbonenetwork)一般選用深度卷積神經網絡提取圖像特征,現在卷積神經網絡的發(fā)展趨勢就是:足夠深、足夠廣。足夠深就是網絡層數足夠深,深層網絡大多數情況下較淺層網絡性能都會有足夠的提升。足夠廣就意味著要從多尺度(Multi-Scale)的特征進行,多尺度可以很好地解決不同分辨率大小的目標。然而網絡模型深度的加深,帶來的不一定是性能的提升,梯度消失和網絡退化隨之而來,訓練難度加大。為了處理上述問題,訓練網絡時加速收斂,引入了殘差神經網絡(ResNet)。圖2.2是ResNet的18層網絡的結構示意圖。
基于深度學習的臉耳多模態(tài)身份驗證研究與系統(tǒng)設計16公式(2.1)所示。H)()x(xxF(2.1)除此之外,殘差網絡關注特征矩陣維度的變化,殘差網絡利用11卷積和BatchNormalization層沒有增加新的學習參數的情況下,加速訓練過程中網絡的收斂。2.1.2特征金字塔(FPN)多尺度問題常用的解決方案就是構造多尺度金字塔。特征金字塔網絡(FPN)是2017年由Facebook提出的用于多尺度檢測的算法[50],通過自上而下和自上而下的網絡連接方式,計算量沒有明顯的增加,實時性基本不受影響,大幅提升對小尺度目標的檢測性能。由此本文采用的MaskScoringR-CNN中引入了多尺度的特征金字塔網絡(FeaturePyramidNetwork,FPN),網絡可以分為由自下而上和自上而下兩條通道側向連接,如圖2.3所示。圖2.3特征金字塔網絡結構圖Fig.2.3StructurechartofFeaturizedPyramidNetwork(1)自下而上(Bottom-up)的過程就是卷積神經網絡的正向傳播過程,將處理后的圖片送入特征網絡經過卷積運算后,隨著層數的增多,空間分辨率減少,從圖像中挖掘到更多的語義信息。(2)自上而下(Top-down)和側向連接的過程是得到的深層特征圖通過上采樣操作一步步還原回去,保留特征圖的語義信息,同時增大了特征圖的尺寸。通過側向連接將自下而上和自上而下的通道進行側向連接,側向連接的時候按照逐元素相加的規(guī)則進
本文編號:2916103
【文章來源】:西華大學四川省
【文章頁數】:75 頁
【學位級別】:碩士
【部分圖文】:
常見的用于生物特征識別的生物特征示例
西華大學碩士學位論文13圖2.1MaskScoringR-CNN流程圖Fig.2.1FlowchartofMaskScoringR-CNN2.1.1主干網絡在目標檢測中,特征提取至關重要,在MaskScoringR-CNN中主干網絡(Backbonenetwork)一般選用深度卷積神經網絡提取圖像特征,現在卷積神經網絡的發(fā)展趨勢就是:足夠深、足夠廣。足夠深就是網絡層數足夠深,深層網絡大多數情況下較淺層網絡性能都會有足夠的提升。足夠廣就意味著要從多尺度(Multi-Scale)的特征進行,多尺度可以很好地解決不同分辨率大小的目標。然而網絡模型深度的加深,帶來的不一定是性能的提升,梯度消失和網絡退化隨之而來,訓練難度加大。為了處理上述問題,訓練網絡時加速收斂,引入了殘差神經網絡(ResNet)。圖2.2是ResNet的18層網絡的結構示意圖。
基于深度學習的臉耳多模態(tài)身份驗證研究與系統(tǒng)設計16公式(2.1)所示。H)()x(xxF(2.1)除此之外,殘差網絡關注特征矩陣維度的變化,殘差網絡利用11卷積和BatchNormalization層沒有增加新的學習參數的情況下,加速訓練過程中網絡的收斂。2.1.2特征金字塔(FPN)多尺度問題常用的解決方案就是構造多尺度金字塔。特征金字塔網絡(FPN)是2017年由Facebook提出的用于多尺度檢測的算法[50],通過自上而下和自上而下的網絡連接方式,計算量沒有明顯的增加,實時性基本不受影響,大幅提升對小尺度目標的檢測性能。由此本文采用的MaskScoringR-CNN中引入了多尺度的特征金字塔網絡(FeaturePyramidNetwork,FPN),網絡可以分為由自下而上和自上而下兩條通道側向連接,如圖2.3所示。圖2.3特征金字塔網絡結構圖Fig.2.3StructurechartofFeaturizedPyramidNetwork(1)自下而上(Bottom-up)的過程就是卷積神經網絡的正向傳播過程,將處理后的圖片送入特征網絡經過卷積運算后,隨著層數的增多,空間分辨率減少,從圖像中挖掘到更多的語義信息。(2)自上而下(Top-down)和側向連接的過程是得到的深層特征圖通過上采樣操作一步步還原回去,保留特征圖的語義信息,同時增大了特征圖的尺寸。通過側向連接將自下而上和自上而下的通道進行側向連接,側向連接的時候按照逐元素相加的規(guī)則進
本文編號:2916103
本文鏈接:http://sikaile.net/kejilunwen/zidonghuakongzhilunwen/2916103.html