基于深度學(xué)習(xí)的偽裝人臉識別
發(fā)布時間:2021-01-17 07:47
隨著深度學(xué)習(xí)與計(jì)算機(jī)視覺的飛速發(fā)展,人臉識別技術(shù)在近十年中有了巨大的進(jìn)步。目前,人臉識別系統(tǒng)在大規(guī)模人臉數(shù)據(jù)集上已經(jīng)能實(shí)現(xiàn)超過人類的識別精度。盡管新的算法在不斷刷新性能,但大多數(shù)人臉識別系統(tǒng)對偽裝變化的人臉還是容易產(chǎn)生識別錯誤,這使得偽裝成為人臉識別領(lǐng)域最具有挑戰(zhàn)性的問題之一。由于公開的偽裝人臉數(shù)據(jù)集的規(guī)模普遍偏小,目前的偽裝人臉識別算法大多采用了兩階段式的訓(xùn)練方法:第一階段使用普通人臉數(shù)據(jù)集訓(xùn)練一個用于一般人臉識別的神經(jīng)網(wǎng)絡(luò),第二階段則在第一階段網(wǎng)絡(luò)模型上基于偽裝人臉數(shù)據(jù)集進(jìn)行遷移微調(diào)。本文針對偽裝人臉識別基于兩階段訓(xùn)練算法進(jìn)行研究,主要貢獻(xiàn)如下:(1)給出了國內(nèi)外人臉識別領(lǐng)域的研究現(xiàn)狀分析。首先,介紹了人臉識別的流程,重點(diǎn)包括損失函數(shù)、網(wǎng)絡(luò)架構(gòu)以及數(shù)據(jù)集;其次,分析了偽裝人臉識別的現(xiàn)狀、問題以及難點(diǎn)。(2)提出了一種用于偽裝人臉識別的新訓(xùn)練算法。新算法基于兩階段遷移訓(xùn)練模式,第一階段基于加性角間距損失函數(shù)來訓(xùn)練通用人臉識別網(wǎng)絡(luò)模型,第二階段利用基于三元組損失函數(shù)改進(jìn)得到的聯(lián)合損失函數(shù)在偽裝人臉數(shù)據(jù)集上進(jìn)行微調(diào)訓(xùn)練。鑒于通常配對訓(xùn)練時使用的三元組損失函數(shù)只限制了正樣本對與負(fù)樣本對之間...
【文章來源】:南京郵電大學(xué)江蘇省
【文章頁數(shù)】:79 頁
【學(xué)位級別】:碩士
【部分圖文】:
偽裝的兩種變化
南京郵電大學(xué)碩士研究生學(xué)位論文第二章基于深度學(xué)習(xí)的人臉識別9第二章基于深度學(xué)習(xí)的人臉識別經(jīng)過近半個世紀(jì)的發(fā)展,現(xiàn)在的人臉識別算法中已經(jīng)大量應(yīng)用了深度學(xué)習(xí)的技術(shù),包括基于卷積神經(jīng)網(wǎng)絡(luò)的人臉檢測以及特征提取,并且取得了顯著的成效。本章接下來將對現(xiàn)代基于深度學(xué)習(xí)的人臉識別技術(shù)進(jìn)行詳細(xì)的介紹:首先概略的描述人臉識別所需要的流程,接下來對流程中的各個部分進(jìn)行描述,其中重點(diǎn)介紹了人臉的檢測以及特征提取的過程。人臉識別的流程圖2.1從原始圖像到特征向量對被采集到的圖像進(jìn)行人臉識別的流程包括四步:人臉檢測、人臉對齊、特征提取以及特征比對,圖2.1給出了從原圖像獲得特征向量的過程示例。人臉檢測的目的是為了從原始圖像中標(biāo)識出人臉的位置,現(xiàn)在部分檢測算法甚至還可以檢測出人臉上一些關(guān)鍵點(diǎn)的位置;人臉對齊是利用人臉圖像上的一些關(guān)鍵點(diǎn)坐標(biāo)和標(biāo)準(zhǔn)人臉模版上的關(guān)鍵點(diǎn)坐標(biāo)來進(jìn)行相似變換以得到校正的人臉的過程;特征提取是將人臉圖像轉(zhuǎn)換為用來進(jìn)行比對的特征向量的過程,一般所用的人臉都是經(jīng)過對齊的;最后特征比對是對特征向量進(jìn)行距離運(yùn)算來衡量特征向量間相似性的過程,通過這些距離可以判斷不同的特征向量是否來源于相同的人,以此進(jìn)行識別。人臉檢測由于采集到的原始圖像中可能不止有一個人臉并且充斥著大量與人臉無關(guān)的信息,所以通常需要對這些圖像進(jìn)行人臉檢測得到人臉的具體位置,如圖2.2所示。
南京郵電大學(xué)碩士研究生學(xué)位論文第二章基于深度學(xué)習(xí)的人臉識別10圖2.2人臉檢測由于深度學(xué)習(xí)的發(fā)展,基于深度學(xué)習(xí)的目標(biāo)檢測算法得到了大量的研究,以此為基礎(chǔ),神經(jīng)網(wǎng)絡(luò)被廣泛的運(yùn)用在了人臉檢測上[51-59],其取得的效果明顯好于傳統(tǒng)的基于圖像紋理特征的檢測算法[60-64]。當(dāng)前的檢測算法可以分成多階段檢測[65-67]與單階段檢測[68-70]兩種,其中多階段檢測算法會在第一階段從輸入圖像中挑選出一些粗略的目標(biāo)區(qū)域,后續(xù)的階段會對這些區(qū)域進(jìn)行分析得出準(zhǔn)確的目標(biāo)區(qū)域,這是一個由粗略到精細(xì)的過程;單階段檢測算法會由網(wǎng)絡(luò)直接得到目標(biāo)區(qū)域,因此檢測效率較多階段算法更高,但檢測準(zhǔn)確度可能有所不足。圖2.3MTCNN網(wǎng)絡(luò)結(jié)構(gòu)本文后續(xù)會使用MTCNN[54]作為人臉檢測的算法,因此接下來對其進(jìn)行詳細(xì)的介紹。MTCNN是一個三階段檢測算法,它不僅可以得到人臉區(qū)域的邊界框(BoundingBox),還可以得出人臉的五個關(guān)鍵點(diǎn)(雙眼、鼻尖、嘴唇邊角)的坐標(biāo),圖2.1中展示了檢測結(jié)果。圖2.3中給出了MTCNN的結(jié)構(gòu),它定義了P-Net、R-Net和O-Net這三個結(jié)構(gòu)相似的網(wǎng)絡(luò)。對于網(wǎng)絡(luò)中非輸出層的每個卷積層與全連接層都使用PRelu[]作為激活函數(shù),這一點(diǎn)并未在圖中給出。下面將從訓(xùn)練與實(shí)際檢測兩方面來介紹:1)訓(xùn)練:
本文編號:2982475
【文章來源】:南京郵電大學(xué)江蘇省
【文章頁數(shù)】:79 頁
【學(xué)位級別】:碩士
【部分圖文】:
偽裝的兩種變化
南京郵電大學(xué)碩士研究生學(xué)位論文第二章基于深度學(xué)習(xí)的人臉識別9第二章基于深度學(xué)習(xí)的人臉識別經(jīng)過近半個世紀(jì)的發(fā)展,現(xiàn)在的人臉識別算法中已經(jīng)大量應(yīng)用了深度學(xué)習(xí)的技術(shù),包括基于卷積神經(jīng)網(wǎng)絡(luò)的人臉檢測以及特征提取,并且取得了顯著的成效。本章接下來將對現(xiàn)代基于深度學(xué)習(xí)的人臉識別技術(shù)進(jìn)行詳細(xì)的介紹:首先概略的描述人臉識別所需要的流程,接下來對流程中的各個部分進(jìn)行描述,其中重點(diǎn)介紹了人臉的檢測以及特征提取的過程。人臉識別的流程圖2.1從原始圖像到特征向量對被采集到的圖像進(jìn)行人臉識別的流程包括四步:人臉檢測、人臉對齊、特征提取以及特征比對,圖2.1給出了從原圖像獲得特征向量的過程示例。人臉檢測的目的是為了從原始圖像中標(biāo)識出人臉的位置,現(xiàn)在部分檢測算法甚至還可以檢測出人臉上一些關(guān)鍵點(diǎn)的位置;人臉對齊是利用人臉圖像上的一些關(guān)鍵點(diǎn)坐標(biāo)和標(biāo)準(zhǔn)人臉模版上的關(guān)鍵點(diǎn)坐標(biāo)來進(jìn)行相似變換以得到校正的人臉的過程;特征提取是將人臉圖像轉(zhuǎn)換為用來進(jìn)行比對的特征向量的過程,一般所用的人臉都是經(jīng)過對齊的;最后特征比對是對特征向量進(jìn)行距離運(yùn)算來衡量特征向量間相似性的過程,通過這些距離可以判斷不同的特征向量是否來源于相同的人,以此進(jìn)行識別。人臉檢測由于采集到的原始圖像中可能不止有一個人臉并且充斥著大量與人臉無關(guān)的信息,所以通常需要對這些圖像進(jìn)行人臉檢測得到人臉的具體位置,如圖2.2所示。
南京郵電大學(xué)碩士研究生學(xué)位論文第二章基于深度學(xué)習(xí)的人臉識別10圖2.2人臉檢測由于深度學(xué)習(xí)的發(fā)展,基于深度學(xué)習(xí)的目標(biāo)檢測算法得到了大量的研究,以此為基礎(chǔ),神經(jīng)網(wǎng)絡(luò)被廣泛的運(yùn)用在了人臉檢測上[51-59],其取得的效果明顯好于傳統(tǒng)的基于圖像紋理特征的檢測算法[60-64]。當(dāng)前的檢測算法可以分成多階段檢測[65-67]與單階段檢測[68-70]兩種,其中多階段檢測算法會在第一階段從輸入圖像中挑選出一些粗略的目標(biāo)區(qū)域,后續(xù)的階段會對這些區(qū)域進(jìn)行分析得出準(zhǔn)確的目標(biāo)區(qū)域,這是一個由粗略到精細(xì)的過程;單階段檢測算法會由網(wǎng)絡(luò)直接得到目標(biāo)區(qū)域,因此檢測效率較多階段算法更高,但檢測準(zhǔn)確度可能有所不足。圖2.3MTCNN網(wǎng)絡(luò)結(jié)構(gòu)本文后續(xù)會使用MTCNN[54]作為人臉檢測的算法,因此接下來對其進(jìn)行詳細(xì)的介紹。MTCNN是一個三階段檢測算法,它不僅可以得到人臉區(qū)域的邊界框(BoundingBox),還可以得出人臉的五個關(guān)鍵點(diǎn)(雙眼、鼻尖、嘴唇邊角)的坐標(biāo),圖2.1中展示了檢測結(jié)果。圖2.3中給出了MTCNN的結(jié)構(gòu),它定義了P-Net、R-Net和O-Net這三個結(jié)構(gòu)相似的網(wǎng)絡(luò)。對于網(wǎng)絡(luò)中非輸出層的每個卷積層與全連接層都使用PRelu[]作為激活函數(shù),這一點(diǎn)并未在圖中給出。下面將從訓(xùn)練與實(shí)際檢測兩方面來介紹:1)訓(xùn)練:
本文編號:2982475
本文鏈接:http://sikaile.net/kejilunwen/shengwushengchang/2982475.html
最近更新
教材專著