天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

姿態(tài)和遮擋魯棒的人臉關(guān)鍵點(diǎn)檢測算法研究

發(fā)布時間:2022-02-18 17:10
  隨著人工智能時代的到來,以人臉圖像為中心的計算機(jī)視覺得到了快速的發(fā)展。人臉關(guān)鍵點(diǎn)檢測,又名人臉對齊,作為諸如人臉識別、表情識別等高級別視覺任務(wù)的基礎(chǔ)技術(shù),是多媒體領(lǐng)域研究的熱點(diǎn)。由于人臉外觀存在剛性與非剛性的復(fù)雜形變,傳統(tǒng)人臉關(guān)鍵點(diǎn)檢測算法常對挑戰(zhàn)性場景較為敏感,比如人臉的大角度姿態(tài)變換,以及部分遮擋等。近年來,深度學(xué)習(xí)的發(fā)展給人臉關(guān)鍵點(diǎn)檢測技術(shù)帶來了曙光,因此本文的工作將以深度神經(jīng)網(wǎng)絡(luò)為主、以傳統(tǒng)算法為輔,對人臉關(guān)鍵點(diǎn)檢測問題作進(jìn)一步的研究,本文的主要工作如下:(1)基于人臉區(qū)域規(guī)范化和可變形沙漏網(wǎng)絡(luò)的二階段人臉關(guān)鍵點(diǎn)檢測。沙漏網(wǎng)絡(luò)是用于人臉關(guān)鍵點(diǎn)檢測的經(jīng)典網(wǎng)絡(luò),但是其對大角度姿態(tài)變化較為敏感。為了提高沙漏網(wǎng)絡(luò)對大角度姿態(tài)變化以及表情變化的魯棒性,提出二階段模型用于人臉關(guān)鍵點(diǎn)檢測。首先,通過使用空間變換網(wǎng)絡(luò)校正人臉,簡化了傳統(tǒng)上使用檢測的關(guān)鍵點(diǎn)和人臉均值形狀進(jìn)行普氏分析,進(jìn)而采用仿射變換來規(guī)范化人臉區(qū)域的方法。由此不同姿態(tài)變化的人臉圖像都可以被變換成規(guī)范狀態(tài),實驗證明有助于提升之后的人臉關(guān)鍵點(diǎn)檢測的性能。其次,由可變形卷積網(wǎng)絡(luò)得到啟發(fā),將可變形卷積與原始沙漏網(wǎng)絡(luò)結(jié)合。可變形沙漏網(wǎng)絡(luò)的... 

【文章來源】:安徽大學(xué)安徽省211工程院校

【文章頁數(shù)】:70 頁

【學(xué)位級別】:碩士

【部分圖文】:

姿態(tài)和遮擋魯棒的人臉關(guān)鍵點(diǎn)檢測算法研究


級聯(lián)形狀回歸模型預(yù)測過程

過程圖,卷積,過程,卷積核


第二章人臉關(guān)鍵點(diǎn)檢測相關(guān)理論8第二章人臉關(guān)鍵點(diǎn)檢測相關(guān)理論近年來人臉關(guān)鍵點(diǎn)檢測算法主要由深度學(xué)習(xí)主導(dǎo),用于人臉關(guān)鍵點(diǎn)檢測相關(guān)的深度神經(jīng)網(wǎng)絡(luò)是卷積神經(jīng)網(wǎng)絡(luò)。本章首先對這些相關(guān)技術(shù)做簡要介紹,并介紹相關(guān)的評估數(shù)據(jù)集。2.1卷積神經(jīng)網(wǎng)絡(luò)相關(guān)理論在深度學(xué)習(xí)中,卷積神經(jīng)網(wǎng)絡(luò)是最常用的深度網(wǎng)絡(luò)之一,主要用于視覺任務(wù),比如圖像和視頻識別、圖像分類、醫(yī)學(xué)圖像處理以及圖像跟蹤定位等。當(dāng)然,卷積神經(jīng)網(wǎng)絡(luò)也可處理自然語言處理等非視覺任務(wù)。卷積神經(jīng)網(wǎng)絡(luò)具有不同于其他網(wǎng)絡(luò)的一種數(shù)學(xué)運(yùn)算——卷積、池化運(yùn)算。2.1.1卷積層通常根據(jù)卷積神經(jīng)網(wǎng)絡(luò)的設(shè)計規(guī)則,輸入的RGB三通道的圖像通常以四維張量的形式表示為n×c×h×w,n,c,h,w分別代表圖像數(shù)量、圖像深度、圖像高度以及圖像寬度。同樣,整個網(wǎng)絡(luò)中的特征圖也是以這種形式表示。卷積層具有以下屬性:1)有固定尺寸的卷積核;2)有輸入以及輸出特征圖通道數(shù)量的定義;3)卷積核的深度必須等于輸入特征圖的通道數(shù),輸出特征圖的通道數(shù)顯然與卷積核的個數(shù)一一對應(yīng)。卷積計算的示意圖如下圖所示:圖2.1卷積計算過程Figure2.1Calculationprocessofconvolution上圖為一個3×3卷積核對一個單通道的輸入特征圖進(jìn)行處理,生成的新特征圖輸入到網(wǎng)絡(luò)的下一層。可以看出,卷積核只能以其自身大小來進(jìn)行學(xué)習(xí),這種特性稱之為卷

特征圖,操作過程,全連接,特征圖


2.1.2池化層池化層是一種形式的降采樣,它的出現(xiàn)是為了進(jìn)一步降低參數(shù)量,提高網(wǎng)絡(luò)的深度上限。簡單的說,池化層是對前一層特征圖的降維,即將輸入的特征圖劃分為若干矩形區(qū)域,對每個子區(qū)域計算得到一個值。根據(jù)采樣方式的不同池化操作有兩類:1)最大池化;2)平均池化。最大池化使用上一層特征圖的子區(qū)域中的最大值,平均池化使用上一層特征圖的子區(qū)域中的平均值。這種方式降低了特征圖的尺寸,進(jìn)而使得網(wǎng)絡(luò)的整體參數(shù)量得到降低,并且可以減弱參數(shù)量過大帶來過擬合的副作用。如下圖所示為一個2×2大小的池化操作。圖2.2池化操作過程Figure2.2Processofpoolingoperation2.1.3全連接層在早期的神經(jīng)網(wǎng)絡(luò)設(shè)計中,全連接層是必不可少的存在。例如在完全連接網(wǎng)絡(luò)中所有層均為全連接層,早期卷積神經(jīng)網(wǎng)絡(luò)的設(shè)計理念也是由全連接層作為網(wǎng)絡(luò)的結(jié)尾。實際上,一系列的卷積層可以看作特征提取器,而最后的全連接層就是“分類器”。對于一個圖像分類網(wǎng)絡(luò),類別共1000種,在一系列的卷積、池化、激活函數(shù)的變換之后得到了一個c×h×w(c,h,w分別表示特征圖的深度、高度及寬度)的特征圖,首個全連接層將其變換成m維的特征向量,其中m=c×h×w;緊接著下一個全連接層將此m維特征向量映射1000維向量,對應(yīng)1000個類別。由于完全連接的特性,全連接層擁有巨大的參數(shù)量,因此最近主流卷積網(wǎng)絡(luò)的設(shè)計趨勢是將全連接層用全局平均池化(globalaveragepooling)來替代。例如對于以上的c×h×w特征圖,可以使用h×w大小的池化核進(jìn)行全局池化,可以得到c維特征向量。但是這種方法必須在小尺寸特征圖上執(zhí)行(即一般h與w不大于4),否則可能大量丟失特征信息。


本文編號:3631221

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/shengwushengchang/3631221.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶5643c***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com