基于卷積神經(jīng)網(wǎng)絡(luò)的人臉檢測研究與應(yīng)用
發(fā)布時間:2021-12-09 15:16
卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Network,CNN),是一種比較獨特的深層神經(jīng)網(wǎng)絡(luò)模型,是由人工神經(jīng)網(wǎng)絡(luò)和深度學習網(wǎng)絡(luò)合并產(chǎn)生的一種新型的人工神經(jīng)網(wǎng)絡(luò)。目前,其在計算機視覺領(lǐng)域獲得了較優(yōu)的成績。而人臉識別問題,在實際應(yīng)用中由于無約束環(huán)境下背景、照明、姿態(tài)和面部表情等因素的影響,存在一定的難度。因此,近幾年以CNN為手段,進行特征提取的人臉檢測算法不斷被提出,可以很好的解決野生數(shù)據(jù)集中準確率不高的問題,并取得了不錯的效果。本文基于CNN的構(gòu)建模式,設(shè)計了一種多尺度融合卷積神經(jīng)網(wǎng)絡(luò)(MSF-CNN)結(jié)構(gòu),用來訓練人臉檢測器。CNN作為一種特征提取方式,具有主動學習能力。所以本文在設(shè)計網(wǎng)絡(luò)結(jié)構(gòu)時,充分發(fā)揮了其自主學習特征的能力,將中間層輸出分為三個通道進行卷積操作,并且每個通道設(shè)置數(shù)量、尺寸各不相同的卷積核,得到樣本三個尺度的卷積特征;然后將不同尺度的特征通過歸一化后按比例融合;最后與分類層相連訓練分類器。該方法的主要貢獻為:(1)模型提取的多尺度特征包含更多有用的信息,使分類精度要高于單尺度。(2)與級聯(lián)的CNN模型相比,規(guī)模變小,復(fù)雜度降低。(3)實現(xiàn)端到端的...
【文章來源】:重慶郵電大學重慶市
【文章頁數(shù)】:68 頁
【學位級別】:碩士
【部分圖文】:
LeNet-5網(wǎng)絡(luò)結(jié)構(gòu)圖
權(quán)值共享圖例
圖像金字塔圖像金字塔主要有高斯金字塔(Gaussianpyramid)和拉普拉斯金字塔(Laplacianpyramid)兩種
本文編號:3530859
【文章來源】:重慶郵電大學重慶市
【文章頁數(shù)】:68 頁
【學位級別】:碩士
【部分圖文】:
LeNet-5網(wǎng)絡(luò)結(jié)構(gòu)圖
權(quán)值共享圖例
圖像金字塔圖像金字塔主要有高斯金字塔(Gaussianpyramid)和拉普拉斯金字塔(Laplacianpyramid)兩種
本文編號:3530859
本文鏈接:http://sikaile.net/kejilunwen/zidonghuakongzhilunwen/3530859.html
最近更新
教材專著