輕量化的人臉識別DCNN研究
發(fā)布時間:2022-02-13 22:14
目前很多人臉識別系統(tǒng)采用了深度卷積神經(jīng)網(wǎng)絡(luò)(Deep convolution neural network,DCNN)技術(shù)。在LFW數(shù)據(jù)集上測試,這些系統(tǒng)的平均準確率都達到了99%以上。但是現(xiàn)在實用的人臉識別產(chǎn)品或服務(wù)還不多,原因是多方面的,一個主要原因就是在LFW數(shù)據(jù)集上評測的DCNN模型龐大、要求大量的計算資源,而移動和嵌入式設(shè)備難以承擔(dān)。針對此問題,本文主要就設(shè)計輕量級的人臉識別DCNN進行了研究。主要工作如下:在網(wǎng)絡(luò)結(jié)構(gòu)設(shè)計方面,本文采用深度可分卷積代替標準卷積,全局平均池化層代替全連接層,使得網(wǎng)絡(luò)模型的參數(shù)數(shù)量和計算量大大減少,模型的尺寸也相應(yīng)減小。針對softmax分類器在實際應(yīng)用中不靈活的問題,提出DCNN直接學(xué)習(xí)原始圖片到歐氏距離空間的映射的思想,用歐式空間的距離度量人臉之間的相似度。為了提高網(wǎng)絡(luò)的訓(xùn)練速度,比較了多種激活函數(shù)和優(yōu)化算法的性能,發(fā)現(xiàn)使用ELU激活函數(shù)和Adam優(yōu)化算法能有效加快訓(xùn)練速度。為配合小批量訓(xùn)練網(wǎng)絡(luò)的方式,每批次訓(xùn)練都隨機劃分minibatch。網(wǎng)絡(luò)中還使用了batch normalization加快網(wǎng)絡(luò)訓(xùn)練速度和避免過擬合。為了進一步減小模型尺...
【文章來源】:哈爾濱理工大學(xué)黑龍江省
【文章頁數(shù)】:62 頁
【學(xué)位級別】:碩士
【部分圖文】:
深度學(xué)習(xí)模型的示意圖
輸入圖像提取一個相同的特征。這其中隱含的原理是,自然圖像有,圖像一部分的統(tǒng)計特性與其他部分是一樣的。這個權(quán)值共享的操將一個卷積核(濾波器)在圖像上做卷積的過程,這個卷積核就是去種特征。不同的卷積核提取不同的特征。 卷積層積層( Convolutional layer),是由多個卷積核構(gòu)成的,不同的卷同的特征,增加卷積核的數(shù)目,有利于增強網(wǎng)絡(luò)的特征提取能力。積神經(jīng)網(wǎng)絡(luò)都含有多層卷積層,淺層的卷積層提取簡單特征如邊緣而深層的卷積層提取輪廓等高級特征,F(xiàn)有的卷積神經(jīng)網(wǎng)絡(luò)層次都被稱為深度卷積神經(jīng)網(wǎng)絡(luò)(DCNN)。積操作如圖 2-4 所示。Stride 表示卷積核在原圖片中水平方向和次的步進長度,這里 stride=2,每次在水平方向和垂直方向步進長4 中等式右側(cè)的網(wǎng)格圖中的 91 是通過如下計算方式得到。2 × 3 + 3 × 4+7 × 4+6 × 1+6 × 0+9 × 2+3 × ( -1) +4 × 0+8 × 3=91
圖 2-5 卷積層工作方式Fig 2-5 Working method ofconvolution layer2.1.6 池化層池化層是 CNN 中的另一個重要的概念,它實際上是一種向下采樣的操作。它的操作是把輸入?yún)^(qū)域劃分成若干個矩形子區(qū)域,對于每一個子區(qū)域都會輸出一個采樣值,用采樣值來表示這個子區(qū)域。直覺上,這種機制能夠有效地原因在于,在發(fā)現(xiàn)一個特征之后,它的精確位置遠不及它和其他特征的相對位置的關(guān)系重要。經(jīng)過卷積層得到輸入圖像的特征后,雖然能夠直接利用特征來處理分類任務(wù),然而這種做法會出現(xiàn)極大的運算量,并且容易出現(xiàn)過擬合的情況。在卷積層之后接入池化層會不斷地減小數(shù)據(jù)的空間大小,因此參數(shù)的數(shù)量和計算量也會下降,這在一定程度上也控制了過擬合。通常來說,CNN 的卷積層之間都會周期性地插入池化層。在池化層的采樣操作通常有以下兩種方法:max pooling(最大池化):輸出池化窗口內(nèi)的最大值。如圖 2-6 所示。
【參考文獻】:
期刊論文
[1]深度學(xué)習(xí)研究綜述[J]. 孫志軍,薛磊,許陽明,王正. 計算機應(yīng)用研究. 2012(08)
[2]基于馬氏距離的一維距離像識別算法仿真[J]. 黃飛,周軍,盧曉東. 計算機仿真. 2010(03)
[3]通過哈夫曼編碼實現(xiàn)文件的壓縮與解壓[J]. 王防修,周康. 武漢工業(yè)學(xué)院學(xué)報. 2008(04)
[4]基于聚類分析的K-means算法研究及應(yīng)用[J]. 張建萍,劉希玉. 計算機應(yīng)用研究. 2007(05)
[5]基于局部特征分析的人臉識別方法[J]. 焦峰,山世光,崔國勤,高文,李錦濤. 計算機輔助設(shè)計與圖形學(xué)學(xué)報. 2003(01)
[6]隱馬爾可夫模型的原理與實現(xiàn)[J]. 劉河生,高小榕,楊福生. 國外醫(yī)學(xué).生物醫(yī)學(xué)工程分冊. 2002(06)
[7]支持向量機[J]. 張浩然,韓正之,李昌剛. 計算機科學(xué). 2002(12)
[8]數(shù)據(jù)挖掘中決策樹算法的探討[J]. 唐華松,姚耀文. 計算機應(yīng)用研究. 2001(08)
[9]實用人臉識別系統(tǒng)的本征臉法實現(xiàn)[J]. 陳剛,戚飛虎. 計算機研究與發(fā)展. 2001(02)
本文編號:3624017
【文章來源】:哈爾濱理工大學(xué)黑龍江省
【文章頁數(shù)】:62 頁
【學(xué)位級別】:碩士
【部分圖文】:
深度學(xué)習(xí)模型的示意圖
輸入圖像提取一個相同的特征。這其中隱含的原理是,自然圖像有,圖像一部分的統(tǒng)計特性與其他部分是一樣的。這個權(quán)值共享的操將一個卷積核(濾波器)在圖像上做卷積的過程,這個卷積核就是去種特征。不同的卷積核提取不同的特征。 卷積層積層( Convolutional layer),是由多個卷積核構(gòu)成的,不同的卷同的特征,增加卷積核的數(shù)目,有利于增強網(wǎng)絡(luò)的特征提取能力。積神經(jīng)網(wǎng)絡(luò)都含有多層卷積層,淺層的卷積層提取簡單特征如邊緣而深層的卷積層提取輪廓等高級特征,F(xiàn)有的卷積神經(jīng)網(wǎng)絡(luò)層次都被稱為深度卷積神經(jīng)網(wǎng)絡(luò)(DCNN)。積操作如圖 2-4 所示。Stride 表示卷積核在原圖片中水平方向和次的步進長度,這里 stride=2,每次在水平方向和垂直方向步進長4 中等式右側(cè)的網(wǎng)格圖中的 91 是通過如下計算方式得到。2 × 3 + 3 × 4+7 × 4+6 × 1+6 × 0+9 × 2+3 × ( -1) +4 × 0+8 × 3=91
圖 2-5 卷積層工作方式Fig 2-5 Working method ofconvolution layer2.1.6 池化層池化層是 CNN 中的另一個重要的概念,它實際上是一種向下采樣的操作。它的操作是把輸入?yún)^(qū)域劃分成若干個矩形子區(qū)域,對于每一個子區(qū)域都會輸出一個采樣值,用采樣值來表示這個子區(qū)域。直覺上,這種機制能夠有效地原因在于,在發(fā)現(xiàn)一個特征之后,它的精確位置遠不及它和其他特征的相對位置的關(guān)系重要。經(jīng)過卷積層得到輸入圖像的特征后,雖然能夠直接利用特征來處理分類任務(wù),然而這種做法會出現(xiàn)極大的運算量,并且容易出現(xiàn)過擬合的情況。在卷積層之后接入池化層會不斷地減小數(shù)據(jù)的空間大小,因此參數(shù)的數(shù)量和計算量也會下降,這在一定程度上也控制了過擬合。通常來說,CNN 的卷積層之間都會周期性地插入池化層。在池化層的采樣操作通常有以下兩種方法:max pooling(最大池化):輸出池化窗口內(nèi)的最大值。如圖 2-6 所示。
【參考文獻】:
期刊論文
[1]深度學(xué)習(xí)研究綜述[J]. 孫志軍,薛磊,許陽明,王正. 計算機應(yīng)用研究. 2012(08)
[2]基于馬氏距離的一維距離像識別算法仿真[J]. 黃飛,周軍,盧曉東. 計算機仿真. 2010(03)
[3]通過哈夫曼編碼實現(xiàn)文件的壓縮與解壓[J]. 王防修,周康. 武漢工業(yè)學(xué)院學(xué)報. 2008(04)
[4]基于聚類分析的K-means算法研究及應(yīng)用[J]. 張建萍,劉希玉. 計算機應(yīng)用研究. 2007(05)
[5]基于局部特征分析的人臉識別方法[J]. 焦峰,山世光,崔國勤,高文,李錦濤. 計算機輔助設(shè)計與圖形學(xué)學(xué)報. 2003(01)
[6]隱馬爾可夫模型的原理與實現(xiàn)[J]. 劉河生,高小榕,楊福生. 國外醫(yī)學(xué).生物醫(yī)學(xué)工程分冊. 2002(06)
[7]支持向量機[J]. 張浩然,韓正之,李昌剛. 計算機科學(xué). 2002(12)
[8]數(shù)據(jù)挖掘中決策樹算法的探討[J]. 唐華松,姚耀文. 計算機應(yīng)用研究. 2001(08)
[9]實用人臉識別系統(tǒng)的本征臉法實現(xiàn)[J]. 陳剛,戚飛虎. 計算機研究與發(fā)展. 2001(02)
本文編號:3624017
本文鏈接:http://sikaile.net/kejilunwen/zidonghuakongzhilunwen/3624017.html
最近更新
教材專著