基于改進(jìn)型SSD網(wǎng)絡(luò)的人臉檢測
發(fā)布時間:2021-08-20 15:25
隨著深度學(xué)習(xí)技術(shù)的快速發(fā)展,人臉檢測技術(shù)取得很大的進(jìn)展,成為近年來計算機(jī)視覺領(lǐng)域中的一個研究熱點(diǎn)。然而,人臉檢測易受到尺度變化、光照變化、遮擋方面等因素的影響,使得人臉檢測精度降低。與傳統(tǒng)檢測方法相比,SSD(Single Shot MultiBox Detector)網(wǎng)絡(luò)檢測方法具有高效的檢測速度和較好的檢測效果,但是也存在一些不足之處。因此本文提出基于改進(jìn)的SSD網(wǎng)絡(luò)的人臉檢測方法,在檢測精度和檢測速度方面都取得了良好的效果。本文主要研究工作有如下兩個方面:(1)針對在多尺度等環(huán)境下的人臉檢測,傳統(tǒng)的SSD網(wǎng)絡(luò)的檢測效果存在漏檢和誤檢問題,提出基于深度殘差網(wǎng)絡(luò)(ResNeXt)的SSD網(wǎng)絡(luò),基礎(chǔ)網(wǎng)絡(luò)用ResNeXt-50網(wǎng)絡(luò)替換原來的VGG16網(wǎng)絡(luò),使用ResNeXt-50網(wǎng)絡(luò)結(jié)構(gòu)不僅可以降低網(wǎng)絡(luò)訓(xùn)練難度還可以減少特征提取的冗余度,不斷增強(qiáng)人臉特征表達(dá)能力,進(jìn)一步提高人臉檢測精度。最后在WiderFace驗證集上的實(shí)驗結(jié)果,表明了基于ResNeXt網(wǎng)絡(luò)的SSD網(wǎng)絡(luò)能提高檢測精度。(2)為了解決SSD網(wǎng)絡(luò)的小人臉檢測精度問題,提出一種基于特征融合方法的SSD網(wǎng)絡(luò)。首先對高層的特征圖使...
【文章來源】:南昌大學(xué)江西省 211工程院校
【文章頁數(shù)】:64 頁
【學(xué)位級別】:碩士
【圖文】:
圖2.1深度學(xué)習(xí)發(fā)展歷程??第一代神經(jīng)網(wǎng)絡(luò)(1958-1969):神經(jīng)網(wǎng)絡(luò)最早起源于1943年的多層感知器??
個步驟。第一步是通過濾波器的尺寸作為滑動窗口的尺寸,用滑動窗??口從輸入圖像數(shù)據(jù)中選定某一區(qū)域;第二步是在卷積核運(yùn)動期間將圖像上的每??個像素乘以與卷積核相對應(yīng)的權(quán)重,然后將所有乘積相加以獲得最終輸出,如圖??2.2所示。??Input?5x5??__1__1?°?Q?Filter?3x3?Output?3x3??0?1110?101??0?0?J.__1__^?0?1?0?:?4??0?0?110?10?1??0?110?0?Bias=o??i??圖2.2卷積運(yùn)算操作??池化層也可稱為下采樣層,其本質(zhì)是對數(shù)據(jù)圖像特征進(jìn)行向下采樣。池化層??卷積運(yùn)算后的結(jié)果是輸出數(shù)據(jù)圖像中的特征圖特定區(qū)域的最大值或¥均值。在??卷積操作中,由于卷積核很小導(dǎo)致原始圖像上進(jìn)行卷積后圖像仍然很大。因此,??使用池化層可以對數(shù)據(jù)降維,防止過擬合。在實(shí)際卷積網(wǎng)絡(luò)編程中,用到的池化??方法比較多,例如有最大池化、平均池化、重疊池化和空間金字塔池化等。但是,??最常用的使用方法是最大池化方法和平均池化方法。??全連接層是指兩個相鄰網(wǎng)絡(luò)層的神經(jīng)元之間以全連接的方式進(jìn)行連接,目??的是為了整合多個特征信息,從上層獲得類別區(qū)分并將其映射其成為特征向量。??在卷積神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu)中,經(jīng)過多個卷積層和池化層后,連接一個或多個全連接??層,用來結(jié)合先前網(wǎng)絡(luò)層中提取到的特征。但是,這種全連接方式存在缺點(diǎn),最??后一步直接特征映射可能會破壞圖像的空間結(jié)構(gòu)。因此,最近研宄人員提出使用??更小的卷積層代替全連接層,并且基本在神經(jīng)網(wǎng)絡(luò)結(jié)果中使用1X1卷積核。??激活函數(shù)層是在卷積神經(jīng)網(wǎng)絡(luò)上運(yùn)行的函數(shù),作用是將卷積層的輸入映射??到輸出。
?第2章基于深度學(xué)習(xí)的人臉檢測概述???2.深度殘差網(wǎng)絡(luò)(ResNet)??隨著網(wǎng)絡(luò)層數(shù)的增加,網(wǎng)絡(luò)模型精度會不斷提高。但當(dāng)網(wǎng)絡(luò)層數(shù)增加到一定??數(shù)量時,訓(xùn)練精度和測試精度會表現(xiàn)出迅速下降,因此當(dāng)網(wǎng)絡(luò)變得非常深時,卷??積神經(jīng)網(wǎng)絡(luò)變得更加難以訓(xùn)練。針對這些問題,He等人在2015年提出了?ResNet??網(wǎng)絡(luò)[46],并且獲得了?ILSVRC-2015分類競賽冠軍。ResNet網(wǎng)絡(luò)參數(shù)結(jié)構(gòu),深度??可達(dá)到152層,一般使用50或者101層,如圖2.3所示。ResNet網(wǎng)絡(luò)主要引入??了殘差學(xué)習(xí)單元,其核心思想是引入一個的恒等快捷連接(Identity?Shortcut??Connection),直接跳過一個或多個層,結(jié)構(gòu)如圖2.4所示,具體殘差結(jié)構(gòu)構(gòu)造如??圖2.5所示。??.1'.?.?:?>?-uiiml?M/t*?j?1K-Ia>I?,4?1a\i*i?l.i\?^?i?I'M?lYl.iyr??conv?1?112-112?viiuic?^??'?^?max?pH?l?Miuk*?2??〇.<n2x?V-.Sf,?m?二"」“?,[.?f?1?:?m??,?-2?1?、,..?:.*?■;?.,.、?.?.V?M?*?^?3???V?<、4?;??、_?‘,’、.、?[?I?*?1.?256?^?1???J?l???1.25h??卜1?I〉?f?!?■丨.i:S??卜丨.丨Js?’??tomrx?2K?/?,、2?.?'?'?4?3-3.?128?*4?V.?X?128?<4?HI?28?K??-?’.丨*>?[?1-1.512」?[h?I.M2?j?I???\.^\:??
【參考文獻(xiàn)】:
期刊論文
[1]基于多特征Mean Shift的人臉跟蹤算法[J]. 張濤,蔡燦輝. 電子與信息學(xué)報. 2009(08)
[2]基于HMM的面部表情圖像序列的分析與識別[J]. 金輝,高文. 自動化學(xué)報. 2002(04)
[3]基于模板匹配與支持矢量機(jī)的人臉檢測[J]. 梁路宏,艾海舟,肖習(xí)攀,葉航軍,徐光祐,張鈸. 計算機(jī)學(xué)報. 2002(01)
[4]人臉識別技術(shù)綜述[J]. 張翠平,蘇光大. 中國圖象圖形學(xué)報. 2000(11)
本文編號:3353747
【文章來源】:南昌大學(xué)江西省 211工程院校
【文章頁數(shù)】:64 頁
【學(xué)位級別】:碩士
【圖文】:
圖2.1深度學(xué)習(xí)發(fā)展歷程??第一代神經(jīng)網(wǎng)絡(luò)(1958-1969):神經(jīng)網(wǎng)絡(luò)最早起源于1943年的多層感知器??
個步驟。第一步是通過濾波器的尺寸作為滑動窗口的尺寸,用滑動窗??口從輸入圖像數(shù)據(jù)中選定某一區(qū)域;第二步是在卷積核運(yùn)動期間將圖像上的每??個像素乘以與卷積核相對應(yīng)的權(quán)重,然后將所有乘積相加以獲得最終輸出,如圖??2.2所示。??Input?5x5??__1__1?°?Q?Filter?3x3?Output?3x3??0?1110?101??0?0?J.__1__^?0?1?0?:?4??0?0?110?10?1??0?110?0?Bias=o??i??圖2.2卷積運(yùn)算操作??池化層也可稱為下采樣層,其本質(zhì)是對數(shù)據(jù)圖像特征進(jìn)行向下采樣。池化層??卷積運(yùn)算后的結(jié)果是輸出數(shù)據(jù)圖像中的特征圖特定區(qū)域的最大值或¥均值。在??卷積操作中,由于卷積核很小導(dǎo)致原始圖像上進(jìn)行卷積后圖像仍然很大。因此,??使用池化層可以對數(shù)據(jù)降維,防止過擬合。在實(shí)際卷積網(wǎng)絡(luò)編程中,用到的池化??方法比較多,例如有最大池化、平均池化、重疊池化和空間金字塔池化等。但是,??最常用的使用方法是最大池化方法和平均池化方法。??全連接層是指兩個相鄰網(wǎng)絡(luò)層的神經(jīng)元之間以全連接的方式進(jìn)行連接,目??的是為了整合多個特征信息,從上層獲得類別區(qū)分并將其映射其成為特征向量。??在卷積神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu)中,經(jīng)過多個卷積層和池化層后,連接一個或多個全連接??層,用來結(jié)合先前網(wǎng)絡(luò)層中提取到的特征。但是,這種全連接方式存在缺點(diǎn),最??后一步直接特征映射可能會破壞圖像的空間結(jié)構(gòu)。因此,最近研宄人員提出使用??更小的卷積層代替全連接層,并且基本在神經(jīng)網(wǎng)絡(luò)結(jié)果中使用1X1卷積核。??激活函數(shù)層是在卷積神經(jīng)網(wǎng)絡(luò)上運(yùn)行的函數(shù),作用是將卷積層的輸入映射??到輸出。
?第2章基于深度學(xué)習(xí)的人臉檢測概述???2.深度殘差網(wǎng)絡(luò)(ResNet)??隨著網(wǎng)絡(luò)層數(shù)的增加,網(wǎng)絡(luò)模型精度會不斷提高。但當(dāng)網(wǎng)絡(luò)層數(shù)增加到一定??數(shù)量時,訓(xùn)練精度和測試精度會表現(xiàn)出迅速下降,因此當(dāng)網(wǎng)絡(luò)變得非常深時,卷??積神經(jīng)網(wǎng)絡(luò)變得更加難以訓(xùn)練。針對這些問題,He等人在2015年提出了?ResNet??網(wǎng)絡(luò)[46],并且獲得了?ILSVRC-2015分類競賽冠軍。ResNet網(wǎng)絡(luò)參數(shù)結(jié)構(gòu),深度??可達(dá)到152層,一般使用50或者101層,如圖2.3所示。ResNet網(wǎng)絡(luò)主要引入??了殘差學(xué)習(xí)單元,其核心思想是引入一個的恒等快捷連接(Identity?Shortcut??Connection),直接跳過一個或多個層,結(jié)構(gòu)如圖2.4所示,具體殘差結(jié)構(gòu)構(gòu)造如??圖2.5所示。??.1'.?.?:?>?-uiiml?M/t*?j?1K-Ia>I?,4?1a\i*i?l.i\?^?i?I'M?lYl.iyr??conv?1?112-112?viiuic?^??'?^?max?pH?l?Miuk*?2??〇.<n2x?V-.Sf,?m?二"」“?,[.?f?1?:?m??,?-2?1?、,..?:.*?■;?.,.、?.?.V?M?*?^?3???V?<、4?;??、_?‘,’、.、?[?I?*?1.?256?^?1???J?l???1.25h??卜1?I〉?f?!?■丨.i:S??卜丨.丨Js?’??tomrx?2K?/?,、2?.?'?'?4?3-3.?128?*4?V.?X?128?<4?HI?28?K??-?’.丨*>?[?1-1.512」?[h?I.M2?j?I???\.^\:??
【參考文獻(xiàn)】:
期刊論文
[1]基于多特征Mean Shift的人臉跟蹤算法[J]. 張濤,蔡燦輝. 電子與信息學(xué)報. 2009(08)
[2]基于HMM的面部表情圖像序列的分析與識別[J]. 金輝,高文. 自動化學(xué)報. 2002(04)
[3]基于模板匹配與支持矢量機(jī)的人臉檢測[J]. 梁路宏,艾海舟,肖習(xí)攀,葉航軍,徐光祐,張鈸. 計算機(jī)學(xué)報. 2002(01)
[4]人臉識別技術(shù)綜述[J]. 張翠平,蘇光大. 中國圖象圖形學(xué)報. 2000(11)
本文編號:3353747
本文鏈接:http://sikaile.net/kejilunwen/zidonghuakongzhilunwen/3353747.html
最近更新
教材專著