基于深度神經(jīng)網(wǎng)絡(luò)的人臉識別方法研究
發(fā)布時(shí)間:2020-12-05 06:45
伴隨人工智能和深度學(xué)習(xí)的日益壯大,人臉識別逐漸地在多個(gè)行業(yè)和領(lǐng)域得到擴(kuò)張;诰矸e神經(jīng)網(wǎng)絡(luò)的人臉識別技術(shù)被廣泛地應(yīng)用于安防、商業(yè)、金融、娛樂領(lǐng)域;與傳統(tǒng)人臉識別方法相比,既能夠自動(dòng)提取圖像特征,其模型還可以自動(dòng)學(xué)習(xí)而得到較高的識別率。該方法根據(jù)訓(xùn)練數(shù)據(jù)集大小來設(shè)計(jì)適合的網(wǎng)絡(luò)結(jié)構(gòu),其中最核心的技術(shù)是對超參數(shù)的調(diào)試。本文對AlexNet網(wǎng)絡(luò)結(jié)構(gòu)進(jìn)行改進(jìn)和優(yōu)化,提高訓(xùn)練效率和穩(wěn)定性。主要研究內(nèi)容如下:(1)卷積神經(jīng)網(wǎng)絡(luò)是一種深層次并且稀疏的傳統(tǒng)人工神經(jīng)網(wǎng)絡(luò)。從而本文首先分析了傳統(tǒng)人工神經(jīng)網(wǎng)絡(luò)的模型結(jié)構(gòu)、前向和反向傳播算法;然后對其卷積層、激勵(lì)層、池化層和全連接層進(jìn)行闡述;再用數(shù)學(xué)公式對其正向傳播、反向傳播過程進(jìn)行了推導(dǎo);接著對其訓(xùn)練過程進(jìn)行了說明;最后簡要介紹梯度下降算法。(2)人臉圖像的預(yù)處理包括人臉圖像檢測、人臉圖像裁剪、人臉圖像標(biāo)準(zhǔn)化、分類標(biāo)記、轉(zhuǎn)換數(shù)據(jù)、作訓(xùn)練集平均值文件等,并基于機(jī)器視覺庫OpenCV的特征臉、線性判別分析、局部二值模式直方圖等人臉識別的算法進(jìn)行了實(shí)現(xiàn)。(3)對AlexNet網(wǎng)絡(luò)在人臉識別中存在的損失梯度下降的慢,識別率梯度上升的慢,穩(wěn)定性差的問題,提出了基于改進(jìn)和...
【文章來源】:沈陽工業(yè)大學(xué)遼寧省
【文章頁數(shù)】:87 頁
【學(xué)位級別】:碩士
【部分圖文】:
ReLu函數(shù)Fig.2.5ReLufunction
第 3 章 基于深度網(wǎng)絡(luò)的人臉識別方法首先對人臉數(shù)據(jù)集簡要剖析。然后對 OpenCV 中的人臉識別算 AlexNet 網(wǎng)絡(luò)結(jié)構(gòu)分析和改進(jìn),以減少參數(shù)數(shù)量,降低對 GP最后,對改進(jìn)結(jié)構(gòu)進(jìn)行深度學(xué)習(xí),分析其在人臉識別領(lǐng)域的應(yīng)佳的訓(xùn)練模型。數(shù)據(jù)集用到的人臉數(shù)據(jù)庫包括 ORL、GT、Essex(Faces95)等。)ORL 數(shù)據(jù)集:共有 40 個(gè)不同年齡、不同性別和不同種族的0 副灰度圖像,共計(jì) 400 副灰度圖像,圖像尺寸是 92*112 像素變化,如笑與不笑、眼睛睜與不睜、眼鏡戴與不戴等,是目前準(zhǔn)數(shù)據(jù)庫。如圖 3.1 所示是 ORL 人臉數(shù)據(jù)庫的樣例。
0 副灰度圖像,共計(jì) 400 副灰度圖像,圖像尺寸是 92*112 像素變化,如笑與不笑、眼睛睜與不睜、眼鏡戴與不戴等,是目前準(zhǔn)數(shù)據(jù)庫。如圖 3.1 所示是 ORL 人臉數(shù)據(jù)庫的樣例。圖 3.1 ORL 人臉數(shù)據(jù)庫樣例Fig. 3.1 ORL face database sample)GT 數(shù)據(jù)集:包含 50 個(gè)人,每人 15 張不同角度、不同表情的 640*480,特點(diǎn)是數(shù)據(jù)量比較多,每個(gè)人的圖像信息豐富多變T 人臉數(shù)據(jù)庫的樣例。
本文編號:2899059
【文章來源】:沈陽工業(yè)大學(xué)遼寧省
【文章頁數(shù)】:87 頁
【學(xué)位級別】:碩士
【部分圖文】:
ReLu函數(shù)Fig.2.5ReLufunction
第 3 章 基于深度網(wǎng)絡(luò)的人臉識別方法首先對人臉數(shù)據(jù)集簡要剖析。然后對 OpenCV 中的人臉識別算 AlexNet 網(wǎng)絡(luò)結(jié)構(gòu)分析和改進(jìn),以減少參數(shù)數(shù)量,降低對 GP最后,對改進(jìn)結(jié)構(gòu)進(jìn)行深度學(xué)習(xí),分析其在人臉識別領(lǐng)域的應(yīng)佳的訓(xùn)練模型。數(shù)據(jù)集用到的人臉數(shù)據(jù)庫包括 ORL、GT、Essex(Faces95)等。)ORL 數(shù)據(jù)集:共有 40 個(gè)不同年齡、不同性別和不同種族的0 副灰度圖像,共計(jì) 400 副灰度圖像,圖像尺寸是 92*112 像素變化,如笑與不笑、眼睛睜與不睜、眼鏡戴與不戴等,是目前準(zhǔn)數(shù)據(jù)庫。如圖 3.1 所示是 ORL 人臉數(shù)據(jù)庫的樣例。
0 副灰度圖像,共計(jì) 400 副灰度圖像,圖像尺寸是 92*112 像素變化,如笑與不笑、眼睛睜與不睜、眼鏡戴與不戴等,是目前準(zhǔn)數(shù)據(jù)庫。如圖 3.1 所示是 ORL 人臉數(shù)據(jù)庫的樣例。圖 3.1 ORL 人臉數(shù)據(jù)庫樣例Fig. 3.1 ORL face database sample)GT 數(shù)據(jù)集:包含 50 個(gè)人,每人 15 張不同角度、不同表情的 640*480,特點(diǎn)是數(shù)據(jù)量比較多,每個(gè)人的圖像信息豐富多變T 人臉數(shù)據(jù)庫的樣例。
本文編號:2899059
本文鏈接:http://sikaile.net/kejilunwen/zidonghuakongzhilunwen/2899059.html
最近更新
教材專著