基于卷積神經(jīng)網(wǎng)絡的人臉識別研究與實現(xiàn)
發(fā)布時間:2020-09-07 20:26
如今,隨著計算機視覺的相關(guān)理論與應用研究的快速發(fā)展,計算機視覺技術(shù)在日常生活應用中的優(yōu)越性日益突顯出來。本文主要研究了深度學習方法中的卷積神經(jīng)網(wǎng)絡模型在自然場景下人臉識別領(lǐng)域的應用。深度卷積神經(jīng)網(wǎng)絡模型相比較于傳統(tǒng)的人臉識別的方法,不需要人工進行復雜而耗時的特征提取算法設計,只需要設計一個有效的神經(jīng)網(wǎng)絡模型,然后在大量的訓練樣本上進行端到端的簡單、高效的訓練,就能獲得不錯的分類準確率。該方法的性能和效果主要取決于網(wǎng)絡結(jié)構(gòu)的設計,因此本文研究重點在于構(gòu)建一個合理的網(wǎng)絡模型結(jié)構(gòu),并采取一些相關(guān)技術(shù)保證其在訓練集上能夠穩(wěn)定地、快速地收斂,而且還要最終獲得良好的分類準確率。本文主要內(nèi)容包括:(1)論文中對卷積神經(jīng)網(wǎng)絡的基礎(chǔ)理論知識進行了歸納總結(jié)。卷積神經(jīng)網(wǎng)絡發(fā)展于傳統(tǒng)的神經(jīng)網(wǎng)絡,本文先從早期的傳統(tǒng)神經(jīng)網(wǎng)絡中的網(wǎng)絡結(jié)構(gòu)、梯度下降、BP算法(Error Back Propagation)進行了闡述。然后過渡到卷積神經(jīng)網(wǎng)絡的理論基礎(chǔ),并對其中的一些關(guān)鍵的非線性計算的卷積層、下采樣層等進行了闡述。最后,通過經(jīng)典的卷積神經(jīng)網(wǎng)絡LeNet-5的例子說明了卷積神經(jīng)網(wǎng)絡模型的一般整體結(jié)構(gòu)。(2)通過合理的減少原VGG卷積神經(jīng)網(wǎng)絡訓練參數(shù),得到了改進的Lightened VGG網(wǎng)絡模型,并使用比隨機初始化更好地參數(shù)初始化方法來縮減模型的收斂時間,最終該新模型不僅解決了原VGG模型對硬件要求高、訓練困難等方面的問題,而且成功的應用于自然環(huán)境下的人臉識別,并在嚴格預處理后的LFW(Labeled Faces in the Wild)人臉數(shù)據(jù)庫上進行實驗,獲得了94%的準確率。然后,在這個模型之后增加了一個Siamese神經(jīng)網(wǎng)絡模型,提升了該網(wǎng)絡對較為復雜的人臉圖片的特征提取能力。論文也對該Siamese模型進行詳細的介紹和分析。(3)論文采用一種新的殘差學習思想來構(gòu)建了一個全新的應用于人臉識別領(lǐng)域的Residual網(wǎng)絡模型。該模型深度達到了34層,采用了新的參數(shù)初始化方式來解決深度網(wǎng)絡的收斂難問題,并使用了批度歸一化(Batch Normalization)技術(shù)增加了模型的穩(wěn)定性。通過在LFW人臉數(shù)據(jù)庫上面進行實驗,取得了比Lightened VGG模型更好的96%左右的準確率。(4)最后,將上述的模型算法應用于實際場景中,實現(xiàn)了一個基于實時監(jiān)控視頻的人臉識別系統(tǒng)。對系統(tǒng)各個模塊的功能和流程進行詳細介紹,并在自建的人臉數(shù)據(jù)庫上進行了測試,達到了93%的準確度。該系統(tǒng)驗證了本文方法的有效性,達到了在監(jiān)控視頻中進行人臉識別的應用要求。
【學位單位】:電子科技大學
【學位級別】:碩士
【學位年份】:2016
【中圖分類】:TP391.41;TP183
本文編號:2813797
【學位單位】:電子科技大學
【學位級別】:碩士
【學位年份】:2016
【中圖分類】:TP391.41;TP183
【引證文獻】
相關(guān)期刊論文 前1條
1 劉志哲;沈慧;韓潔;;基于深度卷積神經(jīng)網(wǎng)絡的跨年齡人臉識別[J];電腦迷;2017年09期
本文編號:2813797
本文鏈接:http://sikaile.net/kejilunwen/zidonghuakongzhilunwen/2813797.html
最近更新
教材專著