基于深度卷積神經(jīng)網(wǎng)絡的人臉圖像分類應用研究
發(fā)布時間:2021-01-28 18:37
在人臉圖像分類識別領域,相較于傳統(tǒng)的機器學習法而言,卷積神經(jīng)網(wǎng)絡(Convolutional Neural Network,CNN)能夠更好地自主捕獲圖像中的潛在特征,替代了以往需要人工進行捕獲的手段,進而取得了廣泛的應用。尤其是在2012年出現(xiàn)Alex Net神經(jīng)網(wǎng)絡之后,深度CNN為圖像領域帶來了深刻的變革,它可以提取到更深層次的抽象特征,這會幫助它極大地提升模型的分類、識別的準確率。但是,這同樣也會帶來一些問題,主要的缺點在于它會使得參數(shù)量變得巨大,訓練非常耗時。如今完善的建模理論還沒有面世,關于網(wǎng)絡結構的進一步優(yōu)化也有待于解決,并且筆者發(fā)現(xiàn)網(wǎng)絡訓練過程中采用的算法有著明顯的局限性,這些都會對網(wǎng)絡模型產(chǎn)生影響。本文將就CNN模型結構展開探索,希望能夠對該模型的訓練過程進行優(yōu)化,從而實現(xiàn)高效CNN模型的構建,并將該模型遷移學習到新的應用場景中。具體的研究內容如下:(1)本文首先分析研究了VGGNet網(wǎng)絡模型的結構和參數(shù),選取了最為常用且高效的VGG-16作為改進模型的原型。在VGG-16卷積部分的最后加入多尺度采樣層(Multi-scale Sampling Layer),使得模型...
【文章來源】:吉林大學吉林省 211工程院校 985工程院校 教育部直屬院校
【文章頁數(shù)】:62 頁
【學位級別】:碩士
【部分圖文】:
LeNet-5卷積神經(jīng)網(wǎng)絡
神經(jīng)元在整個網(wǎng)絡系統(tǒng)中處于基層,是構建一個網(wǎng)絡系統(tǒng)的最基礎部分,通常它是一個能夠實現(xiàn)多個輸入而單個輸出的結構,其結構表示如圖 2.1 所示。圖2.1 神經(jīng)元模型其中,xi代表神經(jīng)元的輸入;{x1,x2,。。。xn}表示有 n 個數(shù)據(jù)輸入進了神經(jīng)元 j;ωij表示輸入信號 xi與神經(jīng)元 j 連接的權值;bi表示內部狀態(tài)的偏置值,yi為神經(jīng)元的輸出,可以用一個非線性模型的表達式(2-1)來表示這個連接:(2-1)(())1 niiiiijy fbx
一般比單層神經(jīng)元的結構復雜,隱含層和輸出端數(shù)量都相對較多,可以解決線性不可分的問題,如圖 2.2 所示為一種類型的多層感知器結構:圖2.2 多層感知器結構圖輸入層神經(jīng)元負責接受來自外界的相關信號,第 1 隱含層與其對應的輸入層相互連接,同一層神經(jīng)元之間不連接,最后一層隱含層神經(jīng)元與輸出層神經(jīng)元全接連。圖2-2 中,箭頭所指的方向表示的是各單元連接和輸出的方向,不同的連接處分別對應
【參考文獻】:
期刊論文
[1]混合PSO優(yōu)化卷積神經(jīng)網(wǎng)絡結構和參數(shù)[J]. 唐賢倫,劉慶,張娜,周家林. 電子科技大學學報. 2018(02)
[2]基于深度卷積神經(jīng)網(wǎng)絡的人臉識別技術綜述[J]. 景晨凱,宋濤,莊雷,劉剛,王樂,劉凱倫. 計算機應用與軟件. 2018(01)
[3]基于數(shù)據(jù)源分析的數(shù)據(jù)增強方法[J]. 彭琮,曹建軍,吳凡,溫俊. 兵工自動化. 2017(12)
[4]深度卷積神經(jīng)網(wǎng)絡在計算機視覺中的應用研究綜述[J]. 王琳,趙耀,余靜華,陳曦. 農(nóng)村經(jīng)濟與科技. 2017(14)
[5]多任務學習及卷積神經(jīng)網(wǎng)絡在人臉識別中的應用[J]. 邵蔚元,郭躍飛. 計算機工程與應用. 2016(13)
[6]遷移學習研究進展[J]. 莊福振,羅平,何清,史忠植. 軟件學報. 2015(01)
[7]深度學習的昨天、今天和明天[J]. 余凱,賈磊,陳雨強,徐偉. 計算機研究與發(fā)展. 2013(09)
[8]粒子群優(yōu)化算法綜述[J]. 楊維,李歧強. 中國工程科學. 2004(05)
碩士論文
[1]基于卷積神經(jīng)網(wǎng)絡的人臉性別識別研究[D]. 裴子龍.山西師范大學 2017
[2]基于卷積神經(jīng)網(wǎng)絡的視覺識別研究[D]. 薛昆南.華南農(nóng)業(yè)大學 2016
[3]基于粒子群算法的LeNet-5卷積神經(jīng)網(wǎng)絡優(yōu)化研究[D]. 向展.華中科技大學 2016
本文編號:3005481
【文章來源】:吉林大學吉林省 211工程院校 985工程院校 教育部直屬院校
【文章頁數(shù)】:62 頁
【學位級別】:碩士
【部分圖文】:
LeNet-5卷積神經(jīng)網(wǎng)絡
神經(jīng)元在整個網(wǎng)絡系統(tǒng)中處于基層,是構建一個網(wǎng)絡系統(tǒng)的最基礎部分,通常它是一個能夠實現(xiàn)多個輸入而單個輸出的結構,其結構表示如圖 2.1 所示。圖2.1 神經(jīng)元模型其中,xi代表神經(jīng)元的輸入;{x1,x2,。。。xn}表示有 n 個數(shù)據(jù)輸入進了神經(jīng)元 j;ωij表示輸入信號 xi與神經(jīng)元 j 連接的權值;bi表示內部狀態(tài)的偏置值,yi為神經(jīng)元的輸出,可以用一個非線性模型的表達式(2-1)來表示這個連接:(2-1)(())1 niiiiijy fbx
一般比單層神經(jīng)元的結構復雜,隱含層和輸出端數(shù)量都相對較多,可以解決線性不可分的問題,如圖 2.2 所示為一種類型的多層感知器結構:圖2.2 多層感知器結構圖輸入層神經(jīng)元負責接受來自外界的相關信號,第 1 隱含層與其對應的輸入層相互連接,同一層神經(jīng)元之間不連接,最后一層隱含層神經(jīng)元與輸出層神經(jīng)元全接連。圖2-2 中,箭頭所指的方向表示的是各單元連接和輸出的方向,不同的連接處分別對應
【參考文獻】:
期刊論文
[1]混合PSO優(yōu)化卷積神經(jīng)網(wǎng)絡結構和參數(shù)[J]. 唐賢倫,劉慶,張娜,周家林. 電子科技大學學報. 2018(02)
[2]基于深度卷積神經(jīng)網(wǎng)絡的人臉識別技術綜述[J]. 景晨凱,宋濤,莊雷,劉剛,王樂,劉凱倫. 計算機應用與軟件. 2018(01)
[3]基于數(shù)據(jù)源分析的數(shù)據(jù)增強方法[J]. 彭琮,曹建軍,吳凡,溫俊. 兵工自動化. 2017(12)
[4]深度卷積神經(jīng)網(wǎng)絡在計算機視覺中的應用研究綜述[J]. 王琳,趙耀,余靜華,陳曦. 農(nóng)村經(jīng)濟與科技. 2017(14)
[5]多任務學習及卷積神經(jīng)網(wǎng)絡在人臉識別中的應用[J]. 邵蔚元,郭躍飛. 計算機工程與應用. 2016(13)
[6]遷移學習研究進展[J]. 莊福振,羅平,何清,史忠植. 軟件學報. 2015(01)
[7]深度學習的昨天、今天和明天[J]. 余凱,賈磊,陳雨強,徐偉. 計算機研究與發(fā)展. 2013(09)
[8]粒子群優(yōu)化算法綜述[J]. 楊維,李歧強. 中國工程科學. 2004(05)
碩士論文
[1]基于卷積神經(jīng)網(wǎng)絡的人臉性別識別研究[D]. 裴子龍.山西師范大學 2017
[2]基于卷積神經(jīng)網(wǎng)絡的視覺識別研究[D]. 薛昆南.華南農(nóng)業(yè)大學 2016
[3]基于粒子群算法的LeNet-5卷積神經(jīng)網(wǎng)絡優(yōu)化研究[D]. 向展.華中科技大學 2016
本文編號:3005481
本文鏈接:http://sikaile.net/kejilunwen/zidonghuakongzhilunwen/3005481.html
最近更新
教材專著