靈長類動物面部教據(jù)集構(gòu)建及識別方法研究
發(fā)布時間:2020-12-26 14:29
近年來,適用于不同研究任務(wù)的數(shù)據(jù)集不斷涌現(xiàn),規(guī)模不斷增加,同時場景也越來越復(fù)雜。數(shù)據(jù)集的建立為科學(xué)研究的發(fā)展提供了數(shù)據(jù)基礎(chǔ),而數(shù)據(jù)集規(guī)模的增大、數(shù)據(jù)類型的多樣化等也同時給現(xiàn)有的理論和方法提出了新的挑戰(zhàn),也因此使得新的具有更高性能的算法不斷被提出。然而,目前國際上還沒有應(yīng)用于野生動物個體識別研究的大型數(shù)據(jù)集,已發(fā)布的個別動物數(shù)據(jù)集普遍存在數(shù)據(jù)量小、圖片質(zhì)量差等問題。這在很大程度上限制了目前動物面部識別算法的研究進(jìn)展。目前,在動物個體識別領(lǐng)域,大多直接利用目標(biāo)分類算法;而在利用動物面部信息進(jìn)行個體識別研究方面,也基本是直接利用或稍加改進(jìn)現(xiàn)有的人臉識別方法。然而,動物的面部結(jié)構(gòu)、器官形狀和面部紋理等諸多方面和人類存在著較大差異。因此,將現(xiàn)有的人臉識別算法直接應(yīng)用于動物面部識別,其效果將大打折扣,然而,目前還未有專門針對動物面部識別問題提出相應(yīng)的識別算法。針對上述問題,本文首先構(gòu)建了首個大型靈長類面部數(shù)據(jù)集。在數(shù)據(jù)集建立的過程中,提出了一種快速有效的靈長類面部自動檢測方法來獲得源圖像中的猴臉區(qū)域圖像信息。接著,提出了一種改進(jìn)的卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Networ...
【文章來源】:西北大學(xué)陜西省 211工程院校
【文章頁數(shù)】:81 頁
【學(xué)位級別】:碩士
【部分圖文】:
具有一個隱含層的神經(jīng)網(wǎng)絡(luò)圖2對應(yīng)的公式為:
多層神經(jīng)網(wǎng)絡(luò)的訓(xùn)練方法本質(zhì)上和 Logistic 回歸模型相似,就需要運用鏈?zhǔn)角髮?dǎo)法則對隱含層上的節(jié)點進(jìn)行求導(dǎo)操作,在神經(jīng)網(wǎng)絡(luò)中稱為反向傳播。2.2.2 卷積神經(jīng)網(wǎng)絡(luò)卷積神經(jīng)網(wǎng)絡(luò)是對多層神經(jīng)網(wǎng)絡(luò)的進(jìn)一步發(fā)展,在 CNN 中隱含層被賦予了卷積、采樣、全連接三種不同的功能。圖 3 是首個卷積神經(jīng)網(wǎng)絡(luò) LeNet5 的結(jié)構(gòu)圖,從此,卷積+池化(下采樣)+非線性激活的組合成為 CNN 的典型特征。在多層次的 CNN 中,圖片經(jīng)過輸入層后往往會交替出現(xiàn)在卷積層和采樣層,全連接層出現(xiàn)在最后,層數(shù)并不固定。接下來分別介紹它們的功能。西北大學(xué)碩士學(xué)位論文
視網(wǎng)膜輸入層,第 m 層的接受域的寬度為 3,也就入層的 3 個相鄰的神經(jīng)元相連,第 m 層與第 m+1 層 m+1 層的神經(jīng)元相對于第 m 層的接受域的寬度也為 5,這種結(jié)構(gòu)將學(xué)習(xí)到的過濾器(對應(yīng)于輸入信號中間模式(因為每個單元對它接受域外的 variation 不個這樣的層堆疊起來后,會使得過濾器(不再是線性了更大的視覺區(qū)域)。例如下圖中第 m+1 層的神經(jīng)元非線性的特征編碼。西北大學(xué)碩士學(xué)位論文
【參考文獻(xiàn)】:
期刊論文
[1]深度區(qū)域網(wǎng)絡(luò)方法的細(xì)粒度圖像分類[J]. 翁雨辰,田野,路敦民,李瓊硯. 中國圖象圖形學(xué)報. 2017(11)
[2]自上而下注意圖分割的細(xì)粒度圖像分類[J]. 馮語姍,王子磊. 中國圖象圖形學(xué)報. 2016(09)
本文編號:2939878
【文章來源】:西北大學(xué)陜西省 211工程院校
【文章頁數(shù)】:81 頁
【學(xué)位級別】:碩士
【部分圖文】:
具有一個隱含層的神經(jīng)網(wǎng)絡(luò)圖2對應(yīng)的公式為:
多層神經(jīng)網(wǎng)絡(luò)的訓(xùn)練方法本質(zhì)上和 Logistic 回歸模型相似,就需要運用鏈?zhǔn)角髮?dǎo)法則對隱含層上的節(jié)點進(jìn)行求導(dǎo)操作,在神經(jīng)網(wǎng)絡(luò)中稱為反向傳播。2.2.2 卷積神經(jīng)網(wǎng)絡(luò)卷積神經(jīng)網(wǎng)絡(luò)是對多層神經(jīng)網(wǎng)絡(luò)的進(jìn)一步發(fā)展,在 CNN 中隱含層被賦予了卷積、采樣、全連接三種不同的功能。圖 3 是首個卷積神經(jīng)網(wǎng)絡(luò) LeNet5 的結(jié)構(gòu)圖,從此,卷積+池化(下采樣)+非線性激活的組合成為 CNN 的典型特征。在多層次的 CNN 中,圖片經(jīng)過輸入層后往往會交替出現(xiàn)在卷積層和采樣層,全連接層出現(xiàn)在最后,層數(shù)并不固定。接下來分別介紹它們的功能。西北大學(xué)碩士學(xué)位論文
視網(wǎng)膜輸入層,第 m 層的接受域的寬度為 3,也就入層的 3 個相鄰的神經(jīng)元相連,第 m 層與第 m+1 層 m+1 層的神經(jīng)元相對于第 m 層的接受域的寬度也為 5,這種結(jié)構(gòu)將學(xué)習(xí)到的過濾器(對應(yīng)于輸入信號中間模式(因為每個單元對它接受域外的 variation 不個這樣的層堆疊起來后,會使得過濾器(不再是線性了更大的視覺區(qū)域)。例如下圖中第 m+1 層的神經(jīng)元非線性的特征編碼。西北大學(xué)碩士學(xué)位論文
【參考文獻(xiàn)】:
期刊論文
[1]深度區(qū)域網(wǎng)絡(luò)方法的細(xì)粒度圖像分類[J]. 翁雨辰,田野,路敦民,李瓊硯. 中國圖象圖形學(xué)報. 2017(11)
[2]自上而下注意圖分割的細(xì)粒度圖像分類[J]. 馮語姍,王子磊. 中國圖象圖形學(xué)報. 2016(09)
本文編號:2939878
本文鏈接:http://sikaile.net/kejilunwen/zidonghuakongzhilunwen/2939878.html
最近更新
教材專著