靈長(zhǎng)類動(dòng)物面部教據(jù)集構(gòu)建及識(shí)別方法研究
發(fā)布時(shí)間:2020-12-26 14:29
近年來,適用于不同研究任務(wù)的數(shù)據(jù)集不斷涌現(xiàn),規(guī)模不斷增加,同時(shí)場(chǎng)景也越來越復(fù)雜。數(shù)據(jù)集的建立為科學(xué)研究的發(fā)展提供了數(shù)據(jù)基礎(chǔ),而數(shù)據(jù)集規(guī)模的增大、數(shù)據(jù)類型的多樣化等也同時(shí)給現(xiàn)有的理論和方法提出了新的挑戰(zhàn),也因此使得新的具有更高性能的算法不斷被提出。然而,目前國(guó)際上還沒有應(yīng)用于野生動(dòng)物個(gè)體識(shí)別研究的大型數(shù)據(jù)集,已發(fā)布的個(gè)別動(dòng)物數(shù)據(jù)集普遍存在數(shù)據(jù)量小、圖片質(zhì)量差等問題。這在很大程度上限制了目前動(dòng)物面部識(shí)別算法的研究進(jìn)展。目前,在動(dòng)物個(gè)體識(shí)別領(lǐng)域,大多直接利用目標(biāo)分類算法;而在利用動(dòng)物面部信息進(jìn)行個(gè)體識(shí)別研究方面,也基本是直接利用或稍加改進(jìn)現(xiàn)有的人臉識(shí)別方法。然而,動(dòng)物的面部結(jié)構(gòu)、器官形狀和面部紋理等諸多方面和人類存在著較大差異。因此,將現(xiàn)有的人臉識(shí)別算法直接應(yīng)用于動(dòng)物面部識(shí)別,其效果將大打折扣,然而,目前還未有專門針對(duì)動(dòng)物面部識(shí)別問題提出相應(yīng)的識(shí)別算法。針對(duì)上述問題,本文首先構(gòu)建了首個(gè)大型靈長(zhǎng)類面部數(shù)據(jù)集。在數(shù)據(jù)集建立的過程中,提出了一種快速有效的靈長(zhǎng)類面部自動(dòng)檢測(cè)方法來獲得源圖像中的猴臉區(qū)域圖像信息。接著,提出了一種改進(jìn)的卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Networ...
【文章來源】:西北大學(xué)陜西省 211工程院校
【文章頁數(shù)】:81 頁
【學(xué)位級(jí)別】:碩士
【部分圖文】:
具有一個(gè)隱含層的神經(jīng)網(wǎng)絡(luò)圖2對(duì)應(yīng)的公式為:
多層神經(jīng)網(wǎng)絡(luò)的訓(xùn)練方法本質(zhì)上和 Logistic 回歸模型相似,就需要運(yùn)用鏈?zhǔn)角髮?dǎo)法則對(duì)隱含層上的節(jié)點(diǎn)進(jìn)行求導(dǎo)操作,在神經(jīng)網(wǎng)絡(luò)中稱為反向傳播。2.2.2 卷積神經(jīng)網(wǎng)絡(luò)卷積神經(jīng)網(wǎng)絡(luò)是對(duì)多層神經(jīng)網(wǎng)絡(luò)的進(jìn)一步發(fā)展,在 CNN 中隱含層被賦予了卷積、采樣、全連接三種不同的功能。圖 3 是首個(gè)卷積神經(jīng)網(wǎng)絡(luò) LeNet5 的結(jié)構(gòu)圖,從此,卷積+池化(下采樣)+非線性激活的組合成為 CNN 的典型特征。在多層次的 CNN 中,圖片經(jīng)過輸入層后往往會(huì)交替出現(xiàn)在卷積層和采樣層,全連接層出現(xiàn)在最后,層數(shù)并不固定。接下來分別介紹它們的功能。西北大學(xué)碩士學(xué)位論文
視網(wǎng)膜輸入層,第 m 層的接受域的寬度為 3,也就入層的 3 個(gè)相鄰的神經(jīng)元相連,第 m 層與第 m+1 層 m+1 層的神經(jīng)元相對(duì)于第 m 層的接受域的寬度也為 5,這種結(jié)構(gòu)將學(xué)習(xí)到的過濾器(對(duì)應(yīng)于輸入信號(hào)中間模式(因?yàn)槊總(gè)單元對(duì)它接受域外的 variation 不個(gè)這樣的層堆疊起來后,會(huì)使得過濾器(不再是線性了更大的視覺區(qū)域)。例如下圖中第 m+1 層的神經(jīng)元非線性的特征編碼。西北大學(xué)碩士學(xué)位論文
【參考文獻(xiàn)】:
期刊論文
[1]深度區(qū)域網(wǎng)絡(luò)方法的細(xì)粒度圖像分類[J]. 翁雨辰,田野,路敦民,李瓊硯. 中國(guó)圖象圖形學(xué)報(bào). 2017(11)
[2]自上而下注意圖分割的細(xì)粒度圖像分類[J]. 馮語姍,王子磊. 中國(guó)圖象圖形學(xué)報(bào). 2016(09)
本文編號(hào):2939878
【文章來源】:西北大學(xué)陜西省 211工程院校
【文章頁數(shù)】:81 頁
【學(xué)位級(jí)別】:碩士
【部分圖文】:
具有一個(gè)隱含層的神經(jīng)網(wǎng)絡(luò)圖2對(duì)應(yīng)的公式為:
多層神經(jīng)網(wǎng)絡(luò)的訓(xùn)練方法本質(zhì)上和 Logistic 回歸模型相似,就需要運(yùn)用鏈?zhǔn)角髮?dǎo)法則對(duì)隱含層上的節(jié)點(diǎn)進(jìn)行求導(dǎo)操作,在神經(jīng)網(wǎng)絡(luò)中稱為反向傳播。2.2.2 卷積神經(jīng)網(wǎng)絡(luò)卷積神經(jīng)網(wǎng)絡(luò)是對(duì)多層神經(jīng)網(wǎng)絡(luò)的進(jìn)一步發(fā)展,在 CNN 中隱含層被賦予了卷積、采樣、全連接三種不同的功能。圖 3 是首個(gè)卷積神經(jīng)網(wǎng)絡(luò) LeNet5 的結(jié)構(gòu)圖,從此,卷積+池化(下采樣)+非線性激活的組合成為 CNN 的典型特征。在多層次的 CNN 中,圖片經(jīng)過輸入層后往往會(huì)交替出現(xiàn)在卷積層和采樣層,全連接層出現(xiàn)在最后,層數(shù)并不固定。接下來分別介紹它們的功能。西北大學(xué)碩士學(xué)位論文
視網(wǎng)膜輸入層,第 m 層的接受域的寬度為 3,也就入層的 3 個(gè)相鄰的神經(jīng)元相連,第 m 層與第 m+1 層 m+1 層的神經(jīng)元相對(duì)于第 m 層的接受域的寬度也為 5,這種結(jié)構(gòu)將學(xué)習(xí)到的過濾器(對(duì)應(yīng)于輸入信號(hào)中間模式(因?yàn)槊總(gè)單元對(duì)它接受域外的 variation 不個(gè)這樣的層堆疊起來后,會(huì)使得過濾器(不再是線性了更大的視覺區(qū)域)。例如下圖中第 m+1 層的神經(jīng)元非線性的特征編碼。西北大學(xué)碩士學(xué)位論文
【參考文獻(xiàn)】:
期刊論文
[1]深度區(qū)域網(wǎng)絡(luò)方法的細(xì)粒度圖像分類[J]. 翁雨辰,田野,路敦民,李瓊硯. 中國(guó)圖象圖形學(xué)報(bào). 2017(11)
[2]自上而下注意圖分割的細(xì)粒度圖像分類[J]. 馮語姍,王子磊. 中國(guó)圖象圖形學(xué)報(bào). 2016(09)
本文編號(hào):2939878
本文鏈接:http://sikaile.net/kejilunwen/zidonghuakongzhilunwen/2939878.html
最近更新
教材專著