基于深度學(xué)習(xí)的金絲猴面部識別軟件設(shè)計與實現(xiàn)
發(fā)布時間:2021-02-01 06:27
金絲猴是國家一級保護(hù)動物,在環(huán)境生態(tài)學(xué)和動物行為學(xué)研究方面具有重要的研究價值。在對金絲猴進(jìn)行保護(hù)和相關(guān)研究的過程中,首要的任務(wù)就是準(zhǔn)確識別金絲猴的個體身份。還需要對金絲猴個體的高級屬性:性別和年齡段進(jìn)行識別。針對目前相關(guān)部門已具有的大量金絲猴的圖像和視頻數(shù)據(jù),而傳統(tǒng)的人工識別的方法難易滿足繁重的識別與分析任務(wù),以及現(xiàn)有面部識別算法難以直接應(yīng)用于猴臉特征識別的問題,本文展開基于深度學(xué)習(xí)的金絲猴面部識別算法的相關(guān)研究,快速準(zhǔn)確的猴臉自動識別將很大程度上推進(jìn)金絲猴研究與保護(hù)的工作進(jìn)展。本文首先闡述了金絲猴面部圖像識別的研究意義以及相關(guān)發(fā)展現(xiàn)狀,然后概述了深度學(xué)習(xí)(Deep Learning,DL)以及卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Network,CNN)的相關(guān)理論基礎(chǔ),并分析了金絲猴面部圖像相似性大,角度多變、存在部分遮擋等情況帶來的識別難度,結(jié)合深度學(xué)習(xí)中卷積神經(jīng)網(wǎng)絡(luò)的基本方法和理論,設(shè)計了針對金絲猴個體識別以及性別和年齡段識別的網(wǎng)絡(luò)結(jié)構(gòu),并給出了相應(yīng)的識別算法。最后,設(shè)計并實現(xiàn)了基于Qt開源平臺的金絲猴面部識別軟件。(1)針對金絲猴個體識別任務(wù)中存在的難點,通過...
【文章來源】:西安電子科技大學(xué)陜西省 211工程院校 教育部直屬院校
【文章頁數(shù)】:82 頁
【學(xué)位級別】:碩士
【部分圖文】:
帶有一定角度的金絲猴面部圖像
含了整個頭部的區(qū)域,主要是由于臉上毛發(fā)的紋理特征是其比較關(guān)鍵的特征。而露出的皮膚區(qū)域占比相對較小,具體如圖 3.6 所示。圖3.6 金絲猴面部圖像分析圖從人類直觀視覺的角度來說,對于金絲猴的個體識別,這部分整體占比較少的皮膚區(qū)域(包含眼睛、鼻子、嘴巴)對分類結(jié)果來說也比較重要。而當(dāng)以整個面部圖像作為卷積神經(jīng)網(wǎng)絡(luò)的輸入時,隨著多重的卷積和 pooling 操作,會使得這部分信息丟失的比較嚴(yán)重。多重卷積操作后會使得面部結(jié)構(gòu)中的較為重要的幾何位置之間的約束關(guān)系逐步消失,忽略掉其整體與局部之間的關(guān)聯(lián)信息。因此,在金絲猴的個體面部圖像識別任務(wù)中,如何兼顧面部的整體毛發(fā)以及占比相對較少又較為關(guān)鍵的面部皮膚區(qū)域就顯得至關(guān)重要。
[41],如圖 3.7 所示。圖3.7 普通網(wǎng)絡(luò)加深層數(shù)后錯誤率變化情況[41]圖 3.7 中,左邊是訓(xùn)練過程的錯誤率,右邊是測試過程的錯誤率?梢钥闯,不論在訓(xùn)練過程還是測試過程中,這樣簡單的堆疊方式形成的網(wǎng)絡(luò),層數(shù)越來越深后準(zhǔn)確率反而下降了。而 ResNet 則是提出了殘差塊結(jié)構(gòu)來解決這個問題。ResNet 和HighWay Network[49]很相似,都允許原始輸入信息直接傳到后面的層中。具體來說,殘差塊與普通的網(wǎng)絡(luò)在結(jié)構(gòu)上的差別如圖 3.8 所示。weight layerweight layerweight layerweight layerXH(x)XF(x)H(x)=F(x)+xrelurelurelurelu+圖3.8 普通網(wǎng)絡(luò)與殘差網(wǎng)絡(luò)結(jié)構(gòu)對比圖
【參考文獻(xiàn)】:
期刊論文
[1]基于分塊主成分分析的太行山獼猴面部相似性[J]. 王白石,王振龍,鹿鶴,李利,路紀(jì)琪. 獸類學(xué)報. 2013(03)
[2]走近藍(lán)面精靈——川金絲猴[J]. 蔚培龍. 科學(xué)與文化. 2011(03)
[3]神農(nóng)架川金絲猴棲息地植物區(qū)系特征及食物資源研究[J]. 鐵軍,張晶,彭林鵬,廖明堯,楊林森,張志翔. 廣西植物. 2009(06)
[4]人臉檢測研究綜述[J]. 梁路宏,艾海舟,徐光祐,張鈸. 計算機(jī)學(xué)報. 2002(05)
博士論文
[1]人臉識別中若干關(guān)鍵問題的研究[D]. 山世光.中國科學(xué)院研究生院(計算技術(shù)研究所) 2004
碩士論文
[1]基于CNN的金絲猴面部識別研究與實現(xiàn)[D]. 方楠.西安電子科技大學(xué) 2017
本文編號:3012335
【文章來源】:西安電子科技大學(xué)陜西省 211工程院校 教育部直屬院校
【文章頁數(shù)】:82 頁
【學(xué)位級別】:碩士
【部分圖文】:
帶有一定角度的金絲猴面部圖像
含了整個頭部的區(qū)域,主要是由于臉上毛發(fā)的紋理特征是其比較關(guān)鍵的特征。而露出的皮膚區(qū)域占比相對較小,具體如圖 3.6 所示。圖3.6 金絲猴面部圖像分析圖從人類直觀視覺的角度來說,對于金絲猴的個體識別,這部分整體占比較少的皮膚區(qū)域(包含眼睛、鼻子、嘴巴)對分類結(jié)果來說也比較重要。而當(dāng)以整個面部圖像作為卷積神經(jīng)網(wǎng)絡(luò)的輸入時,隨著多重的卷積和 pooling 操作,會使得這部分信息丟失的比較嚴(yán)重。多重卷積操作后會使得面部結(jié)構(gòu)中的較為重要的幾何位置之間的約束關(guān)系逐步消失,忽略掉其整體與局部之間的關(guān)聯(lián)信息。因此,在金絲猴的個體面部圖像識別任務(wù)中,如何兼顧面部的整體毛發(fā)以及占比相對較少又較為關(guān)鍵的面部皮膚區(qū)域就顯得至關(guān)重要。
[41],如圖 3.7 所示。圖3.7 普通網(wǎng)絡(luò)加深層數(shù)后錯誤率變化情況[41]圖 3.7 中,左邊是訓(xùn)練過程的錯誤率,右邊是測試過程的錯誤率?梢钥闯,不論在訓(xùn)練過程還是測試過程中,這樣簡單的堆疊方式形成的網(wǎng)絡(luò),層數(shù)越來越深后準(zhǔn)確率反而下降了。而 ResNet 則是提出了殘差塊結(jié)構(gòu)來解決這個問題。ResNet 和HighWay Network[49]很相似,都允許原始輸入信息直接傳到后面的層中。具體來說,殘差塊與普通的網(wǎng)絡(luò)在結(jié)構(gòu)上的差別如圖 3.8 所示。weight layerweight layerweight layerweight layerXH(x)XF(x)H(x)=F(x)+xrelurelurelurelu+圖3.8 普通網(wǎng)絡(luò)與殘差網(wǎng)絡(luò)結(jié)構(gòu)對比圖
【參考文獻(xiàn)】:
期刊論文
[1]基于分塊主成分分析的太行山獼猴面部相似性[J]. 王白石,王振龍,鹿鶴,李利,路紀(jì)琪. 獸類學(xué)報. 2013(03)
[2]走近藍(lán)面精靈——川金絲猴[J]. 蔚培龍. 科學(xué)與文化. 2011(03)
[3]神農(nóng)架川金絲猴棲息地植物區(qū)系特征及食物資源研究[J]. 鐵軍,張晶,彭林鵬,廖明堯,楊林森,張志翔. 廣西植物. 2009(06)
[4]人臉檢測研究綜述[J]. 梁路宏,艾海舟,徐光祐,張鈸. 計算機(jī)學(xué)報. 2002(05)
博士論文
[1]人臉識別中若干關(guān)鍵問題的研究[D]. 山世光.中國科學(xué)院研究生院(計算技術(shù)研究所) 2004
碩士論文
[1]基于CNN的金絲猴面部識別研究與實現(xiàn)[D]. 方楠.西安電子科技大學(xué) 2017
本文編號:3012335
本文鏈接:http://sikaile.net/kejilunwen/zidonghuakongzhilunwen/3012335.html
最近更新
教材專著