基于改進損失函數(shù)的YOLOV3的人臉檢測
發(fā)布時間:2021-07-30 17:21
人臉檢測技術(shù)是人臉識別技術(shù)的前置步驟,一直受到人們的重視。近年來隨著深度學(xué)習(xí)的發(fā)展,人臉檢測技術(shù)作為計算機視覺的一個重要研究方向也有了很大的進步。人臉檢測受復(fù)雜環(huán)境以及表情、遮擋、姿勢變化等因素的影響,檢測精度和速度往往不能達到預(yù)期目標。YOLOv3網(wǎng)絡(luò)是一種非常優(yōu)秀的目標檢測算法,它既能夠達到檢測的實時性要求,又能夠得到較好的檢測精度。針對YOLOv3檢測存在的漏檢誤檢問題,本文提出了一種基于改進損失函數(shù)的YOLOv3人臉檢測算法。首先,通過K均值聚類算法得到9個適合人臉數(shù)據(jù)集的先驗框;然后,提出應(yīng)用了一種新的邊界框回歸損失函數(shù)廣義交并比和平衡YOLOv3單步法正負樣本不平衡的焦點損失作為置信度函數(shù)來提高檢測的精度;最后,用殘差塊改進網(wǎng)絡(luò)最后的目標檢測層。在Wider Face人臉數(shù)據(jù)庫上對改進的YOLOv3的模型進行訓(xùn)練和測試,實驗結(jié)果表明,本文提出的基于改進損失函數(shù)YOLOv3的人臉檢測方法比原方法更加優(yōu)秀,所做的改進是可行有效的。
【文章來源】:南昌大學(xué)江西省 211工程院校
【文章頁數(shù)】:54 頁
【學(xué)位級別】:碩士
【部分圖文】:
圖1.2檢測算法對比數(shù)據(jù)???YOLOv3算法己經(jīng)獲得了極大的成果,比其他的檢測網(wǎng)絡(luò)更加優(yōu)秀,但是它??仍然有不少缺點,在檢測時仍然會存在漏檢還有定位錯誤等問題,在高速檢測的??同時檢測的精度仍然不夠高
、Y0L0v3網(wǎng)絡(luò)。然后將這些深度學(xué)習(xí)的檢測算法應(yīng)用到人臉檢??測。本章將詳細介紹Y0L0v3網(wǎng)絡(luò)所使用的殘差網(wǎng)絡(luò)、邊框回歸、交并比以及??Darknet53?網(wǎng)絡(luò)。??2.?1卷積神經(jīng)網(wǎng)絡(luò)??卷積神經(jīng)網(wǎng)絡(luò)(CNN)是多層級的神經(jīng)網(wǎng)絡(luò),在上世紀的90年代,LeCun??等人_確定了?CNN網(wǎng)絡(luò)的結(jié)構(gòu),并且對網(wǎng)絡(luò)的結(jié)構(gòu)加以完善。他們提出了叫做??LeNet-5的多層神經(jīng)網(wǎng)絡(luò),這種神經(jīng)網(wǎng)絡(luò)能夠分類手寫的數(shù)字,網(wǎng)絡(luò)可以使用??BP(backpr〇Pagati〇n)算法進行訓(xùn)練,網(wǎng)絡(luò)結(jié)構(gòu)如圖2.1所示。卷積神經(jīng)網(wǎng)絡(luò)可以??得到原始圖像的有效表征。它具有權(quán)值共享、局部連接等優(yōu)點,是一種特殊的前??饋神經(jīng)網(wǎng)絡(luò)。它相較于傳統(tǒng)的圖像處理算法的特殊之處就是它不用進行圖像預(yù)處??理過程,特別是那些需要靠人工參與的圖像預(yù)處理過程,也就是說卷積神經(jīng)網(wǎng)絡(luò)??直接對輸入的原始圖像進行一系列工作。??C3:?f,?maps16@10x10??INPUT?6?2SemaPS?S41m?〒拳??32x32??丨?工;v,??I?Gaussian?connections??Convolutions?Subsampiing?Convolutions?Subsampling?Full?coinection??圖2.?1?LeNet-5網(wǎng)絡(luò)結(jié)構(gòu)??2.1.1卷積神經(jīng)網(wǎng)絡(luò)概述??卷積祌經(jīng)網(wǎng)絡(luò)主要有卷積層和池化層與全連接層和激活函數(shù)組成。??8??
?2基于深度學(xué)習(xí)的人臉檢測概述???速度,最終直接使用神經(jīng)網(wǎng)絡(luò)來輸出邊框回歸(boundingbox,?bbox)的位置和??所屬類別。??YOLO算法是直接把整張圖片用來進行檢測的,因此它可以編碼全局信息,??能夠減少將背景檢測為目標的錯誤。YOLO算法的泛化能力非常強,也能夠遷移??到其他領(lǐng)域里去。??YOLO檢測過程如下圖2.5所示:??F?H?2.?Run?convolutional?network.???tf??I?3.?Non-max?suppression.?L_—_______??圖2.?5?YOLO檢測流程??YOLO算法直接通過端到端的來進行目標的檢測,它使用單一的卷積神經(jīng)網(wǎng)??絡(luò)來實現(xiàn)傳統(tǒng)的目標檢測的過程,然后使用卷積神經(jīng)網(wǎng)絡(luò)來直接回歸得到目標的??坐標位置。算法的做法如下圖2.6所示:??.1邏H??|?Vi—:??雙舞-.....-十-一上———二一—?w??????????1?1?????;.i???:???11?1"??圖2.?6?Y0L0具體檢測過程??YOLO將輸入的圖片分成SXS個單元格,如果待檢測圖片屮物體的中心點??在某個單元格中,那么這個單元格就負責對這個物體進行檢測。每一個單元格都??13??
【參考文獻】:
期刊論文
[1]改進的YOLO V3算法及其在小目標檢測中的應(yīng)用[J]. 鞠默然,羅海波,王仲博,何淼,常錚,惠斌. 光學(xué)學(xué)報. 2019(07)
碩士論文
[1]基于深度學(xué)習(xí)的人臉圖像超分辨率重建[D]. 史鵬濤.南昌大學(xué) 2019
[2]基于深度學(xué)習(xí)的人臉檢測和識別方法研究[D]. 劉婧月.電子科技大學(xué) 2018
本文編號:3311814
【文章來源】:南昌大學(xué)江西省 211工程院校
【文章頁數(shù)】:54 頁
【學(xué)位級別】:碩士
【部分圖文】:
圖1.2檢測算法對比數(shù)據(jù)???YOLOv3算法己經(jīng)獲得了極大的成果,比其他的檢測網(wǎng)絡(luò)更加優(yōu)秀,但是它??仍然有不少缺點,在檢測時仍然會存在漏檢還有定位錯誤等問題,在高速檢測的??同時檢測的精度仍然不夠高
、Y0L0v3網(wǎng)絡(luò)。然后將這些深度學(xué)習(xí)的檢測算法應(yīng)用到人臉檢??測。本章將詳細介紹Y0L0v3網(wǎng)絡(luò)所使用的殘差網(wǎng)絡(luò)、邊框回歸、交并比以及??Darknet53?網(wǎng)絡(luò)。??2.?1卷積神經(jīng)網(wǎng)絡(luò)??卷積神經(jīng)網(wǎng)絡(luò)(CNN)是多層級的神經(jīng)網(wǎng)絡(luò),在上世紀的90年代,LeCun??等人_確定了?CNN網(wǎng)絡(luò)的結(jié)構(gòu),并且對網(wǎng)絡(luò)的結(jié)構(gòu)加以完善。他們提出了叫做??LeNet-5的多層神經(jīng)網(wǎng)絡(luò),這種神經(jīng)網(wǎng)絡(luò)能夠分類手寫的數(shù)字,網(wǎng)絡(luò)可以使用??BP(backpr〇Pagati〇n)算法進行訓(xùn)練,網(wǎng)絡(luò)結(jié)構(gòu)如圖2.1所示。卷積神經(jīng)網(wǎng)絡(luò)可以??得到原始圖像的有效表征。它具有權(quán)值共享、局部連接等優(yōu)點,是一種特殊的前??饋神經(jīng)網(wǎng)絡(luò)。它相較于傳統(tǒng)的圖像處理算法的特殊之處就是它不用進行圖像預(yù)處??理過程,特別是那些需要靠人工參與的圖像預(yù)處理過程,也就是說卷積神經(jīng)網(wǎng)絡(luò)??直接對輸入的原始圖像進行一系列工作。??C3:?f,?maps16@10x10??INPUT?6?2SemaPS?S41m?〒拳??32x32??丨?工;v,??I?Gaussian?connections??Convolutions?Subsampiing?Convolutions?Subsampling?Full?coinection??圖2.?1?LeNet-5網(wǎng)絡(luò)結(jié)構(gòu)??2.1.1卷積神經(jīng)網(wǎng)絡(luò)概述??卷積祌經(jīng)網(wǎng)絡(luò)主要有卷積層和池化層與全連接層和激活函數(shù)組成。??8??
?2基于深度學(xué)習(xí)的人臉檢測概述???速度,最終直接使用神經(jīng)網(wǎng)絡(luò)來輸出邊框回歸(boundingbox,?bbox)的位置和??所屬類別。??YOLO算法是直接把整張圖片用來進行檢測的,因此它可以編碼全局信息,??能夠減少將背景檢測為目標的錯誤。YOLO算法的泛化能力非常強,也能夠遷移??到其他領(lǐng)域里去。??YOLO檢測過程如下圖2.5所示:??F?H?2.?Run?convolutional?network.???tf??I?3.?Non-max?suppression.?L_—_______??圖2.?5?YOLO檢測流程??YOLO算法直接通過端到端的來進行目標的檢測,它使用單一的卷積神經(jīng)網(wǎng)??絡(luò)來實現(xiàn)傳統(tǒng)的目標檢測的過程,然后使用卷積神經(jīng)網(wǎng)絡(luò)來直接回歸得到目標的??坐標位置。算法的做法如下圖2.6所示:??.1邏H??|?Vi—:??雙舞-.....-十-一上———二一—?w??????????1?1?????;.i???:???11?1"??圖2.?6?Y0L0具體檢測過程??YOLO將輸入的圖片分成SXS個單元格,如果待檢測圖片屮物體的中心點??在某個單元格中,那么這個單元格就負責對這個物體進行檢測。每一個單元格都??13??
【參考文獻】:
期刊論文
[1]改進的YOLO V3算法及其在小目標檢測中的應(yīng)用[J]. 鞠默然,羅海波,王仲博,何淼,常錚,惠斌. 光學(xué)學(xué)報. 2019(07)
碩士論文
[1]基于深度學(xué)習(xí)的人臉圖像超分辨率重建[D]. 史鵬濤.南昌大學(xué) 2019
[2]基于深度學(xué)習(xí)的人臉檢測和識別方法研究[D]. 劉婧月.電子科技大學(xué) 2018
本文編號:3311814
本文鏈接:http://sikaile.net/kejilunwen/zidonghuakongzhilunwen/3311814.html
最近更新
教材專著