基于多監(jiān)督信息的級聯(lián)全卷積人臉檢測算法
本文選題:人臉檢測 + 深度學(xué)習(xí); 參考:《哈爾濱工業(yè)大學(xué)》2017年碩士論文
【摘要】:目前,人臉檢測是計(jì)算機(jī)領(lǐng)域重點(diǎn)研究方向之一,無論在科研領(lǐng)域還是商用領(lǐng)域都具有較大的研究價(jià)值。在科研領(lǐng)域上,檢測問題是計(jì)算機(jī)視覺領(lǐng)域的一個(gè)基礎(chǔ)性課題。人臉檢測在人臉領(lǐng)域中作為人臉對齊、人臉識(shí)別、人臉驗(yàn)證的基礎(chǔ)問題,一直被大量的研究。實(shí)現(xiàn)在商業(yè)領(lǐng)域中,安防,金融,卡口等自然復(fù)雜場景中自動(dòng)快速準(zhǔn)確地檢測并識(shí)別人臉是工業(yè)界的目標(biāo)。但由于真實(shí)場景的復(fù)雜性,以及人臉檢測容易受到人臉姿態(tài)、角度、位置、背景等諸多因素變化的影響,導(dǎo)致人臉檢測仍有許多難點(diǎn)沒有徹底解決。人臉檢測任務(wù)可以拆分成判別人臉的二分類子任務(wù)和人臉?biāo)阉鞑呗宰尤蝿?wù)。人臉二分類子任務(wù)是判斷某一個(gè)區(qū)域是否是人臉,人臉?biāo)阉鞑呗宰尤蝿?wù)則是在整張圖片中搜索人臉。人臉二分類模型越簡單,且人臉?biāo)阉鞯膮^(qū)域越少,則人臉檢測算法的運(yùn)行速度就越快。目前人臉檢測算法處于顧此失彼的困境。效果好的算法由于模型過于復(fù)雜,運(yùn)行速度沒辦法達(dá)到實(shí)時(shí),而能達(dá)到實(shí)時(shí)的算法因?yàn)槟P捅容^簡單,導(dǎo)致算法本身的效果卻不是很好。如何訓(xùn)練出一個(gè)速度又快,而且效果又好的人臉檢測是人們非常關(guān)心的問題。目前主流方法將這兩個(gè)子任務(wù)獨(dú)立看待,即分類模型使用深度卷積網(wǎng)絡(luò),人臉?biāo)阉鞑捎没瑒?dòng)窗口、選擇性搜索等策略,導(dǎo)致計(jì)算資源消耗過多,檢測時(shí)間過長等問題。本文提出了一個(gè)模型簡單,檢測準(zhǔn)確,且能同時(shí)檢測多個(gè)尺度的人臉檢測算法。本文從全卷積網(wǎng)絡(luò)出發(fā),將這兩個(gè)子任務(wù)有效的結(jié)合起來,訓(xùn)練出一個(gè)不限制人臉尺度大小的人臉檢測模型。全卷積網(wǎng)絡(luò)和一般的卷積神經(jīng)網(wǎng)絡(luò)相比有著空間位置信息的優(yōu)勢,故相比于一般的卷積神經(jīng)網(wǎng)絡(luò)來說,全卷積網(wǎng)絡(luò)更適合做檢測、分割等任務(wù)。在測試的時(shí)候,就不需要將圖像放縮多個(gè)尺度再分別測試,而是通過一次測試將大部分人臉檢測出來。因?yàn)槿四槼叨仁欠窍薅ǖ?故直接訓(xùn)練人臉二分類模型會(huì)導(dǎo)致模型難以收斂或者效果較差,會(huì)產(chǎn)生較多的誤檢和漏檢。為了能減少這樣的問題,讓模型更好地訓(xùn)練,本論文將級聯(lián)思想引入全卷積網(wǎng)絡(luò)中,而且在人臉二分類和人臉邊界框回歸中分別提出多個(gè)監(jiān)督信息幫助網(wǎng)絡(luò)更好地收斂,構(gòu)造出一個(gè)基于多監(jiān)督信息的全卷積人臉檢測算法。本文通過在人臉檢測相關(guān)評測集進(jìn)行實(shí)驗(yàn),一一驗(yàn)證提出算法的有效性,實(shí)驗(yàn)結(jié)果表明該算法在評測集上取得了不錯(cuò)的成績。
[Abstract]:At present, face detection is one of the most important research directions in computer field, and it has great research value in both scientific and commercial fields. In the field of scientific research, detection is a basic subject in the field of computer vision. Face detection is the basic problem of face alignment, face recognition and face verification in face field. It is the target of industry to detect and recognize faces automatically and accurately in complex natural scenes such as security, finance, bayonet and so on. However, due to the complexity of the real scene and the fact that face detection is easily affected by the changes of face pose, angle, location, background and so on, there are still many difficulties in face detection that have not been solved thoroughly. The face detection task can be divided into two subtasks of face recognition and a subtask of face search strategy. The second subtask of face classification is to determine whether a certain region is a face or not, and the subtask of face search strategy is to search the face in the whole picture. The simpler the two-classification model is and the less the search area is, the faster the face detection algorithm is. At present, face detection algorithm is in the dilemma of neglecting one or the other. Due to the complexity of the model, the algorithm can not achieve real-time, but the algorithm can achieve real-time because the model is relatively simple, the result of the algorithm itself is not very good. How to train a fast and effective face detection is a very important problem. At present, the two subtasks are treated independently, that is, the classification model uses deep convolution network, the face search adopts sliding window, selective search and so on, which results in the excessive consumption of computing resources and the long detection time. In this paper, a face detection algorithm is presented, which is simple, accurate and can detect multiple scales at the same time. Based on the full convolution network, this paper combines these two subtasks effectively and trains a face detection model without limiting the face size. Compared with the general convolution neural network, the full convolution network has the advantage of spatial location information, so compared with the general convolution neural network, the full convolutional network is more suitable for the tasks of detection, segmentation and so on. In the test, we don't need to shrink the image to multiple scales and test separately. Instead, we detect most human faces by one test. Because the scale of face is not limited, direct training of the two-classification model of face will lead to the difficulty of convergence or the poor effect of the model, and will result in more misinformation and missed detection. In order to reduce this problem and train the model better, this paper introduces the concatenation idea into the full convolution network, and proposes several supervised information to help the network converge better in face two-classification and face boundary box regression. A full convolution face detection algorithm based on multi-supervised information is proposed. In this paper, the validity of the proposed algorithm is verified by experiments on the relevant evaluation set of face detection. The experimental results show that the algorithm has achieved good results in the evaluation set.
【學(xué)位授予單位】:哈爾濱工業(yè)大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2017
【分類號(hào)】:TP391.41
【相似文獻(xiàn)】
相關(guān)期刊論文 前10條
1 曾素娣;范九榮;李一民;;基于膚色和幾何特征的人臉檢測算法[J];電腦知識(shí)與技術(shù);2006年36期
2 趙東方;楊明;鄧世濤;;幾種人臉檢測算法的對比研究[J];內(nèi)江科技;2011年10期
3 王仕民;葉繼華;羅文兵;占明艷;;嵌入式人臉檢測算法的研究與實(shí)現(xiàn)[J];江西通信科技;2011年02期
4 金鑫;李晉惠;;基于神經(jīng)網(wǎng)絡(luò)的人臉檢測算法研究[J];科技信息;2008年35期
5 翟懿奎;黃聿;謝劍華;吳志龍;郭承剛;;基于膚色的實(shí)時(shí)人臉檢測算法研究[J];電子設(shè)計(jì)工程;2011年09期
6 王小蘭;蔡燦輝;朱建清;;一種改進(jìn)的快速人臉檢測算法[J];微型機(jī)與應(yīng)用;2013年15期
7 張煒;耿新;陳兆乾;陳世福;;一種基于可疑人臉區(qū)域發(fā)現(xiàn)的人臉檢測方法[J];計(jì)算機(jī)科學(xué);2004年04期
8 羅三定;周磊;沙莎;;一種新的快速多人臉檢測算法[J];計(jì)算機(jī)應(yīng)用研究;2008年04期
9 喬曉芳;吳小俊;王士同;楊靜宇;;一種改進(jìn)的人臉檢測算法[J];計(jì)算機(jī)應(yīng)用;2008年04期
10 徐顯日;;視頻中實(shí)時(shí)的人臉檢測算法[J];福建電腦;2012年08期
相關(guān)會(huì)議論文 前2條
1 付朝霞;韓焱;王黎明;;復(fù)雜背景下視頻運(yùn)動(dòng)目標(biāo)的人臉檢測算法[A];第十三屆中國體視學(xué)與圖像分析學(xué)術(shù)會(huì)議論文集[C];2013年
2 陳健;錢蕓蕓;;用DSP實(shí)現(xiàn)實(shí)時(shí)人臉檢測[A];第二屆全國信息獲取與處理學(xué)術(shù)會(huì)議論文集[C];2004年
相關(guān)博士學(xué)位論文 前2條
1 周薇娜;人臉檢測算法及其芯片實(shí)現(xiàn)關(guān)鍵技術(shù)研究[D];復(fù)旦大學(xué);2012年
2 郭聳;人臉檢測若干關(guān)鍵技術(shù)研究[D];哈爾濱工程大學(xué);2011年
相關(guān)碩士學(xué)位論文 前10條
1 習(xí)洋洋;基于多監(jiān)督信息的級聯(lián)全卷積人臉檢測算法[D];哈爾濱工業(yè)大學(xué);2017年
2 趙玉亭;基于ARM9的便攜式監(jiān)控取證系統(tǒng)的研究與設(shè)計(jì)[D];西安工業(yè)大學(xué);2015年
3 袁成林;基于支持向量機(jī)的笑臉識(shí)別算法研究[D];廣西大學(xué);2015年
4 楊萬振;視頻人臉檢測算法研究及其DSP實(shí)現(xiàn)[D];東北大學(xué);2013年
5 劉吉;基于自學(xué)習(xí)特征融合的人臉檢測算法研究[D];中國海洋大學(xué);2015年
6 馬慧;人臉檢測算法的設(shè)計(jì)與實(shí)現(xiàn)[D];東南大學(xué);2015年
7 鄒奇文;非對稱人臉檢測算法的研究與實(shí)現(xiàn)[D];華中科技大學(xué);2014年
8 江銳;基于Cortex-A8的人臉檢測系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)[D];華中科技大學(xué);2014年
9 張雪楠;基于PCA降維的快速人臉檢測算法研究[D];燕山大學(xué);2016年
10 羅富麗;單目可量測快速人臉檢測算法[D];昆明理工大學(xué);2016年
,本文編號(hào):1981468
本文鏈接:http://sikaile.net/kejilunwen/ruanjiangongchenglunwen/1981468.html