基于級聯卷積神經網絡的高密度人臉檢測算法研究
發(fā)布時間:2021-11-20 02:12
隨著計算機視覺技術的不斷發(fā)展,人們對于圖像處理的需求已經逐漸從拍攝、錄影、播放等記錄性需求,發(fā)展為分類、檢測、識別、分割等智能化的需求。在這個基礎上,大量的計算機視覺任務和功能被不斷的提升和拓展。人臉作為近年來最為火熱的計算機視覺研究對象,吸引了大量相關的研究和工作,包括:人臉檢測、人臉識別、3D人臉重建、人臉合成、人臉跟蹤等。其中,作為人臉相關應用的前置步驟,人臉檢測更是其中最受重視的問題之一。盡管人臉的檢測與分析等技術已經發(fā)展多年,但仍然是計算機視覺領域中一個極具挑戰(zhàn)性的問題。其中最主要的原因在于,隨著人臉相關的應用逐漸的從配合式的方案轉移到非配合式的方案,從單一人臉的串行方案轉移到高密度人臉的并行方案,對于人臉檢測技術的要求也逐漸增加。受制于環(huán)境、光照、遮擋、姿態(tài)等因素,在高密度的場景下,人臉檢測的難度大大的提升了。此外,移動便攜設備對人臉檢測的需求日趨增加,受制于移動便攜設備計算資源的局限性,這就要求人臉檢測模型盡可能的輕量化。相較于單一復雜網絡,級聯卷積神經網絡能夠高效的解決人臉檢測正負樣本不平衡問題,通過前期輕量化網絡快速剔除背景,大大縮短檢測用時。但其在高密度無約束場景下...
【文章來源】:華中師范大學湖北省 211工程院校 教育部直屬院校
【文章頁數】:61 頁
【學位級別】:碩士
【部分圖文】:
圖2.1人類神經元模型與神經網絡模型??8??
?碩士學位論文??MASTER’S?THESIS??一般的,對于如圖2.1右側所展示的典型神經網路模型,取其第一個隱藏層的??第一個節(jié)點分析,其輸入輸出可表示為:??n??y,=SC^^,x,+b\)?公式(2.1)??/=1??此處,q為對于每個輸入的權重,h為整個節(jié)點的偏置項,5為非線性激活??函數。通過這樣的一個個非線性單元,隨著網絡層數的加深,其網絡的擬合能力??逐漸增強,并通過反向傳播算法進行參數的優(yōu)化,使得網絡能夠通過不斷的迭代??達到一個較優(yōu)的擬合函數來處理復雜的情景變化。??上述的模型中,每一個隱藏層的節(jié)點都需要和上一層的所有節(jié)點相連接,這??樣的隱藏層被稱為全連接層。全連接層的結構在網絡不斷加深時,計算量的增長??是極大地,使得這種完全的全連接方案很難被使用到網絡的設計中。另一方面,??在如分類、檢測等任務中,我們的目標對象在整個圖像中往往只占據圖像中的一??小部分。因此,基于全連接式的網絡搭建方式就顯得有些過于冗余;谶@種現??象,卷積神經網絡被提出用以取代全連接神經網絡被用在大量的計算機視覺問題??中。如圖2-2所示,左側的全連接模式的神經網絡在處理圖像的部分問題時,存在??著大量的冗余計算,而卷積神經網絡通過局部連接的方式,顯著降低的所需要的??計算量。通過網絡層數的加深和池化層的加入,來實現感受野的增大,實現了對??圖像中的特征進行提齲此外,卷積神經網絡的另外一個特點就是權值共享。對??于每一個特定的卷積核,都會在整張圖像中進行特征提取,不因為位置的變化而??變換卷積核的參數,這種方式不但顯著降低了計算量,大大降低了網絡的訓練難??度,也為卷積神經網絡帶來了一定的平移不變性。??全
?碩士學位論文??MASTER'S?THESIS??圖2-3是由LeCun等人在1998年提出的-?個經典的卷積神經網絡模型LeNet-??5。LeNet-5作為神經網絡設計最為經典的范式之一,通過卷積神經網絡來進行特征??提取,然后通過全連接層進行分類,在MN1ST數據集上實現了?98%的準確率,并??因此被廣泛是用在了支票識別的領域中。??Cj?S|?Ci?S:?ci)?*;??(rm?t?iemsc?amp%?Umxite?outjmt??^?—一?H?H、¥?、??convoluftoo?、?&丨?con%x>h?tK??*—-J?2x2?、、?\??\?cc^atcif^?、??feanuc?extraction?classification??額Zli取?分銳弓。??圖2-3?LeNet-5卷積神經網絡結構圖??2.3人臉檢測的相關算法??(1)級聯式人臉檢測算法??24-net??12-net???*?????*-???Input?Convolutional?Max-pooling?Fully-connected?Labels??Input?Convolutional?Max-pooling?Fully-connected?.?Image?layer?門??:lmag??layer?layer?layer?。!?:?:? ̄?^?^?V?^?:??i?aL>ri^^^[X?^?-I?;??YX?txJ?;?3?channels?64?5x5?filter*?3x3?kernel?128?output*?f?〇?/nwvfac??:??:3?ch
本文編號:3506354
【文章來源】:華中師范大學湖北省 211工程院校 教育部直屬院校
【文章頁數】:61 頁
【學位級別】:碩士
【部分圖文】:
圖2.1人類神經元模型與神經網絡模型??8??
?碩士學位論文??MASTER’S?THESIS??一般的,對于如圖2.1右側所展示的典型神經網路模型,取其第一個隱藏層的??第一個節(jié)點分析,其輸入輸出可表示為:??n??y,=SC^^,x,+b\)?公式(2.1)??/=1??此處,q為對于每個輸入的權重,h為整個節(jié)點的偏置項,5為非線性激活??函數。通過這樣的一個個非線性單元,隨著網絡層數的加深,其網絡的擬合能力??逐漸增強,并通過反向傳播算法進行參數的優(yōu)化,使得網絡能夠通過不斷的迭代??達到一個較優(yōu)的擬合函數來處理復雜的情景變化。??上述的模型中,每一個隱藏層的節(jié)點都需要和上一層的所有節(jié)點相連接,這??樣的隱藏層被稱為全連接層。全連接層的結構在網絡不斷加深時,計算量的增長??是極大地,使得這種完全的全連接方案很難被使用到網絡的設計中。另一方面,??在如分類、檢測等任務中,我們的目標對象在整個圖像中往往只占據圖像中的一??小部分。因此,基于全連接式的網絡搭建方式就顯得有些過于冗余;谶@種現??象,卷積神經網絡被提出用以取代全連接神經網絡被用在大量的計算機視覺問題??中。如圖2-2所示,左側的全連接模式的神經網絡在處理圖像的部分問題時,存在??著大量的冗余計算,而卷積神經網絡通過局部連接的方式,顯著降低的所需要的??計算量。通過網絡層數的加深和池化層的加入,來實現感受野的增大,實現了對??圖像中的特征進行提齲此外,卷積神經網絡的另外一個特點就是權值共享。對??于每一個特定的卷積核,都會在整張圖像中進行特征提取,不因為位置的變化而??變換卷積核的參數,這種方式不但顯著降低了計算量,大大降低了網絡的訓練難??度,也為卷積神經網絡帶來了一定的平移不變性。??全
?碩士學位論文??MASTER'S?THESIS??圖2-3是由LeCun等人在1998年提出的-?個經典的卷積神經網絡模型LeNet-??5。LeNet-5作為神經網絡設計最為經典的范式之一,通過卷積神經網絡來進行特征??提取,然后通過全連接層進行分類,在MN1ST數據集上實現了?98%的準確率,并??因此被廣泛是用在了支票識別的領域中。??Cj?S|?Ci?S:?ci)?*;??(rm?t?iemsc?amp%?Umxite?outjmt??^?—一?H?H、¥?、??convoluftoo?、?&丨?con%x>h?tK??*—-J?2x2?、、?\??\?cc^atcif^?、??feanuc?extraction?classification??額Zli取?分銳弓。??圖2-3?LeNet-5卷積神經網絡結構圖??2.3人臉檢測的相關算法??(1)級聯式人臉檢測算法??24-net??12-net???*?????*-???Input?Convolutional?Max-pooling?Fully-connected?Labels??Input?Convolutional?Max-pooling?Fully-connected?.?Image?layer?門??:lmag??layer?layer?layer?。!?:?:? ̄?^?^?V?^?:??i?aL>ri^^^[X?^?-I?;??YX?txJ?;?3?channels?64?5x5?filter*?3x3?kernel?128?output*?f?〇?/nwvfac??:??:3?ch
本文編號:3506354
本文鏈接:http://sikaile.net/kejilunwen/zidonghuakongzhilunwen/3506354.html