基于注意力機(jī)制的人群計(jì)數(shù)模型
發(fā)布時(shí)間:2021-04-17 18:35
公共場(chǎng)所大規(guī)模人群聚集行為很容易造成巨大的安全隱患,如果不能及時(shí)疏導(dǎo),很容易發(fā)生踩踏事故。人群計(jì)數(shù)與密度估計(jì)一直是視覺監(jiān)控領(lǐng)域的研究熱點(diǎn),可以協(xié)助分析場(chǎng)景中人群分布的動(dòng)態(tài)變化,對(duì)潛在的風(fēng)險(xiǎn)進(jìn)行預(yù)警。因此,相關(guān)算法被廣泛應(yīng)用于機(jī)場(chǎng)、車站、地鐵、購物中心等公共場(chǎng)所的監(jiān)控系統(tǒng)中,對(duì)公共安全領(lǐng)域具有重要意義。人群計(jì)數(shù)與密度估計(jì)是極具挑戰(zhàn)性的課題。光線變化、背景干擾、視角、遮擋等因素都會(huì)增加問題的處理難度。傳統(tǒng)的計(jì)數(shù)方法以行人檢測(cè)為基礎(chǔ),通常適用于人群密度較為稀疏的場(chǎng)景。近年來,隨著深度學(xué)習(xí)與計(jì)算機(jī)視覺技術(shù)的不斷發(fā)展,對(duì)密集復(fù)雜場(chǎng)景的分析受到了更為廣泛的關(guān)注。本論文提出一種基于注意力機(jī)制的復(fù)雜人群計(jì)數(shù)模型。該模型主要由注意力網(wǎng)絡(luò)和人群密度網(wǎng)絡(luò)兩部分組成。注意力網(wǎng)絡(luò)用于定位人群的潛在位置,區(qū)分前景區(qū)域與背景區(qū)域,克服背景區(qū)域?qū)τ?jì)數(shù)造成的干擾。人群密度網(wǎng)絡(luò)用于生成初步的人群密度圖,然后將注意力圖與群體密度圖做掩碼操作,得到細(xì)化后的人群分布。最后,通過圖像積分操作,對(duì)人群進(jìn)行計(jì)數(shù)。此外,本文還引入了擴(kuò)展卷積操作,一定程度上解決了多尺度人群檢測(cè)問題。本文在ShanghaiTech與UCFC
【文章來源】:大連海事大學(xué)遼寧省 211工程院校
【文章頁數(shù)】:64 頁
【學(xué)位級(jí)別】:碩士
【部分圖文】:
圖1.1各種人群場(chǎng)景
?基于注意力機(jī)制的人群計(jì)數(shù)算法???是函數(shù)/首先通過翻轉(zhuǎn)和平移之后與函數(shù)/?乘積的積分。在處理圖像任務(wù)中,假設(shè)一張??灰度圖像/(〖J)的尺寸是//?X?F,一個(gè)ATx?#的卷積核6(夂/)對(duì)圖像的卷積如圖2.1所示。??4#??圖2.1圖像卷積??Fig.?2.1?Image?convolution??最終輸出的圖像g(/,7_)如公式2.1所示:??g(i,?j)?=?/???/??=?+?kJ?+?l)KkJ)?(2.1)??kj??其中,卷積核在原始圖像上移動(dòng),每移動(dòng)一步,卷積核的iVxTV個(gè)參數(shù)會(huì)和原始圖??像相應(yīng)位置的數(shù)值相乘,接著把所有位置的乘積求和放在對(duì)應(yīng)輸出圖像卷積核中心的位??置上。通過計(jì)算得知,一幅圖像經(jīng)過卷積操作不能夠維持原始圖像大小,一個(gè)//xW的??原始圖像和1個(gè)#x7V的卷積核進(jìn)行卷積操作之后,它的尺寸變成??(7/-#?+?l)x(;r-W?+?l)。其中,卷積核尺寸與卷積步長(zhǎng)是兩個(gè)不可缺少的超參數(shù)。卷??積核大小是上述的因?yàn)槊看我苿?dòng)一步,步長(zhǎng)在上述的例子中為1,如果卷積核在原??始圖像上每次移動(dòng)兩步,那么它的步長(zhǎng)為2。??(3)下采樣層??下采樣層一般在卷積過程后,原始圖像經(jīng)過卷積操作后,獲得圖像的局部特征,會(huì)??存在一些無用的特征,這些特征可能會(huì)影響最終的檢測(cè)結(jié)果導(dǎo)致發(fā)生過擬合現(xiàn)象,所以??需要使用下采樣層保留有用的特征并且過濾掉無用的特征。下采樣層的作用是保留主要??特征、減少參數(shù)量、擴(kuò)大感受野和防止網(wǎng)絡(luò)模型過擬合。??VGG16網(wǎng)絡(luò)模型是比較常用的模型,在計(jì)算機(jī)視覺領(lǐng)域里的很多任務(wù)都用到??VGG16去提取相應(yīng)的目標(biāo)特征,并且取得了不錯(cuò)的效果。??本文的人群密度網(wǎng)
?大連海事大學(xué)碩士學(xué)位論文???224?x?224?x?3?224?x?224?x?64??Ai??祕(mì)112?x:.12x128??mm?m??////^?x?56?x?256??■?W?LVx512??l?1?^?懸?^?麵??0?convolution+ReLU??/?Ql?max?pooling??/?fully?nected+ReLU??softmax??圖2.2?VGG16網(wǎng)絡(luò)結(jié)構(gòu)[56]??Fig.?2.2?VGG16?network?structure??VGG16是由Simonyan等人[56]提出,該網(wǎng)絡(luò)模型獲得2014年的TmageNet?ILSVRC??比賽中分類任務(wù)的亞軍(冠軍是Googlenet)和定位任務(wù)的冠軍,如圖2.2所示,該網(wǎng)絡(luò)??結(jié)構(gòu)一共有16層,分為13層卷積層和3層全連接層,分別在第2、4、7、13層后面加??入了最大值下采樣層(MaxPooling),在最后一層輸出1,000個(gè)類別的概率,進(jìn)行目標(biāo)??識(shí)別任務(wù)。在AlexNet網(wǎng)絡(luò)結(jié)構(gòu)的基礎(chǔ)上,VGG16使用一些相同的技術(shù)比如,使用??Dropout、數(shù)據(jù)增廣(DataAugmentation)和層疊池化來防止過擬合現(xiàn)象的發(fā)生,使用了??re/u激活函數(shù)去代替激活函數(shù),解決了因?yàn)樘荻蕊柡投鴮?dǎo)致訓(xùn)練收斂速度變慢??的情況,而且re/w函數(shù)的計(jì)算量大部分都用在了判斷輸入數(shù)字的正負(fù)判斷中,所以計(jì)算??量比較少,增加了網(wǎng)絡(luò)的訓(xùn)練速度。VGG16進(jìn)行一些改進(jìn),主要有以下幾點(diǎn):??(1)加深了網(wǎng)絡(luò)模型的層數(shù)。AlexNet網(wǎng)絡(luò)模型一共有8層結(jié)構(gòu),其中包含5層卷??積層和3層全連接層,而VGG16網(wǎng)絡(luò)一共有16層結(jié)構(gòu),網(wǎng)
【參考文獻(xiàn)】:
期刊論文
[1]卷積神經(jīng)網(wǎng)絡(luò)研究綜述[J]. 周飛燕,金林鵬,董軍. 計(jì)算機(jī)學(xué)報(bào). 2017(06)
[2]基于連續(xù)模型和動(dòng)力學(xué)仿真模型的高密度人群仿真算法[J]. 孫立博,孫曉峰,秦文虎. 計(jì)算機(jī)學(xué)報(bào). 2016(07)
本文編號(hào):3143936
【文章來源】:大連海事大學(xué)遼寧省 211工程院校
【文章頁數(shù)】:64 頁
【學(xué)位級(jí)別】:碩士
【部分圖文】:
圖1.1各種人群場(chǎng)景
?基于注意力機(jī)制的人群計(jì)數(shù)算法???是函數(shù)/首先通過翻轉(zhuǎn)和平移之后與函數(shù)/?乘積的積分。在處理圖像任務(wù)中,假設(shè)一張??灰度圖像/(〖J)的尺寸是//?X?F,一個(gè)ATx?#的卷積核6(夂/)對(duì)圖像的卷積如圖2.1所示。??4#??圖2.1圖像卷積??Fig.?2.1?Image?convolution??最終輸出的圖像g(/,7_)如公式2.1所示:??g(i,?j)?=?/???/??=?+?kJ?+?l)KkJ)?(2.1)??kj??其中,卷積核在原始圖像上移動(dòng),每移動(dòng)一步,卷積核的iVxTV個(gè)參數(shù)會(huì)和原始圖??像相應(yīng)位置的數(shù)值相乘,接著把所有位置的乘積求和放在對(duì)應(yīng)輸出圖像卷積核中心的位??置上。通過計(jì)算得知,一幅圖像經(jīng)過卷積操作不能夠維持原始圖像大小,一個(gè)//xW的??原始圖像和1個(gè)#x7V的卷積核進(jìn)行卷積操作之后,它的尺寸變成??(7/-#?+?l)x(;r-W?+?l)。其中,卷積核尺寸與卷積步長(zhǎng)是兩個(gè)不可缺少的超參數(shù)。卷??積核大小是上述的因?yàn)槊看我苿?dòng)一步,步長(zhǎng)在上述的例子中為1,如果卷積核在原??始圖像上每次移動(dòng)兩步,那么它的步長(zhǎng)為2。??(3)下采樣層??下采樣層一般在卷積過程后,原始圖像經(jīng)過卷積操作后,獲得圖像的局部特征,會(huì)??存在一些無用的特征,這些特征可能會(huì)影響最終的檢測(cè)結(jié)果導(dǎo)致發(fā)生過擬合現(xiàn)象,所以??需要使用下采樣層保留有用的特征并且過濾掉無用的特征。下采樣層的作用是保留主要??特征、減少參數(shù)量、擴(kuò)大感受野和防止網(wǎng)絡(luò)模型過擬合。??VGG16網(wǎng)絡(luò)模型是比較常用的模型,在計(jì)算機(jī)視覺領(lǐng)域里的很多任務(wù)都用到??VGG16去提取相應(yīng)的目標(biāo)特征,并且取得了不錯(cuò)的效果。??本文的人群密度網(wǎng)
?大連海事大學(xué)碩士學(xué)位論文???224?x?224?x?3?224?x?224?x?64??Ai??祕(mì)112?x:.12x128??mm?m??////^?x?56?x?256??■?W?LVx512??l?1?^?懸?^?麵??0?convolution+ReLU??/?Ql?max?pooling??/?fully?nected+ReLU??softmax??圖2.2?VGG16網(wǎng)絡(luò)結(jié)構(gòu)[56]??Fig.?2.2?VGG16?network?structure??VGG16是由Simonyan等人[56]提出,該網(wǎng)絡(luò)模型獲得2014年的TmageNet?ILSVRC??比賽中分類任務(wù)的亞軍(冠軍是Googlenet)和定位任務(wù)的冠軍,如圖2.2所示,該網(wǎng)絡(luò)??結(jié)構(gòu)一共有16層,分為13層卷積層和3層全連接層,分別在第2、4、7、13層后面加??入了最大值下采樣層(MaxPooling),在最后一層輸出1,000個(gè)類別的概率,進(jìn)行目標(biāo)??識(shí)別任務(wù)。在AlexNet網(wǎng)絡(luò)結(jié)構(gòu)的基礎(chǔ)上,VGG16使用一些相同的技術(shù)比如,使用??Dropout、數(shù)據(jù)增廣(DataAugmentation)和層疊池化來防止過擬合現(xiàn)象的發(fā)生,使用了??re/u激活函數(shù)去代替激活函數(shù),解決了因?yàn)樘荻蕊柡投鴮?dǎo)致訓(xùn)練收斂速度變慢??的情況,而且re/w函數(shù)的計(jì)算量大部分都用在了判斷輸入數(shù)字的正負(fù)判斷中,所以計(jì)算??量比較少,增加了網(wǎng)絡(luò)的訓(xùn)練速度。VGG16進(jìn)行一些改進(jìn),主要有以下幾點(diǎn):??(1)加深了網(wǎng)絡(luò)模型的層數(shù)。AlexNet網(wǎng)絡(luò)模型一共有8層結(jié)構(gòu),其中包含5層卷??積層和3層全連接層,而VGG16網(wǎng)絡(luò)一共有16層結(jié)構(gòu),網(wǎng)
【參考文獻(xiàn)】:
期刊論文
[1]卷積神經(jīng)網(wǎng)絡(luò)研究綜述[J]. 周飛燕,金林鵬,董軍. 計(jì)算機(jī)學(xué)報(bào). 2017(06)
[2]基于連續(xù)模型和動(dòng)力學(xué)仿真模型的高密度人群仿真算法[J]. 孫立博,孫曉峰,秦文虎. 計(jì)算機(jī)學(xué)報(bào). 2016(07)
本文編號(hào):3143936
本文鏈接:http://sikaile.net/shoufeilunwen/xixikjs/3143936.html
最近更新
教材專著