自然場(chǎng)景下行人再識(shí)別技術(shù)研究及實(shí)現(xiàn)
發(fā)布時(shí)間:2021-01-26 03:01
行人再識(shí)別是計(jì)算機(jī)視覺(jué)領(lǐng)域的一項(xiàng)重要技術(shù),能夠在跨域監(jiān)控系統(tǒng)中識(shí)別和跟蹤不同的行人,對(duì)于刑偵探案、流量分析、尋找丟失的老人和兒童等都具有重要的現(xiàn)實(shí)意義。近幾年,行人再識(shí)別技術(shù)得到了廣泛的關(guān)注,尤其是隨著卷積神經(jīng)網(wǎng)絡(luò)的應(yīng)用,極大地促進(jìn)了端到端的行人再識(shí)別技術(shù)的發(fā)展,也出現(xiàn)了許多研究子類。但是在實(shí)際應(yīng)用中行人再識(shí)別任務(wù)也面臨著一些困難和挑戰(zhàn),比如缺乏大量的訓(xùn)練數(shù)據(jù),當(dāng)前收集到的數(shù)據(jù)與真實(shí)數(shù)據(jù)的時(shí)空分布相比是非常有限的;而且受不同攝像頭設(shè)置角度、光照變化、背景差異、姿態(tài)變化等的影響,行人的視覺(jué)特征會(huì)發(fā)生劇烈變化,增大了匹配難度。如何克服上述因素帶來(lái)的影響,是解決行人再識(shí)別技術(shù)的關(guān)鍵。本文基于自然場(chǎng)景下采集的監(jiān)控視頻數(shù)據(jù)進(jìn)行行人再識(shí)別研究,通過(guò)對(duì)傳統(tǒng)手工設(shè)計(jì)與卷積神經(jīng)網(wǎng)絡(luò)方法進(jìn)行分析和對(duì)比,對(duì)整體的研究有了更清晰的認(rèn)識(shí)。本文重點(diǎn)對(duì)基于對(duì)抗生成網(wǎng)絡(luò)的行人再識(shí)別方法進(jìn)行研究,對(duì)抗生成網(wǎng)絡(luò)具有生成樣本的能力,當(dāng)前在行人再識(shí)別領(lǐng)域得到了廣泛的應(yīng)用。針對(duì)數(shù)據(jù)集存在的訓(xùn)練樣本不足以及季節(jié)差異問(wèn)題,本文基于對(duì)抗生成網(wǎng)絡(luò)及其衍變模型進(jìn)行圖像風(fēng)格轉(zhuǎn)換研究,提出了一個(gè)解決方案來(lái)完成多場(chǎng)景下的冬夏季節(jié)遷移。在循環(huán)對(duì)...
【文章來(lái)源】:北京郵電大學(xué)北京市 211工程院校 教育部直屬院校
【文章頁(yè)數(shù)】:60 頁(yè)
【學(xué)位級(jí)別】:碩士
【部分圖文】:
圖1-1行人再識(shí)別查詢步驟??與上述過(guò)程相對(duì)應(yīng),行人再識(shí)別任務(wù)可以劃分成獨(dú)立的兩個(gè)步驟:特征提取??和距離計(jì)算,可以針對(duì)其中一個(gè)方面進(jìn)行專門研宄來(lái)提高模型的準(zhǔn)確率
(4)數(shù)據(jù)影響??首先是行人數(shù)據(jù)收集困難,導(dǎo)致訓(xùn)練數(shù)據(jù)不足。當(dāng)前,我們很難收集到跨時(shí)??間、跨氣候和多場(chǎng)景的大規(guī)模行人數(shù)據(jù),遠(yuǎn)遠(yuǎn)達(dá)不到真實(shí)數(shù)據(jù)要求的廣泛性時(shí)分布。而且與其他視覺(jué)任務(wù)相比,公開(kāi)數(shù)據(jù)集的規(guī)模也非常小,當(dāng)前最大規(guī)模行人再識(shí)別數(shù)據(jù)集僅有4000多個(gè)行人,共12萬(wàn)多張行人圖片,遠(yuǎn)達(dá)不到實(shí)際用的需求。??其次是數(shù)據(jù)集的制作和發(fā)布比較困難。與其他公開(kāi)數(shù)據(jù)集制作不同,行人再??識(shí)別任務(wù)需要依賴人工對(duì)每張行人圖像進(jìn)行標(biāo)注,這會(huì)消耗大量的人力和物力。??而且標(biāo)注本身有時(shí)也存在問(wèn)題,在視頻中要想把兩個(gè)年齡、體貌相似、穿著相同??的行人區(qū)分開(kāi)是比較困難的。另外,隱私保護(hù)也是需要考慮的難點(diǎn),行人圖像般包含行人的面部和肢體信息,發(fā)布數(shù)據(jù)集之前需要對(duì)行人進(jìn)行脫敏處理。??1.3研究?jī)?nèi)容??本文主要研究了自然場(chǎng)景下行人再識(shí)別技術(shù)的主流算法與研究熱點(diǎn),工作內(nèi)??:??
基于視頻序列的方法主要思想是構(gòu)建混合網(wǎng)絡(luò),一方面通過(guò)卷積神經(jīng)網(wǎng)絡(luò)來(lái)??提取空間特征,另一方面利用循環(huán)神經(jīng)網(wǎng)絡(luò)(RecurrentNeuralNetworks,RNN)??[3()]來(lái)提取時(shí)序特征。整個(gè)網(wǎng)絡(luò)的輸入為圖像序列,過(guò)程如圖2-1所示。??<幀1???卷積網(wǎng)絡(luò)??循環(huán)網(wǎng)絡(luò)????特??行人1? ̄一幀2——^卷積網(wǎng)絡(luò)——?循環(huán)網(wǎng)絡(luò)——??J????\幀3???卷積網(wǎng)絡(luò)??循環(huán)網(wǎng)絡(luò)???u??距離計(jì)算??^幀1???卷積網(wǎng)絡(luò)??循環(huán)網(wǎng)絡(luò)???ik??i?特????I?量??\幀3???卷積網(wǎng)絡(luò)??循環(huán)網(wǎng)絡(luò)????圖2-1基于視頻序列的行人再識(shí)別流程??每張圖像都經(jīng)過(guò)一個(gè)共享的CNN提取出圖像空間特征,然后這些特征向量??被輸入到一個(gè)RNN網(wǎng)絡(luò)去提取時(shí)序特征。最終的特征表示融合了單幀圖像的特??征和幀與幀之間的時(shí)序特征,用于代替前面單幀方法的特征向量來(lái)訓(xùn)練網(wǎng)絡(luò)。這??種方法能夠充分利用多幀數(shù)據(jù)的信息,提取出更有辨別力的行人特征。這對(duì)于行??人追蹤技術(shù)是十分重要的,因?yàn)橥ㄟ^(guò)繪制行人的運(yùn)動(dòng)軌跡,能夠不斷分析和追蹤??行人,幫助預(yù)判行人的出現(xiàn)位置。??2.2.4行人對(duì)齊??大多數(shù)現(xiàn)有的行人再識(shí)別方法側(cè)重于學(xué)習(xí)有監(jiān)督的身份辨別信息,但無(wú)論是??特征提取還是距離度量,甚至深度學(xué)習(xí)方法都假設(shè)行人的圖像是嚴(yán)格對(duì)齊的,這??在實(shí)際應(yīng)用場(chǎng)景中幾乎是不可能實(shí)現(xiàn)的。因?yàn)樾腥藱z測(cè)器會(huì)存在偏差
本文編號(hào):3000352
【文章來(lái)源】:北京郵電大學(xué)北京市 211工程院校 教育部直屬院校
【文章頁(yè)數(shù)】:60 頁(yè)
【學(xué)位級(jí)別】:碩士
【部分圖文】:
圖1-1行人再識(shí)別查詢步驟??與上述過(guò)程相對(duì)應(yīng),行人再識(shí)別任務(wù)可以劃分成獨(dú)立的兩個(gè)步驟:特征提取??和距離計(jì)算,可以針對(duì)其中一個(gè)方面進(jìn)行專門研宄來(lái)提高模型的準(zhǔn)確率
(4)數(shù)據(jù)影響??首先是行人數(shù)據(jù)收集困難,導(dǎo)致訓(xùn)練數(shù)據(jù)不足。當(dāng)前,我們很難收集到跨時(shí)??間、跨氣候和多場(chǎng)景的大規(guī)模行人數(shù)據(jù),遠(yuǎn)遠(yuǎn)達(dá)不到真實(shí)數(shù)據(jù)要求的廣泛性時(shí)分布。而且與其他視覺(jué)任務(wù)相比,公開(kāi)數(shù)據(jù)集的規(guī)模也非常小,當(dāng)前最大規(guī)模行人再識(shí)別數(shù)據(jù)集僅有4000多個(gè)行人,共12萬(wàn)多張行人圖片,遠(yuǎn)達(dá)不到實(shí)際用的需求。??其次是數(shù)據(jù)集的制作和發(fā)布比較困難。與其他公開(kāi)數(shù)據(jù)集制作不同,行人再??識(shí)別任務(wù)需要依賴人工對(duì)每張行人圖像進(jìn)行標(biāo)注,這會(huì)消耗大量的人力和物力。??而且標(biāo)注本身有時(shí)也存在問(wèn)題,在視頻中要想把兩個(gè)年齡、體貌相似、穿著相同??的行人區(qū)分開(kāi)是比較困難的。另外,隱私保護(hù)也是需要考慮的難點(diǎn),行人圖像般包含行人的面部和肢體信息,發(fā)布數(shù)據(jù)集之前需要對(duì)行人進(jìn)行脫敏處理。??1.3研究?jī)?nèi)容??本文主要研究了自然場(chǎng)景下行人再識(shí)別技術(shù)的主流算法與研究熱點(diǎn),工作內(nèi)??:??
基于視頻序列的方法主要思想是構(gòu)建混合網(wǎng)絡(luò),一方面通過(guò)卷積神經(jīng)網(wǎng)絡(luò)來(lái)??提取空間特征,另一方面利用循環(huán)神經(jīng)網(wǎng)絡(luò)(RecurrentNeuralNetworks,RNN)??[3()]來(lái)提取時(shí)序特征。整個(gè)網(wǎng)絡(luò)的輸入為圖像序列,過(guò)程如圖2-1所示。??<幀1???卷積網(wǎng)絡(luò)??循環(huán)網(wǎng)絡(luò)????特??行人1? ̄一幀2——^卷積網(wǎng)絡(luò)——?循環(huán)網(wǎng)絡(luò)——??J????\幀3???卷積網(wǎng)絡(luò)??循環(huán)網(wǎng)絡(luò)???u??距離計(jì)算??^幀1???卷積網(wǎng)絡(luò)??循環(huán)網(wǎng)絡(luò)???ik??i?特????I?量??\幀3???卷積網(wǎng)絡(luò)??循環(huán)網(wǎng)絡(luò)????圖2-1基于視頻序列的行人再識(shí)別流程??每張圖像都經(jīng)過(guò)一個(gè)共享的CNN提取出圖像空間特征,然后這些特征向量??被輸入到一個(gè)RNN網(wǎng)絡(luò)去提取時(shí)序特征。最終的特征表示融合了單幀圖像的特??征和幀與幀之間的時(shí)序特征,用于代替前面單幀方法的特征向量來(lái)訓(xùn)練網(wǎng)絡(luò)。這??種方法能夠充分利用多幀數(shù)據(jù)的信息,提取出更有辨別力的行人特征。這對(duì)于行??人追蹤技術(shù)是十分重要的,因?yàn)橥ㄟ^(guò)繪制行人的運(yùn)動(dòng)軌跡,能夠不斷分析和追蹤??行人,幫助預(yù)判行人的出現(xiàn)位置。??2.2.4行人對(duì)齊??大多數(shù)現(xiàn)有的行人再識(shí)別方法側(cè)重于學(xué)習(xí)有監(jiān)督的身份辨別信息,但無(wú)論是??特征提取還是距離度量,甚至深度學(xué)習(xí)方法都假設(shè)行人的圖像是嚴(yán)格對(duì)齊的,這??在實(shí)際應(yīng)用場(chǎng)景中幾乎是不可能實(shí)現(xiàn)的。因?yàn)樾腥藱z測(cè)器會(huì)存在偏差
本文編號(hào):3000352
本文鏈接:http://sikaile.net/kejilunwen/shengwushengchang/3000352.html
最近更新
教材專著