基于多鏡頭轉(zhuǎn)換GAN的行人重識別研究
發(fā)布時間:2021-01-25 15:24
行人重識別是近年來在計算機(jī)視覺領(lǐng)域興起的一項新技術(shù),它是許多安防和監(jiān)控應(yīng)用中的重要任務(wù),在計算機(jī)視覺研究領(lǐng)域上也引起了越來越多的關(guān)注。行人重識別指的是在非重疊鏡頭視域中檢索出目標(biāo)行人。由于多個鏡頭拍攝的場景和拍攝角度是完全不相同的,假設(shè)我們要對某個鏡頭中拍攝到的目標(biāo)行人進(jìn)行重識別,即在其他的鏡頭中檢索該行人,除了要考慮目標(biāo)行人本身在不同鏡頭下外觀上的不同,還要考慮其他行人的影響,比如該目標(biāo)行人需要與其它鏡頭中的多個行人都進(jìn)行比較。隨著生成對抗網(wǎng)絡(luò)模型的提出和相關(guān)算法的不斷演變,基于生成對抗網(wǎng)絡(luò)的行人重識別研究也取得了良好的進(jìn)展,利用生成對抗網(wǎng)絡(luò)生成的圖像進(jìn)行網(wǎng)絡(luò)模型訓(xùn)練,很好的提升了性能。目前,行人重識別在單個數(shù)據(jù)集下的性能已經(jīng)有了顯著的提高,但在一個行人數(shù)據(jù)集下訓(xùn)練的模型,常常不能很好的推廣到另一個行人數(shù)據(jù)集。本文的主要工作如下:(1)由于行人重識別也是圖像檢索的子問題,本文了引入了細(xì)粒度圖像檢索的思想。本文提出了混合選擇性卷積描述符聚合的方法,該方法將選擇性卷積描述符聚合的特征與全局平均池化特征相結(jié)合,得到最終的行人特征。這種方法可以選擇有用的深度描述子,同時通過定位圖像中的行人目...
【文章來源】:長沙理工大學(xué)湖南省
【文章頁數(shù)】:60 頁
【學(xué)位級別】:碩士
【部分圖文】:
圖2.3CUHK01數(shù)據(jù)集圖片??Market-1501[38]總共32643張來自6個不同的攝像頭的圖像,如圖2.4所示,包含了??
?碩士學(xué)位論文???張行人圖片組成,包含了?632個不同的行人,行人圖像的分辨率統(tǒng)一為]28*48。??…為A':龜,,??讀_??圖2.2?VIPeK數(shù)據(jù)集圖片??CUHK01【i4繳據(jù)集在VIPeR數(shù)據(jù)集的基礎(chǔ)上進(jìn)行了擴(kuò)充。該數(shù)據(jù)集中的圖片也由兩??個相機(jī)拍攝,兩個相機(jī)的視角不同,如圖2.3所示,每個行人都出現(xiàn)在兩個不同的視角??中。不同的是,每個行人在每個相機(jī)中都采集了兩張圖片。數(shù)據(jù)集由3884張行人圖片??組成,包含了?971個不同的行人,行人圖像的分辨率統(tǒng)一為160*60。??|麵’??mm??圖2.3CUHK01數(shù)據(jù)集圖片??Market-1501[38]總共32643張來自6個不同的攝像頭的圖像,如圖2.4所示,包含了??1501個身份。其中訓(xùn)練集包含12936張圖片,共751個不同行人;測試集包含19732張??圖片,包含750個不同行人。此外,這個數(shù)據(jù)集還包含了?DPM檢測到的2793個錯誤圖??12??
?第二章相關(guān)理論概述???片,作為真實場景的干擾。每個ID至少出現(xiàn)在兩個攝像頭,使得跨攝像頭查詢是可行??的。在同攝像頭下,同一個ID可以有不同的外觀。在ICCV?2015年發(fā)布版本的后期,??集成了?500K的干擾項,使這個數(shù)據(jù)集非常大。在該數(shù)據(jù)集中,作者還使用mAP作為評??價標(biāo)準(zhǔn)對算法進(jìn)行了測試。??DukeMTMC-relDfM數(shù)據(jù)集中的圖片來自8個視角不同的攝像頭,一共包含36411??張行人圖像,共有1404個不同的行人,每個行人都出現(xiàn)在了多個相機(jī)鏡頭中。其中訓(xùn)??練集中包含了?702個不同行人的16522張圖片,測試集中包含了另外702個不同的行??人。測試集中,查詢庫中包含2228張查詢圖像,搜索庫中包含17661張行人圖像,均??來自這702個不同的行人中。此外,在搜索庫中,還額外加入了?408人作為干擾,以模??擬真實的應(yīng)用場景。??IIMi麵鈐.屢猶.??貓漏鱗誦??f?mm??圖2.4?Market-1501數(shù)據(jù)集圖片??m??■?£?鬧??國_1議1顧’??^?7?siM?If?yy??圖2.5MSMT17數(shù)據(jù)集圖片??13??
本文編號:2999462
【文章來源】:長沙理工大學(xué)湖南省
【文章頁數(shù)】:60 頁
【學(xué)位級別】:碩士
【部分圖文】:
圖2.3CUHK01數(shù)據(jù)集圖片??Market-1501[38]總共32643張來自6個不同的攝像頭的圖像,如圖2.4所示,包含了??
?碩士學(xué)位論文???張行人圖片組成,包含了?632個不同的行人,行人圖像的分辨率統(tǒng)一為]28*48。??…為A':龜,,??讀_??圖2.2?VIPeK數(shù)據(jù)集圖片??CUHK01【i4繳據(jù)集在VIPeR數(shù)據(jù)集的基礎(chǔ)上進(jìn)行了擴(kuò)充。該數(shù)據(jù)集中的圖片也由兩??個相機(jī)拍攝,兩個相機(jī)的視角不同,如圖2.3所示,每個行人都出現(xiàn)在兩個不同的視角??中。不同的是,每個行人在每個相機(jī)中都采集了兩張圖片。數(shù)據(jù)集由3884張行人圖片??組成,包含了?971個不同的行人,行人圖像的分辨率統(tǒng)一為160*60。??|麵’??mm??圖2.3CUHK01數(shù)據(jù)集圖片??Market-1501[38]總共32643張來自6個不同的攝像頭的圖像,如圖2.4所示,包含了??1501個身份。其中訓(xùn)練集包含12936張圖片,共751個不同行人;測試集包含19732張??圖片,包含750個不同行人。此外,這個數(shù)據(jù)集還包含了?DPM檢測到的2793個錯誤圖??12??
?第二章相關(guān)理論概述???片,作為真實場景的干擾。每個ID至少出現(xiàn)在兩個攝像頭,使得跨攝像頭查詢是可行??的。在同攝像頭下,同一個ID可以有不同的外觀。在ICCV?2015年發(fā)布版本的后期,??集成了?500K的干擾項,使這個數(shù)據(jù)集非常大。在該數(shù)據(jù)集中,作者還使用mAP作為評??價標(biāo)準(zhǔn)對算法進(jìn)行了測試。??DukeMTMC-relDfM數(shù)據(jù)集中的圖片來自8個視角不同的攝像頭,一共包含36411??張行人圖像,共有1404個不同的行人,每個行人都出現(xiàn)在了多個相機(jī)鏡頭中。其中訓(xùn)??練集中包含了?702個不同行人的16522張圖片,測試集中包含了另外702個不同的行??人。測試集中,查詢庫中包含2228張查詢圖像,搜索庫中包含17661張行人圖像,均??來自這702個不同的行人中。此外,在搜索庫中,還額外加入了?408人作為干擾,以模??擬真實的應(yīng)用場景。??IIMi麵鈐.屢猶.??貓漏鱗誦??f?mm??圖2.4?Market-1501數(shù)據(jù)集圖片??m??■?£?鬧??國_1議1顧’??^?7?siM?If?yy??圖2.5MSMT17數(shù)據(jù)集圖片??13??
本文編號:2999462
本文鏈接:http://sikaile.net/kejilunwen/shengwushengchang/2999462.html
最近更新
教材專著