基于Mask RCNN神經(jīng)網(wǎng)絡(luò)的行人重識別研究
發(fā)布時間:2021-07-25 19:15
隨著信息技術(shù)的飛速發(fā)展以及對城市安防的重視程度不斷提高,行人重識別作為智能視頻安全監(jiān)控系統(tǒng)的關(guān)鍵技術(shù)之一,正受到越來越多的重視。目前,如何獲得分辨力和泛化能力更強的行人特征、將行人重識別與行人檢測結(jié)合以應用到真實場景中是行人重識別的兩個重要研究方向。通過對行人重識別的研究發(fā)現(xiàn),傳統(tǒng)行人重識別使用的數(shù)據(jù)集圖像通過行人檢測方式獲得,這些圖像中總是存在不少背景、遮擋、其他行人等干擾,影響行人特征提取效果。為了解決這個問題,本文使用Mask RCNN實例分割神經(jīng)網(wǎng)絡(luò)在檢測行人的同時去除背景等干擾,避免其對行人重識別特征提取過程造成負面影響。考慮到行人攜帶的物體有助于行人的特征表示,提出結(jié)合這些物體的行人重識別特征提取方法。對于Mask RCNN的圖像分割部分對圖像特征利用不足,導致圖像分割效果不佳的問題,參考語義分割方法對該部分進行改進,并完成改進后的Mask RCNN實例分割神經(jīng)網(wǎng)絡(luò)的搭建。在行人實例分割的同時,將行人攜帶的物體如背包、傘、手提包、手提箱保留下來,在行人重識別階段與行人特征結(jié)合構(gòu)建出行人混合特征,并完成行人重識別神經(jīng)網(wǎng)絡(luò)模型的搭建。最后結(jié)合改進后的Mask RCNN和行人重識...
【文章來源】:西安科技大學陜西省
【文章頁數(shù)】:65 頁
【學位級別】:碩士
【部分圖文】:
行人重識別系統(tǒng)
?治?傅確藎?傭?進行頭部、上身、腿部等身體部分的劃分,文獻[20]中使用了孿生網(wǎng)絡(luò),其使用的損失函數(shù)是用于度量學習方法的對比損失函數(shù)。該方法先將輸入的兩幅圖片均分為n份后,將它們按照從上到下的順序輸入一個長短時記憶神經(jīng)網(wǎng)絡(luò),得到各個部分的局部特征,最后使用特征融合的方式將所有局部特征結(jié)合在一起,得到行人總特征。但是圖片切塊方法的缺點也很明顯,即其需要首先對圖片進行對齊的,如果使用的兩張圖片對齊的效果不佳,那么會出現(xiàn)將行人的頭與其腰腹部進行對比的現(xiàn)象,這反而會使得神經(jīng)網(wǎng)絡(luò)模型判斷錯誤。如圖1.2所示:圖1.2圖片切塊方法缺點
集擴充。隨著GAN神經(jīng)網(wǎng)絡(luò)的不斷發(fā)展,其已經(jīng)不再只能生成隨機圖片,CycleGAN[23]、DualGAN[24]和DiscoGAN[25]可以進行對輸入圖片的轉(zhuǎn)換,以擴大數(shù)據(jù)集。文獻[26]首先使用GAN神經(jīng)網(wǎng)絡(luò)協(xié)助行人重識別的研究,其使用了GAN隨機生成行人圖片作為行人重識別神經(jīng)網(wǎng)絡(luò)訓練數(shù)據(jù)的增廣,間接的提高該文獻所使用的IDE網(wǎng)絡(luò)的性能。由于監(jiān)控攝像頭所處的光線、角度等可能有所不同,因此這些攝像頭拍攝的視頻風格之間可能存在偏差,Zhong等人提出使用CycleGAN從而實現(xiàn)不同相機風格之間的轉(zhuǎn)換,以減小它們之間的風格偏差[27],如圖1.3所示。此外,由于不同數(shù)據(jù)集的應用場景不同,因此它們之間的場景偏差也不可忽視,因此經(jīng)常出現(xiàn)在一個數(shù)據(jù)集上訓練好的高性能神經(jīng)網(wǎng)絡(luò),在其它數(shù)據(jù)集上出現(xiàn)性能降低的情況。為了解決這個問題,文獻[28]基于CycleGAN提出了更適合行人重識別的personGAN。圖1.3相機風格轉(zhuǎn)換1.3本文研究內(nèi)容目前的行人重識別研究基于Market1501[29]、CUHK03[30]、DukeMTMC[31]等行人重識別公開數(shù)據(jù)集,在這些數(shù)據(jù)集中,行人圖像都是已經(jīng)裁剪好的。而且用于這些數(shù)據(jù)集的行人重識別方法已經(jīng)能獲得很高的準確度,但將它們應用于整個端到端的行人重識別系
【參考文獻】:
期刊論文
[1]基于深度學習的行人重識別研究進展[J]. 羅浩,姜偉,范星,張思朋. 自動化學報. 2019(11)
[2]國家九部委:出臺《關(guān)于加強公共安全視頻監(jiān)控建設(shè)聯(lián)網(wǎng)應用工作的若干意見》[J]. 中國信息安全. 2015(06)
[3]淺析平安城市視頻監(jiān)控大聯(lián)網(wǎng)的發(fā)展[J]. 魏一. 中國安防. 2013(03)
[4]廣州城市居民消費行為與生活質(zhì)量研究[J]. 廣州市城調(diào)隊課題組,余家榮. 廣東經(jīng)濟. 2006(12)
博士論文
[1]基于度量學習的行人重識別方法研究[D]. 王金.華中科技大學 2017
碩士論文
[1]融合局部特征的行人重識別神經(jīng)網(wǎng)絡(luò)模型[D]. 李天霖.西安電子科技大學 2019
[2]基于深度學習的行人重識別技術(shù)研究[D]. 李強.西安電子科技大學 2019
[3]基于目標輔助信息的行人重識別方法[D]. 陳普.西安電子科技大學 2019
[4]基于深度學習的行人重識別方法研究[D]. 吳江.電子科技大學 2019
[5]基于語義一致性的多視角行人再識別研究[D]. 毛超杰.浙江大學 2018
本文編號:3302612
【文章來源】:西安科技大學陜西省
【文章頁數(shù)】:65 頁
【學位級別】:碩士
【部分圖文】:
行人重識別系統(tǒng)
?治?傅確藎?傭?進行頭部、上身、腿部等身體部分的劃分,文獻[20]中使用了孿生網(wǎng)絡(luò),其使用的損失函數(shù)是用于度量學習方法的對比損失函數(shù)。該方法先將輸入的兩幅圖片均分為n份后,將它們按照從上到下的順序輸入一個長短時記憶神經(jīng)網(wǎng)絡(luò),得到各個部分的局部特征,最后使用特征融合的方式將所有局部特征結(jié)合在一起,得到行人總特征。但是圖片切塊方法的缺點也很明顯,即其需要首先對圖片進行對齊的,如果使用的兩張圖片對齊的效果不佳,那么會出現(xiàn)將行人的頭與其腰腹部進行對比的現(xiàn)象,這反而會使得神經(jīng)網(wǎng)絡(luò)模型判斷錯誤。如圖1.2所示:圖1.2圖片切塊方法缺點
集擴充。隨著GAN神經(jīng)網(wǎng)絡(luò)的不斷發(fā)展,其已經(jīng)不再只能生成隨機圖片,CycleGAN[23]、DualGAN[24]和DiscoGAN[25]可以進行對輸入圖片的轉(zhuǎn)換,以擴大數(shù)據(jù)集。文獻[26]首先使用GAN神經(jīng)網(wǎng)絡(luò)協(xié)助行人重識別的研究,其使用了GAN隨機生成行人圖片作為行人重識別神經(jīng)網(wǎng)絡(luò)訓練數(shù)據(jù)的增廣,間接的提高該文獻所使用的IDE網(wǎng)絡(luò)的性能。由于監(jiān)控攝像頭所處的光線、角度等可能有所不同,因此這些攝像頭拍攝的視頻風格之間可能存在偏差,Zhong等人提出使用CycleGAN從而實現(xiàn)不同相機風格之間的轉(zhuǎn)換,以減小它們之間的風格偏差[27],如圖1.3所示。此外,由于不同數(shù)據(jù)集的應用場景不同,因此它們之間的場景偏差也不可忽視,因此經(jīng)常出現(xiàn)在一個數(shù)據(jù)集上訓練好的高性能神經(jīng)網(wǎng)絡(luò),在其它數(shù)據(jù)集上出現(xiàn)性能降低的情況。為了解決這個問題,文獻[28]基于CycleGAN提出了更適合行人重識別的personGAN。圖1.3相機風格轉(zhuǎn)換1.3本文研究內(nèi)容目前的行人重識別研究基于Market1501[29]、CUHK03[30]、DukeMTMC[31]等行人重識別公開數(shù)據(jù)集,在這些數(shù)據(jù)集中,行人圖像都是已經(jīng)裁剪好的。而且用于這些數(shù)據(jù)集的行人重識別方法已經(jīng)能獲得很高的準確度,但將它們應用于整個端到端的行人重識別系
【參考文獻】:
期刊論文
[1]基于深度學習的行人重識別研究進展[J]. 羅浩,姜偉,范星,張思朋. 自動化學報. 2019(11)
[2]國家九部委:出臺《關(guān)于加強公共安全視頻監(jiān)控建設(shè)聯(lián)網(wǎng)應用工作的若干意見》[J]. 中國信息安全. 2015(06)
[3]淺析平安城市視頻監(jiān)控大聯(lián)網(wǎng)的發(fā)展[J]. 魏一. 中國安防. 2013(03)
[4]廣州城市居民消費行為與生活質(zhì)量研究[J]. 廣州市城調(diào)隊課題組,余家榮. 廣東經(jīng)濟. 2006(12)
博士論文
[1]基于度量學習的行人重識別方法研究[D]. 王金.華中科技大學 2017
碩士論文
[1]融合局部特征的行人重識別神經(jīng)網(wǎng)絡(luò)模型[D]. 李天霖.西安電子科技大學 2019
[2]基于深度學習的行人重識別技術(shù)研究[D]. 李強.西安電子科技大學 2019
[3]基于目標輔助信息的行人重識別方法[D]. 陳普.西安電子科技大學 2019
[4]基于深度學習的行人重識別方法研究[D]. 吳江.電子科技大學 2019
[5]基于語義一致性的多視角行人再識別研究[D]. 毛超杰.浙江大學 2018
本文編號:3302612
本文鏈接:http://sikaile.net/shoufeilunwen/xixikjs/3302612.html
最近更新
教材專著