基于細(xì)粒度特征獲取的行人再識(shí)別與目標(biāo)跟蹤研究
發(fā)布時(shí)間:2021-03-19 22:49
近兩年,5G時(shí)代的到來給人工智能行業(yè)帶來了前所未有的機(jī)遇與挑戰(zhàn)。行人再識(shí)別與目標(biāo)跟蹤作為計(jì)算機(jī)視覺中兩個(gè)重要的組成部分,其在智能安防中起到了不可或缺的地位與作用,近年來同樣得到了廣泛的研究并取得了可觀的研究成果。不幸的是目前的研究中,行人再識(shí)別方面,在光線較暗的情況下,識(shí)別效果會(huì)受到很大干擾。目標(biāo)跟蹤方面,大多數(shù)追蹤方法的目標(biāo)定位模塊并不理想且目標(biāo)運(yùn)動(dòng)速度過快時(shí),極易發(fā)生追蹤失敗。為了解決這些問題,本文分別提出了一種用于行人再識(shí)別跨模態(tài)問題的交叉模態(tài)多粒度特征融合網(wǎng)絡(luò),以及用于目標(biāo)跟蹤的細(xì)粒度動(dòng)態(tài)規(guī)劃單目標(biāo)跟蹤方法。論文的主要貢獻(xiàn)及工作內(nèi)容總結(jié)如下:1.本文在RGB-IR Re-ID這一領(lǐng)域進(jìn)行了跨模態(tài)條件下的行人再識(shí)別研究。為了解決跨模態(tài)后由于圖片模態(tài)不同導(dǎo)致的識(shí)別效果陡然下降的問題,本文提出了一個(gè)交叉模態(tài)多粒度特征融合網(wǎng)絡(luò),通過注意力機(jī)制輔助細(xì)粒度特征提取并將其與粗細(xì)粒度特征融合,促使網(wǎng)絡(luò)學(xué)習(xí)不同模態(tài)之間行人身上的具有判別性的共享特征,有效的提高了識(shí)別效果。2.在目標(biāo)跟蹤領(lǐng)域,為了更準(zhǔn)確地得到目標(biāo)候選框并解決目標(biāo)快速移動(dòng)時(shí)跳出候選框的問題,本文提出了一種基于細(xì)粒度網(wǎng)絡(luò)的動(dòng)態(tài)規(guī)劃追蹤...
【文章來源】:合肥工業(yè)大學(xué)安徽省 211工程院校 教育部直屬院校
【文章頁數(shù)】:66 頁
【學(xué)位級(jí)別】:碩士
【部分圖文】:
行人再識(shí)別與目標(biāo)跟蹤示意圖
合肥工業(yè)大學(xué)碩士研究生學(xué)位論文4圖1.2RGB-IR行人再識(shí)別示意圖Fig1.2SchematicdiagramoftheRGB-IRpersonRe-identificationRGB-IRRe-ID任務(wù)使用的是紅外攝像頭采集到的視頻數(shù)據(jù),可以看出IR圖像與RGB圖像有著巨大的差異,IR圖像相對(duì)于RGB圖像少了色彩信息,這對(duì)于目前RGB域的研究來說是一種嚴(yán)重的干擾。目前,一些研究想要使設(shè)計(jì)的網(wǎng)絡(luò)“適應(yīng)”這種顏色的轉(zhuǎn)變,那么GAN(生成對(duì)抗網(wǎng)絡(luò))方法是一種很好地選擇。使用GAN方法可以使網(wǎng)絡(luò)自主生成與IR圖片近似的偽IR圖像,豐富訓(xùn)練樣本,使得網(wǎng)絡(luò)在訓(xùn)練時(shí)更“習(xí)慣”于去學(xué)習(xí)一些與顏色無關(guān)的判別性信息,如輪廓信息,紋理信息等,從而提高訓(xùn)練出的模型的魯棒性,達(dá)到更好的判別效果。此外,由于GAN網(wǎng)絡(luò)可能帶來的網(wǎng)絡(luò)復(fù)雜性與訓(xùn)練難度的增加,一些研究將注意力集中于IR圖片所保留的細(xì)粒度特征之上。這些細(xì)粒度特征如衣服上的圖案、衣服類型往往具有顯著的判別性。因此,網(wǎng)絡(luò)能否更好的學(xué)習(xí)到這些細(xì)粒度特征成為了這些非GAN方式能否達(dá)到更好判別性的關(guān)鍵。1.4目標(biāo)跟蹤的研究現(xiàn)狀目標(biāo)跟蹤任務(wù)通常是指單目標(biāo)跟蹤,即第一幀給定一個(gè)矩形框,并將其稱之為邊界框(BoundingBox)。該邊界框通常是取自一個(gè)人工標(biāo)注的數(shù)據(jù)庫。選取邊界框之后,則需采用跟蹤算法在視頻的后續(xù)若干幀中鎖定目標(biāo)行人,該任務(wù)被定義為目標(biāo)跟蹤。目標(biāo)跟蹤由四個(gè)主要部分組成,分別是負(fù)責(zé)特征提取的部分、負(fù)責(zé)構(gòu)建運(yùn)動(dòng)模型的部分、負(fù)責(zé)構(gòu)建外觀模型的部分以及在線學(xué)習(xí)更新參數(shù)部分。目前實(shí)現(xiàn)目標(biāo)跟蹤的主要步驟大致可分為三步:首先,在當(dāng)前幀中選定一定大小的搜索區(qū)域;其次,通過目標(biāo)分類任務(wù)確定搜索區(qū)域中目標(biāo)的大致位置;最后,通過損失函數(shù)對(duì)目標(biāo)大致位置進(jìn)行回歸,得到目標(biāo)的精確位置。目標(biāo)跟蹤在深度學(xué)習(xí)算法中被劃分為
第一章緒論7圖1.3目標(biāo)跟蹤技術(shù)難點(diǎn)示意圖Fig1.3Schematicdiagramofthedifficultyoftargettrackingtechnology(4)尺度變化。如圖1.3(g)所示,尺度變化指的是目標(biāo)在運(yùn)動(dòng)過程中,由于地理位置由遠(yuǎn)及近或由近及遠(yuǎn)等變化造成的目標(biāo)大小變化。在這類問題中,預(yù)測(cè)目標(biāo)邊界框大小是非常具有挑戰(zhàn)性的任務(wù),其預(yù)測(cè)的好壞直接影響了追蹤效果。(5)高速運(yùn)動(dòng)。如圖1.3(c)所示,該類問題大多發(fā)生在高速移動(dòng)的動(dòng)態(tài)目標(biāo)上。這樣的目標(biāo)會(huì)造成目標(biāo)區(qū)域目標(biāo)模糊,跟蹤效果顯著下降。(6)光照改變。如圖1.3(b)所示,這類問題是目前現(xiàn)實(shí)場(chǎng)景下最容易發(fā)生的問題。在照明條件改變時(shí),可能存在短期的強(qiáng)曝光,這就導(dǎo)致目標(biāo)前景不完整、不準(zhǔn)確,最終導(dǎo)致目標(biāo)跟蹤失敗。圖a形變圖b光照改變圖c高速運(yùn)動(dòng)圖d背景干擾圖e平面外旋轉(zhuǎn)圖f平面內(nèi)旋轉(zhuǎn)圖g尺度變化圖h遮擋圖i出視野
【參考文獻(xiàn)】:
期刊論文
[1]區(qū)域塊分割與融合的行人再識(shí)別[J]. 蔣建國(guó),楊寧,齊美彬,陳翠群. 中國(guó)圖象圖形學(xué)報(bào). 2019(04)
[2]多特征融合與交替方向乘子法的行人再識(shí)別[J]. 齊美彬,王慈淳,蔣建國(guó),李佶. 中國(guó)圖象圖形學(xué)報(bào). 2018(06)
[3]基于雙向關(guān)系相似度函數(shù)學(xué)習(xí)的行人再識(shí)別[J]. 張娜,張福星,王強(qiáng),胡玲玲,桂江生. 計(jì)算機(jī)系統(tǒng)應(yīng)用. 2018(05)
本文編號(hào):3090365
【文章來源】:合肥工業(yè)大學(xué)安徽省 211工程院校 教育部直屬院校
【文章頁數(shù)】:66 頁
【學(xué)位級(jí)別】:碩士
【部分圖文】:
行人再識(shí)別與目標(biāo)跟蹤示意圖
合肥工業(yè)大學(xué)碩士研究生學(xué)位論文4圖1.2RGB-IR行人再識(shí)別示意圖Fig1.2SchematicdiagramoftheRGB-IRpersonRe-identificationRGB-IRRe-ID任務(wù)使用的是紅外攝像頭采集到的視頻數(shù)據(jù),可以看出IR圖像與RGB圖像有著巨大的差異,IR圖像相對(duì)于RGB圖像少了色彩信息,這對(duì)于目前RGB域的研究來說是一種嚴(yán)重的干擾。目前,一些研究想要使設(shè)計(jì)的網(wǎng)絡(luò)“適應(yīng)”這種顏色的轉(zhuǎn)變,那么GAN(生成對(duì)抗網(wǎng)絡(luò))方法是一種很好地選擇。使用GAN方法可以使網(wǎng)絡(luò)自主生成與IR圖片近似的偽IR圖像,豐富訓(xùn)練樣本,使得網(wǎng)絡(luò)在訓(xùn)練時(shí)更“習(xí)慣”于去學(xué)習(xí)一些與顏色無關(guān)的判別性信息,如輪廓信息,紋理信息等,從而提高訓(xùn)練出的模型的魯棒性,達(dá)到更好的判別效果。此外,由于GAN網(wǎng)絡(luò)可能帶來的網(wǎng)絡(luò)復(fù)雜性與訓(xùn)練難度的增加,一些研究將注意力集中于IR圖片所保留的細(xì)粒度特征之上。這些細(xì)粒度特征如衣服上的圖案、衣服類型往往具有顯著的判別性。因此,網(wǎng)絡(luò)能否更好的學(xué)習(xí)到這些細(xì)粒度特征成為了這些非GAN方式能否達(dá)到更好判別性的關(guān)鍵。1.4目標(biāo)跟蹤的研究現(xiàn)狀目標(biāo)跟蹤任務(wù)通常是指單目標(biāo)跟蹤,即第一幀給定一個(gè)矩形框,并將其稱之為邊界框(BoundingBox)。該邊界框通常是取自一個(gè)人工標(biāo)注的數(shù)據(jù)庫。選取邊界框之后,則需采用跟蹤算法在視頻的后續(xù)若干幀中鎖定目標(biāo)行人,該任務(wù)被定義為目標(biāo)跟蹤。目標(biāo)跟蹤由四個(gè)主要部分組成,分別是負(fù)責(zé)特征提取的部分、負(fù)責(zé)構(gòu)建運(yùn)動(dòng)模型的部分、負(fù)責(zé)構(gòu)建外觀模型的部分以及在線學(xué)習(xí)更新參數(shù)部分。目前實(shí)現(xiàn)目標(biāo)跟蹤的主要步驟大致可分為三步:首先,在當(dāng)前幀中選定一定大小的搜索區(qū)域;其次,通過目標(biāo)分類任務(wù)確定搜索區(qū)域中目標(biāo)的大致位置;最后,通過損失函數(shù)對(duì)目標(biāo)大致位置進(jìn)行回歸,得到目標(biāo)的精確位置。目標(biāo)跟蹤在深度學(xué)習(xí)算法中被劃分為
第一章緒論7圖1.3目標(biāo)跟蹤技術(shù)難點(diǎn)示意圖Fig1.3Schematicdiagramofthedifficultyoftargettrackingtechnology(4)尺度變化。如圖1.3(g)所示,尺度變化指的是目標(biāo)在運(yùn)動(dòng)過程中,由于地理位置由遠(yuǎn)及近或由近及遠(yuǎn)等變化造成的目標(biāo)大小變化。在這類問題中,預(yù)測(cè)目標(biāo)邊界框大小是非常具有挑戰(zhàn)性的任務(wù),其預(yù)測(cè)的好壞直接影響了追蹤效果。(5)高速運(yùn)動(dòng)。如圖1.3(c)所示,該類問題大多發(fā)生在高速移動(dòng)的動(dòng)態(tài)目標(biāo)上。這樣的目標(biāo)會(huì)造成目標(biāo)區(qū)域目標(biāo)模糊,跟蹤效果顯著下降。(6)光照改變。如圖1.3(b)所示,這類問題是目前現(xiàn)實(shí)場(chǎng)景下最容易發(fā)生的問題。在照明條件改變時(shí),可能存在短期的強(qiáng)曝光,這就導(dǎo)致目標(biāo)前景不完整、不準(zhǔn)確,最終導(dǎo)致目標(biāo)跟蹤失敗。圖a形變圖b光照改變圖c高速運(yùn)動(dòng)圖d背景干擾圖e平面外旋轉(zhuǎn)圖f平面內(nèi)旋轉(zhuǎn)圖g尺度變化圖h遮擋圖i出視野
【參考文獻(xiàn)】:
期刊論文
[1]區(qū)域塊分割與融合的行人再識(shí)別[J]. 蔣建國(guó),楊寧,齊美彬,陳翠群. 中國(guó)圖象圖形學(xué)報(bào). 2019(04)
[2]多特征融合與交替方向乘子法的行人再識(shí)別[J]. 齊美彬,王慈淳,蔣建國(guó),李佶. 中國(guó)圖象圖形學(xué)報(bào). 2018(06)
[3]基于雙向關(guān)系相似度函數(shù)學(xué)習(xí)的行人再識(shí)別[J]. 張娜,張福星,王強(qiáng),胡玲玲,桂江生. 計(jì)算機(jī)系統(tǒng)應(yīng)用. 2018(05)
本文編號(hào):3090365
本文鏈接:http://sikaile.net/kejilunwen/shengwushengchang/3090365.html
最近更新
教材專著