一種基于視頻預(yù)測(cè)的紅外行人目標(biāo)跟蹤方法
發(fā)布時(shí)間:2022-01-14 20:47
紅外視頻與普通彩色視頻相比易受周?chē)h(huán)境的影響,在紅外行人跟蹤中行人目標(biāo)外觀輪廓和灰度分布常有較大幅度變化,導(dǎo)致跟蹤困難.為解決此問(wèn)題,本文提出了一種VPSiamRPN(Video Prediction with Siamese Region Proposal Network)紅外行人目標(biāo)跟蹤系統(tǒng).在SiamRPN(Siamese Region Proposal Network)網(wǎng)絡(luò)的基礎(chǔ)上,針對(duì)目標(biāo)形變、目標(biāo)遮擋和背景雜波等嚴(yán)重影響紅外跟蹤效果的因素進(jìn)行研究,設(shè)計(jì)將PredNet (Deep Predictive Coding Networks for Video Prediction and Unsupervised)網(wǎng)絡(luò)的圖像預(yù)測(cè)功能結(jié)合應(yīng)用到SiamRPN網(wǎng)絡(luò)上,以提高跟蹤模板與被檢測(cè)目標(biāo)的相似度,增強(qiáng)目標(biāo)跟蹤中的模型匹配能力,從而提高對(duì)紅外行人目標(biāo)的跟蹤能力.通過(guò)改變網(wǎng)絡(luò)層數(shù)、預(yù)測(cè)所用的目標(biāo)圖像及圖像幀數(shù)、網(wǎng)絡(luò)的跟蹤策略,對(duì)網(wǎng)絡(luò)進(jìn)行優(yōu)化,設(shè)計(jì)了9組對(duì)比試驗(yàn),在PTB-TIR數(shù)據(jù)集上,與SiamRPN網(wǎng)絡(luò)客觀定量對(duì)比,通過(guò)跟蹤的成功率和重疊率在10種屬性上對(duì)網(wǎng)絡(luò)進(jìn)行評(píng)估.實(shí)驗(yàn)結(jié)果...
【文章來(lái)源】:哈爾濱工業(yè)大學(xué)學(xué)報(bào). 2020,52(10)北大核心EICSCD
【文章頁(yè)數(shù)】:9 頁(yè)
【部分圖文】:
SiamRPN網(wǎng)絡(luò)結(jié)構(gòu)[9]
4):預(yù)測(cè)層,對(duì)R單元卷積+Relu得到.圖2為PredNet網(wǎng)絡(luò)結(jié)構(gòu),激活函數(shù)采用Relu,Al與 A ^ l 之差小于零的部分置零,通過(guò)Al與相互作差,拼接,再輸入Relu層.El傳給Al+1,作為下一層的輸入.R l t 單元接受的輸入是前一刻本層誤差E l t ,本層狀態(tài)R l t-1 ,本時(shí)刻高層預(yù)測(cè)特征R l+1 t ,根據(jù)這三者進(jìn)行特征級(jí)的預(yù)測(cè).預(yù)測(cè)的特征在 A ^ l 單元卷積,得到特征圖像,與Al相比較.總體loss是各層、各時(shí)刻預(yù)測(cè)誤差的加權(quán)和.各層誤差權(quán)重λl,各時(shí)刻誤差權(quán)重λt由實(shí)驗(yàn)確定.網(wǎng)絡(luò)狀態(tài)更新存在水平(時(shí)間)方向和豎直(各層)方向兩方向的更新.豎直方向先更新,先自下而上前向傳播計(jì)算得各層誤差El,再自上而下計(jì)算RNN單元的狀態(tài)Rl.t時(shí)刻網(wǎng)絡(luò)更新好后,進(jìn)行t+1時(shí)刻的更新.因此對(duì)于各t的網(wǎng)絡(luò),輸入是前一刻RNN狀態(tài)Rt-1和本時(shí)刻目標(biāo)輸出圖像A0.
預(yù)測(cè)的網(wǎng)絡(luò)跟蹤過(guò)程為:PredNet網(wǎng)絡(luò)通過(guò)存儲(chǔ)在序列X中的8幀圖像預(yù)測(cè)出當(dāng)前幀的目標(biāo)圖像,輸出的圖像經(jīng)重塑后大小為127×127×3作為模版幀.模板幀和被檢測(cè)幀經(jīng)過(guò)相同的卷積結(jié)構(gòu)分別得到6×6×256,22×22×256的特征,模版幀所產(chǎn)生的特征通過(guò)3×3的卷積核分別產(chǎn)生了4×4×(2k×256)和4×4×(4k×256)的特征,k值為RPN網(wǎng)絡(luò)所需的矩形框數(shù).通過(guò)得到的兩組特征輸入RPN網(wǎng)絡(luò)得到目標(biāo)位置信息.根據(jù)目標(biāo)位置信息對(duì)被檢測(cè)幀進(jìn)行裁剪,將裁剪后得到的目標(biāo)圖像重塑為128×128×3存入序列X中替換掉第1幀并將序列X按圖像存入的順序重新排序.圖4 VPSiamRPN網(wǎng)絡(luò)結(jié)構(gòu)
【參考文獻(xiàn)】:
期刊論文
[1]目標(biāo)跟蹤算法綜述[J]. 孟琭,楊旭. 自動(dòng)化學(xué)報(bào). 2019(07)
[2]紅外圖像中的行人檢測(cè)[J]. 郭永彩,胡瑞光,高潮. 重慶大學(xué)學(xué)報(bào). 2009(09)
[3]影響紅外熱像儀測(cè)量精度的因素分析[J]. 高小明. 華電技術(shù). 2008(11)
本文編號(hào):3589188
【文章來(lái)源】:哈爾濱工業(yè)大學(xué)學(xué)報(bào). 2020,52(10)北大核心EICSCD
【文章頁(yè)數(shù)】:9 頁(yè)
【部分圖文】:
SiamRPN網(wǎng)絡(luò)結(jié)構(gòu)[9]
4):預(yù)測(cè)層,對(duì)R單元卷積+Relu得到.圖2為PredNet網(wǎng)絡(luò)結(jié)構(gòu),激活函數(shù)采用Relu,Al與 A ^ l 之差小于零的部分置零,通過(guò)Al與相互作差,拼接,再輸入Relu層.El傳給Al+1,作為下一層的輸入.R l t 單元接受的輸入是前一刻本層誤差E l t ,本層狀態(tài)R l t-1 ,本時(shí)刻高層預(yù)測(cè)特征R l+1 t ,根據(jù)這三者進(jìn)行特征級(jí)的預(yù)測(cè).預(yù)測(cè)的特征在 A ^ l 單元卷積,得到特征圖像,與Al相比較.總體loss是各層、各時(shí)刻預(yù)測(cè)誤差的加權(quán)和.各層誤差權(quán)重λl,各時(shí)刻誤差權(quán)重λt由實(shí)驗(yàn)確定.網(wǎng)絡(luò)狀態(tài)更新存在水平(時(shí)間)方向和豎直(各層)方向兩方向的更新.豎直方向先更新,先自下而上前向傳播計(jì)算得各層誤差El,再自上而下計(jì)算RNN單元的狀態(tài)Rl.t時(shí)刻網(wǎng)絡(luò)更新好后,進(jìn)行t+1時(shí)刻的更新.因此對(duì)于各t的網(wǎng)絡(luò),輸入是前一刻RNN狀態(tài)Rt-1和本時(shí)刻目標(biāo)輸出圖像A0.
預(yù)測(cè)的網(wǎng)絡(luò)跟蹤過(guò)程為:PredNet網(wǎng)絡(luò)通過(guò)存儲(chǔ)在序列X中的8幀圖像預(yù)測(cè)出當(dāng)前幀的目標(biāo)圖像,輸出的圖像經(jīng)重塑后大小為127×127×3作為模版幀.模板幀和被檢測(cè)幀經(jīng)過(guò)相同的卷積結(jié)構(gòu)分別得到6×6×256,22×22×256的特征,模版幀所產(chǎn)生的特征通過(guò)3×3的卷積核分別產(chǎn)生了4×4×(2k×256)和4×4×(4k×256)的特征,k值為RPN網(wǎng)絡(luò)所需的矩形框數(shù).通過(guò)得到的兩組特征輸入RPN網(wǎng)絡(luò)得到目標(biāo)位置信息.根據(jù)目標(biāo)位置信息對(duì)被檢測(cè)幀進(jìn)行裁剪,將裁剪后得到的目標(biāo)圖像重塑為128×128×3存入序列X中替換掉第1幀并將序列X按圖像存入的順序重新排序.圖4 VPSiamRPN網(wǎng)絡(luò)結(jié)構(gòu)
【參考文獻(xiàn)】:
期刊論文
[1]目標(biāo)跟蹤算法綜述[J]. 孟琭,楊旭. 自動(dòng)化學(xué)報(bào). 2019(07)
[2]紅外圖像中的行人檢測(cè)[J]. 郭永彩,胡瑞光,高潮. 重慶大學(xué)學(xué)報(bào). 2009(09)
[3]影響紅外熱像儀測(cè)量精度的因素分析[J]. 高小明. 華電技術(shù). 2008(11)
本文編號(hào):3589188
本文鏈接:http://sikaile.net/kejilunwen/dianzigongchenglunwen/3589188.html
最近更新
教材專(zhuān)著