基于注意力機(jī)制的在線自適應(yīng)孿生網(wǎng)絡(luò)跟蹤算法
發(fā)布時(shí)間:2021-03-03 05:46
針對全卷積孿生(SiamFC)網(wǎng)絡(luò)算法在相似目標(biāo)共存和目標(biāo)外觀發(fā)生顯著變化時(shí)跟蹤失敗的問題,提出一種基于注意力機(jī)制的在線自適應(yīng)孿生網(wǎng)絡(luò)跟蹤算法(AAM-Siam)來增強(qiáng)網(wǎng)絡(luò)模型的判別能力,實(shí)現(xiàn)在線學(xué)習(xí)目標(biāo)外觀變化并抑制背景。首先,分別在模板分支和搜索分支中加入前一幀跟蹤所得到的結(jié)果,彌補(bǔ)網(wǎng)絡(luò)在應(yīng)對目標(biāo)外觀變化的不足;然后通過在孿生網(wǎng)絡(luò)中加入空間注意力模塊和通道注意力模塊實(shí)現(xiàn)不同幀之間的特征融合,從而在線學(xué)習(xí)目標(biāo)形變并抑制背景,進(jìn)一步提升模型的特征表達(dá)能力;最后,在OTB和VOT2016跟蹤基準(zhǔn)庫上進(jìn)行實(shí)驗(yàn)。實(shí)驗(yàn)結(jié)果表明,本文算法在OTB50數(shù)據(jù)集上的精確度和平均成功率比基礎(chǔ)算法SiamFC分別高出了4.3個(gè)百分點(diǎn)和3.6個(gè)百分點(diǎn)。
【文章來源】:激光與光電子學(xué)進(jìn)展. 2020,57(02)北大核心
【文章頁數(shù)】:9 頁
【部分圖文】:
基于注意力機(jī)制的在線自適應(yīng)孿生網(wǎng)絡(luò)框架
經(jīng)過裁剪的第t-1幀
將各個(gè)位置的特征圖進(jìn)行元素項(xiàng)相加,得到空間注意力輸出的特征φspa,即對于通道注意模塊,特征圖的每個(gè)通道都可以視為一種特殊的特征檢測器[17],可通過建模通道之間的相互依賴性來自適應(yīng)地校準(zhǔn)通道方面的特征響應(yīng),同時(shí)為了能夠?qū)W習(xí)通道之間的非線性相互作用,選用Sigmoid函數(shù)作為非線性激活函數(shù)。如圖4所示,通道包含全局平均池化層(G-avg-pooling)和兩層全連接層(FC),其中ReLU為激活函數(shù)。為了匯總通道信息,保持深度網(wǎng)絡(luò)對目標(biāo)外觀變化的適應(yīng)能力,將空間注意模塊的輸出φspa∈Rw×h×d作為通道注意模塊的輸入,可以得到各個(gè)通道l的權(quán)重參數(shù)s=[s1,s2,…,sn],n為通道總數(shù)。權(quán)重參數(shù)與輸入特征圖元素項(xiàng)相乘得到注意力模塊的輸出特征φcha,即
【參考文獻(xiàn)】:
期刊論文
[1]基于高斯混合模型和卷積神經(jīng)網(wǎng)絡(luò)的視頻煙霧檢測[J]. 李鵬,張炎. 激光與光電子學(xué)進(jìn)展. 2019(21)
[2]基于卷積神經(jīng)網(wǎng)絡(luò)的足跟著地事件檢測算法[J]. 李卓容,王凱旋,何欣龍,糜忠良,唐云祁. 激光與光電子學(xué)進(jìn)展. 2019(21)
[3]重構(gòu)特征聯(lián)合的多域卷積神經(jīng)網(wǎng)絡(luò)跟蹤算法[J]. 楊大偉,鞏欣飛,毛琳,張汝波. 激光與光電子學(xué)進(jìn)展. 2019(19)
[4]基于卷積神經(jīng)網(wǎng)絡(luò)和RGB-D圖像的車輛檢測算法[J]. 王得成,陳向?qū)?趙峰,孫浩燃. 激光與光電子學(xué)進(jìn)展. 2019(18)
碩士論文
[1]基于深度學(xué)習(xí)的目標(biāo)跟蹤算法研究[D]. 李藍(lán)星.哈爾濱工業(yè)大學(xué) 2018
本文編號:3060729
【文章來源】:激光與光電子學(xué)進(jìn)展. 2020,57(02)北大核心
【文章頁數(shù)】:9 頁
【部分圖文】:
基于注意力機(jī)制的在線自適應(yīng)孿生網(wǎng)絡(luò)框架
經(jīng)過裁剪的第t-1幀
將各個(gè)位置的特征圖進(jìn)行元素項(xiàng)相加,得到空間注意力輸出的特征φspa,即對于通道注意模塊,特征圖的每個(gè)通道都可以視為一種特殊的特征檢測器[17],可通過建模通道之間的相互依賴性來自適應(yīng)地校準(zhǔn)通道方面的特征響應(yīng),同時(shí)為了能夠?qū)W習(xí)通道之間的非線性相互作用,選用Sigmoid函數(shù)作為非線性激活函數(shù)。如圖4所示,通道包含全局平均池化層(G-avg-pooling)和兩層全連接層(FC),其中ReLU為激活函數(shù)。為了匯總通道信息,保持深度網(wǎng)絡(luò)對目標(biāo)外觀變化的適應(yīng)能力,將空間注意模塊的輸出φspa∈Rw×h×d作為通道注意模塊的輸入,可以得到各個(gè)通道l的權(quán)重參數(shù)s=[s1,s2,…,sn],n為通道總數(shù)。權(quán)重參數(shù)與輸入特征圖元素項(xiàng)相乘得到注意力模塊的輸出特征φcha,即
【參考文獻(xiàn)】:
期刊論文
[1]基于高斯混合模型和卷積神經(jīng)網(wǎng)絡(luò)的視頻煙霧檢測[J]. 李鵬,張炎. 激光與光電子學(xué)進(jìn)展. 2019(21)
[2]基于卷積神經(jīng)網(wǎng)絡(luò)的足跟著地事件檢測算法[J]. 李卓容,王凱旋,何欣龍,糜忠良,唐云祁. 激光與光電子學(xué)進(jìn)展. 2019(21)
[3]重構(gòu)特征聯(lián)合的多域卷積神經(jīng)網(wǎng)絡(luò)跟蹤算法[J]. 楊大偉,鞏欣飛,毛琳,張汝波. 激光與光電子學(xué)進(jìn)展. 2019(19)
[4]基于卷積神經(jīng)網(wǎng)絡(luò)和RGB-D圖像的車輛檢測算法[J]. 王得成,陳向?qū)?趙峰,孫浩燃. 激光與光電子學(xué)進(jìn)展. 2019(18)
碩士論文
[1]基于深度學(xué)習(xí)的目標(biāo)跟蹤算法研究[D]. 李藍(lán)星.哈爾濱工業(yè)大學(xué) 2018
本文編號:3060729
本文鏈接:http://sikaile.net/kejilunwen/sousuoyinqinglunwen/3060729.html
最近更新
教材專著