基于深度注意力機制的多尺度紅外行人檢測
發(fā)布時間:2024-01-24 09:42
針對多尺度目標檢測問題,提出一種基于深度注意力機制的多尺度紅外行人檢測方法。首先,選取較為輕量級的Darknet53作為深度卷積特征提取的主干網(wǎng)絡(luò),設(shè)計四尺度的特征金字塔網(wǎng)絡(luò)負責目標的定位和分類,通過引入更低層高分辨率的特征圖來改善對小尺度行人目標的檢測性能。其次,利用注意力模塊替代特征金字塔網(wǎng)絡(luò)中傳統(tǒng)的上采樣模塊,生成基于卷積特征的局部顯著圖,可以有效抑制不相關(guān)區(qū)域的特征響應(yīng),突出圖像局部特性。最后,利用Caltech行人數(shù)據(jù)集和U-FOV紅外行人數(shù)據(jù)集進行兩次遷移訓練,以提高模型的泛化能力,豐富行人的樣本特征。實驗結(jié)果表明,所提方法在U-FOV數(shù)據(jù)集上的識別平均準確率達到了93.45%,比YOLOv3高26.74個百分點,能檢測到的最小行人像素為6×13。在LTIR數(shù)據(jù)集上的定性實驗結(jié)果驗證,所提模型具有良好的泛化能力,適用于多尺度紅外行人的檢測。
【文章頁數(shù)】:12 頁
本文編號:3883587
【文章頁數(shù)】:12 頁
圖1U-FOV紅外圖像行人特性。
圖2基于Darknet53的多尺度紅外行人檢測網(wǎng)絡(luò)結(jié)構(gòu)
圖3注意力模塊結(jié)構(gòu)
圖4殘差模塊
本文編號:3883587
本文鏈接:http://sikaile.net/kejilunwen/dianzigongchenglunwen/3883587.html
最近更新
教材專著