基于膨脹卷積和視覺注意的目標檢測及應(yīng)用
發(fā)布時間:2021-12-29 10:02
作為場景理解的重要組成部分,目標檢測技術(shù)在智能安防、工業(yè)制造和軍事探測等領(lǐng)域有著廣泛的應(yīng)用。近年來,隨著計算機算力的提升和神經(jīng)網(wǎng)絡(luò)的應(yīng)用,多種算法被相繼提出,這極大地促進了目標檢測技術(shù)的發(fā)展。然而,實際應(yīng)用場景復(fù)雜多變,目標或小而稠密,或尺度變化大,或相互高度遮擋。這些因素會對檢測性能產(chǎn)生影響,最終導(dǎo)致錯檢和漏檢的現(xiàn)象。針對上述問題,本文使用YOLOv3網(wǎng)絡(luò)作為主要檢測框架,結(jié)合膨脹卷積和視覺注意機制,提出改進方案。主要工作如下:(1)針對目標尺度變化大導(dǎo)致檢測性能降低的問題,提出基于膨脹卷積和特征圖融合的YOLOv3網(wǎng)絡(luò)。首先,利用膨脹卷積在不同擴張率下呈現(xiàn)不同感受野的特點,構(gòu)建并行多分支膨脹卷積模塊,改進骨干網(wǎng)絡(luò)Darknet53,使得提取的特征包含更豐富的信息。其次,通過對網(wǎng)絡(luò)輸出特征進行上采樣和張量拼接,增加淺層特征圖數(shù)量,用于提升小目標檢測精度。最后,在數(shù)據(jù)集COCO上進行對比實驗。結(jié)果表明,改進后的網(wǎng)絡(luò)能夠有效改善檢測效果,各類目標檢測精度明顯提高。(2)針對特征圖中特征不平衡影響檢測效果的問題,提出基于視覺注意的特征平衡YOLOv3網(wǎng)絡(luò)。首先,通過上采樣和下采樣整合特征金...
【文章來源】:南京郵電大學(xué)江蘇省
【文章頁數(shù)】:79 頁
【學(xué)位級別】:碩士
【部分圖文】:
目標檢測發(fā)展過程
LeNet網(wǎng)絡(luò)結(jié)構(gòu)示意圖
卷積操作過程可視化
【參考文獻】:
期刊論文
[1]卷積神經(jīng)網(wǎng)絡(luò)的發(fā)展及其在計算機視覺領(lǐng)域中的應(yīng)用綜述[J]. 陳超,齊峰. 計算機科學(xué). 2019(03)
[2]基于難分樣本挖掘的快速區(qū)域卷積神經(jīng)網(wǎng)絡(luò)目標檢測研究[J]. 張燁,許艇,馮定忠,蔣美仙,吳光華. 電子與信息學(xué)報. 2019(06)
[3]Multi-scale object detection by top-down and bottom-up feature pyramid network[J]. ZHAO Baojun,ZHAO Boya,TANG Linbo,WANG Wenzheng,WU Chen. Journal of Systems Engineering and Electronics. 2019(01)
[4]2018年中國安防市場藍皮書[J]. 丁兆威. 中國公共安全. 2018(12)
[5]基于深度學(xué)習(xí)的醫(yī)學(xué)影像診斷綜述[J]. 張巧麗,趙地,遲學(xué)斌. 計算機科學(xué). 2017(S2)
[6]基于視覺的目標檢測與跟蹤綜述[J]. 尹宏鵬,陳波,柴毅,劉兆棟. 自動化學(xué)報. 2016(10)
[7]人體動作行為識別研究綜述[J]. 李瑞峰,王亮亮,王珂. 模式識別與人工智能. 2014(01)
[8]機器視覺技術(shù)在工件分揀中的應(yīng)用[J]. 劉振宇,趙彬,鄒風(fēng)山. 計算機應(yīng)用與軟件. 2012(11)
[9]基于頭部檢測和跟蹤的人數(shù)統(tǒng)計方法[J]. 鄭翔翔,張怡. 計算機應(yīng)用與軟件. 2011(02)
本文編號:3555905
【文章來源】:南京郵電大學(xué)江蘇省
【文章頁數(shù)】:79 頁
【學(xué)位級別】:碩士
【部分圖文】:
目標檢測發(fā)展過程
LeNet網(wǎng)絡(luò)結(jié)構(gòu)示意圖
卷積操作過程可視化
【參考文獻】:
期刊論文
[1]卷積神經(jīng)網(wǎng)絡(luò)的發(fā)展及其在計算機視覺領(lǐng)域中的應(yīng)用綜述[J]. 陳超,齊峰. 計算機科學(xué). 2019(03)
[2]基于難分樣本挖掘的快速區(qū)域卷積神經(jīng)網(wǎng)絡(luò)目標檢測研究[J]. 張燁,許艇,馮定忠,蔣美仙,吳光華. 電子與信息學(xué)報. 2019(06)
[3]Multi-scale object detection by top-down and bottom-up feature pyramid network[J]. ZHAO Baojun,ZHAO Boya,TANG Linbo,WANG Wenzheng,WU Chen. Journal of Systems Engineering and Electronics. 2019(01)
[4]2018年中國安防市場藍皮書[J]. 丁兆威. 中國公共安全. 2018(12)
[5]基于深度學(xué)習(xí)的醫(yī)學(xué)影像診斷綜述[J]. 張巧麗,趙地,遲學(xué)斌. 計算機科學(xué). 2017(S2)
[6]基于視覺的目標檢測與跟蹤綜述[J]. 尹宏鵬,陳波,柴毅,劉兆棟. 自動化學(xué)報. 2016(10)
[7]人體動作行為識別研究綜述[J]. 李瑞峰,王亮亮,王珂. 模式識別與人工智能. 2014(01)
[8]機器視覺技術(shù)在工件分揀中的應(yīng)用[J]. 劉振宇,趙彬,鄒風(fēng)山. 計算機應(yīng)用與軟件. 2012(11)
[9]基于頭部檢測和跟蹤的人數(shù)統(tǒng)計方法[J]. 鄭翔翔,張怡. 計算機應(yīng)用與軟件. 2011(02)
本文編號:3555905
本文鏈接:http://sikaile.net/kejilunwen/shengwushengchang/3555905.html
最近更新
教材專著