基于深度學(xué)習(xí)的監(jiān)控場景目標(biāo)檢測算法研究與應(yīng)用
發(fā)布時間:2021-04-18 00:03
監(jiān)控場景下的目標(biāo)檢測是當(dāng)前研究的熱點,主要目的是檢測識別出監(jiān)控場景圖像中的特定類別物體。深度學(xué)習(xí)憑借其優(yōu)越的性能,廣泛應(yīng)用在圖像處理、模式識別等多個領(lǐng)域;谏疃葘W(xué)習(xí)的目標(biāo)檢測與識別經(jīng)過多年的研究,目前發(fā)展了Faster R-CNN、YOLO、SSD等多種框架算法及其改進算法,在性能實時性上均優(yōu)于傳統(tǒng)算法,但檢測精度和速度仍有較大提升空間。本文針對監(jiān)控場景圖像存在運動模糊、密集遮擋、目標(biāo)尺寸不一等特點,提出改進算法提升當(dāng)前目標(biāo)檢測算法精度和速度,再整合成一個完整的檢測框架,訓(xùn)練得到最優(yōu)模型,并應(yīng)用在監(jiān)控系統(tǒng)中。本文的主要工作內(nèi)容和創(chuàng)新點有:(1)提出了目標(biāo)檢測精度提升算法,解決多尺寸目標(biāo)檢測、遮擋、運動模糊及訓(xùn)練中正負樣本失衡問題。主要從感受野大小的設(shè)定、多尺度分級訓(xùn)練、改進定位損失函數(shù)及分類損失函數(shù)等方面改進,通過測試模型性能驗證改進算法效果。(2)提出了目標(biāo)檢測速度提升算法,解決檢測神經(jīng)網(wǎng)絡(luò)推斷過程速度慢,達不到實時檢測的問題。主要從輕量化骨干網(wǎng)絡(luò)、神經(jīng)網(wǎng)絡(luò)幀差法、圖像灰度化及合并批量歸一化層等方面進行改進,并通過統(tǒng)計模型計算量及在設(shè)備中測試驗證改進算法的性能。(3)提出了基于目標(biāo)...
【文章來源】:浙江大學(xué)浙江省 211工程院校 985工程院校 教育部直屬院校
【文章頁數(shù)】:75 頁
【學(xué)位級別】:碩士
【部分圖文】:
近年來目標(biāo)檢測相關(guān)論文數(shù)
浙江大學(xué)碩士學(xué)位論文第2章目標(biāo)檢測精度提升算法-8-息可以在不同層出現(xiàn)。淺層特征圖包含更多小尺寸物體的細節(jié)信息,隨著層數(shù)加深,因感受野過大,所提取特征中的幾何細節(jié)信息可能完全消失,通過深層特征檢測小物體就變得很困難。對于大物體而言,它語義信息將出現(xiàn)在較深層特征中。圖像中不同的目標(biāo)尺寸差別很大,部分目標(biāo)尺寸很大,部分目標(biāo)尺寸很小,都容易產(chǎn)生漏檢誤檢情況,當(dāng)前對多尺度目標(biāo)檢測的處理方式有:(1)多尺度圖像預(yù)測:將圖片縮放到不同尺寸得到圖像金字塔結(jié)構(gòu)[31],然后對金字塔中的每層圖片分別提取特征,得到不同尺度的特征圖,如圖2-1所示。圖2-1圖像金字塔示意圖(2)特征金字塔預(yù)測:將圖片輸入網(wǎng)絡(luò)中,在不同卷積層上提取特征得到尺度不同的特征圖,再對不同尺度特征進行融合,以實現(xiàn)多尺度特征檢測[32]。例如FPN結(jié)構(gòu)[33],將高低不同層的特征進行融合,每層單獨進行預(yù)測。不同分辨率特征融合的方式,既每個分辨率的特征圖和上采樣的低分辨率特征相加,使得不同層次的特征增強,如圖2-2所示。由于特征金字塔只在特征層上融合連接,增加的計算量較少,同時能顯著改進檢測性能。圖2-2特征金字塔示意圖這兩種方法雖然能有效解決目標(biāo)檢測的多尺度問題,但都存在缺陷;诙喑叨葓D像金字塔的預(yù)測因不同尺度的圖像要分別經(jīng)過網(wǎng)絡(luò)提取特征,推斷時間上倍增,非常耗時;特征金字塔預(yù)測,不同尺寸的特征融合過程會造成一定的語義信息的損失,且網(wǎng)絡(luò)結(jié)合不同層語義信息,相對而言每層均有檢測分
浙江大學(xué)碩士學(xué)位論文第2章目標(biāo)檢測精度提升算法-8-息可以在不同層出現(xiàn)。淺層特征圖包含更多小尺寸物體的細節(jié)信息,隨著層數(shù)加深,因感受野過大,所提取特征中的幾何細節(jié)信息可能完全消失,通過深層特征檢測小物體就變得很困難。對于大物體而言,它語義信息將出現(xiàn)在較深層特征中。圖像中不同的目標(biāo)尺寸差別很大,部分目標(biāo)尺寸很大,部分目標(biāo)尺寸很小,都容易產(chǎn)生漏檢誤檢情況,當(dāng)前對多尺度目標(biāo)檢測的處理方式有:(1)多尺度圖像預(yù)測:將圖片縮放到不同尺寸得到圖像金字塔結(jié)構(gòu)[31],然后對金字塔中的每層圖片分別提取特征,得到不同尺度的特征圖,如圖2-1所示。圖2-1圖像金字塔示意圖(2)特征金字塔預(yù)測:將圖片輸入網(wǎng)絡(luò)中,在不同卷積層上提取特征得到尺度不同的特征圖,再對不同尺度特征進行融合,以實現(xiàn)多尺度特征檢測[32]。例如FPN結(jié)構(gòu)[33],將高低不同層的特征進行融合,每層單獨進行預(yù)測。不同分辨率特征融合的方式,既每個分辨率的特征圖和上采樣的低分辨率特征相加,使得不同層次的特征增強,如圖2-2所示。由于特征金字塔只在特征層上融合連接,增加的計算量較少,同時能顯著改進檢測性能。圖2-2特征金字塔示意圖這兩種方法雖然能有效解決目標(biāo)檢測的多尺度問題,但都存在缺陷;诙喑叨葓D像金字塔的預(yù)測因不同尺度的圖像要分別經(jīng)過網(wǎng)絡(luò)提取特征,推斷時間上倍增,非常耗時;特征金字塔預(yù)測,不同尺寸的特征融合過程會造成一定的語義信息的損失,且網(wǎng)絡(luò)結(jié)合不同層語義信息,相對而言每層均有檢測分
【參考文獻】:
期刊論文
[1]Dropout Rademacher complexity of deep neural networks[J]. Wei GAO,Zhi-Hua ZHOU. Science China(Information Sciences). 2016(07)
[2]基于計算與通信重疊的稀疏矩陣-向量乘積及其在AMG中的應(yīng)用[J]. 趙蓮,趙永華,遲學(xué)斌. 數(shù)值計算與計算機應(yīng)用. 2015(03)
本文編號:3144393
【文章來源】:浙江大學(xué)浙江省 211工程院校 985工程院校 教育部直屬院校
【文章頁數(shù)】:75 頁
【學(xué)位級別】:碩士
【部分圖文】:
近年來目標(biāo)檢測相關(guān)論文數(shù)
浙江大學(xué)碩士學(xué)位論文第2章目標(biāo)檢測精度提升算法-8-息可以在不同層出現(xiàn)。淺層特征圖包含更多小尺寸物體的細節(jié)信息,隨著層數(shù)加深,因感受野過大,所提取特征中的幾何細節(jié)信息可能完全消失,通過深層特征檢測小物體就變得很困難。對于大物體而言,它語義信息將出現(xiàn)在較深層特征中。圖像中不同的目標(biāo)尺寸差別很大,部分目標(biāo)尺寸很大,部分目標(biāo)尺寸很小,都容易產(chǎn)生漏檢誤檢情況,當(dāng)前對多尺度目標(biāo)檢測的處理方式有:(1)多尺度圖像預(yù)測:將圖片縮放到不同尺寸得到圖像金字塔結(jié)構(gòu)[31],然后對金字塔中的每層圖片分別提取特征,得到不同尺度的特征圖,如圖2-1所示。圖2-1圖像金字塔示意圖(2)特征金字塔預(yù)測:將圖片輸入網(wǎng)絡(luò)中,在不同卷積層上提取特征得到尺度不同的特征圖,再對不同尺度特征進行融合,以實現(xiàn)多尺度特征檢測[32]。例如FPN結(jié)構(gòu)[33],將高低不同層的特征進行融合,每層單獨進行預(yù)測。不同分辨率特征融合的方式,既每個分辨率的特征圖和上采樣的低分辨率特征相加,使得不同層次的特征增強,如圖2-2所示。由于特征金字塔只在特征層上融合連接,增加的計算量較少,同時能顯著改進檢測性能。圖2-2特征金字塔示意圖這兩種方法雖然能有效解決目標(biāo)檢測的多尺度問題,但都存在缺陷;诙喑叨葓D像金字塔的預(yù)測因不同尺度的圖像要分別經(jīng)過網(wǎng)絡(luò)提取特征,推斷時間上倍增,非常耗時;特征金字塔預(yù)測,不同尺寸的特征融合過程會造成一定的語義信息的損失,且網(wǎng)絡(luò)結(jié)合不同層語義信息,相對而言每層均有檢測分
浙江大學(xué)碩士學(xué)位論文第2章目標(biāo)檢測精度提升算法-8-息可以在不同層出現(xiàn)。淺層特征圖包含更多小尺寸物體的細節(jié)信息,隨著層數(shù)加深,因感受野過大,所提取特征中的幾何細節(jié)信息可能完全消失,通過深層特征檢測小物體就變得很困難。對于大物體而言,它語義信息將出現(xiàn)在較深層特征中。圖像中不同的目標(biāo)尺寸差別很大,部分目標(biāo)尺寸很大,部分目標(biāo)尺寸很小,都容易產(chǎn)生漏檢誤檢情況,當(dāng)前對多尺度目標(biāo)檢測的處理方式有:(1)多尺度圖像預(yù)測:將圖片縮放到不同尺寸得到圖像金字塔結(jié)構(gòu)[31],然后對金字塔中的每層圖片分別提取特征,得到不同尺度的特征圖,如圖2-1所示。圖2-1圖像金字塔示意圖(2)特征金字塔預(yù)測:將圖片輸入網(wǎng)絡(luò)中,在不同卷積層上提取特征得到尺度不同的特征圖,再對不同尺度特征進行融合,以實現(xiàn)多尺度特征檢測[32]。例如FPN結(jié)構(gòu)[33],將高低不同層的特征進行融合,每層單獨進行預(yù)測。不同分辨率特征融合的方式,既每個分辨率的特征圖和上采樣的低分辨率特征相加,使得不同層次的特征增強,如圖2-2所示。由于特征金字塔只在特征層上融合連接,增加的計算量較少,同時能顯著改進檢測性能。圖2-2特征金字塔示意圖這兩種方法雖然能有效解決目標(biāo)檢測的多尺度問題,但都存在缺陷;诙喑叨葓D像金字塔的預(yù)測因不同尺度的圖像要分別經(jīng)過網(wǎng)絡(luò)提取特征,推斷時間上倍增,非常耗時;特征金字塔預(yù)測,不同尺寸的特征融合過程會造成一定的語義信息的損失,且網(wǎng)絡(luò)結(jié)合不同層語義信息,相對而言每層均有檢測分
【參考文獻】:
期刊論文
[1]Dropout Rademacher complexity of deep neural networks[J]. Wei GAO,Zhi-Hua ZHOU. Science China(Information Sciences). 2016(07)
[2]基于計算與通信重疊的稀疏矩陣-向量乘積及其在AMG中的應(yīng)用[J]. 趙蓮,趙永華,遲學(xué)斌. 數(shù)值計算與計算機應(yīng)用. 2015(03)
本文編號:3144393
本文鏈接:http://sikaile.net/kejilunwen/shengwushengchang/3144393.html
最近更新
教材專著