基于深度學(xué)習(xí)的快速目標(biāo)檢測算法研究
發(fā)布時(shí)間:2020-12-20 15:51
隨著視頻監(jiān)控應(yīng)用的普及和計(jì)算機(jī)科學(xué)與技術(shù)的快速發(fā)展,計(jì)算機(jī)視覺技術(shù)得到了廣泛的應(yīng)用;谝曈X的目標(biāo)檢測技術(shù)是計(jì)算機(jī)視覺領(lǐng)域中非常重要的一部分,許多更高層次的視覺處理和分析任務(wù)也是以此為基礎(chǔ)。目標(biāo)檢測技術(shù)被廣泛應(yīng)用于人臉識別、智能駕駛等領(lǐng)域。傳統(tǒng)的目標(biāo)檢測算法基于人工提取特征,準(zhǔn)確率容易受采集條件等因素影響,且效率低、泛化性弱。近年來基于深度學(xué)習(xí)的目標(biāo)檢測算法在檢測準(zhǔn)確率上遠(yuǎn)遠(yuǎn)領(lǐng)先傳統(tǒng)目標(biāo)檢測算法,背靠大數(shù)據(jù)自動(dòng)學(xué)習(xí)提取特征,效果遠(yuǎn)優(yōu)于人工設(shè)計(jì)特征。雖然深度學(xué)習(xí)在許多方面都遠(yuǎn)超傳統(tǒng)算法,但是其缺點(diǎn)也非常明顯,需要大量的訓(xùn)練數(shù)據(jù),模型參數(shù)量大,運(yùn)算速度慢,對硬件要求極高。由于這些原因,深度學(xué)習(xí)算法很難做到實(shí)時(shí),很難應(yīng)用到嵌入式或小型設(shè)備中。本文研究在保證準(zhǔn)確率的前提下,加快基于深度學(xué)習(xí)的目標(biāo)檢測算法的檢測速度。本文具體工作內(nèi)容如下:首先,詳細(xì)介紹了主流CNN網(wǎng)絡(luò)模型,分析對比了流行的基于深度學(xué)習(xí)的目標(biāo)檢測算法的模型結(jié)構(gòu)及其它們的優(yōu)劣勢。然后,借鑒流行的one-stage方法,設(shè)計(jì)了直接對目標(biāo)進(jìn)行分類和位置回歸的端到端網(wǎng)絡(luò)模型。并使用Tensor Flow平臺訓(xùn)練網(wǎng)絡(luò),使得網(wǎng)絡(luò)的m AP達(dá)到...
【文章來源】:哈爾濱工業(yè)大學(xué)黑龍江省 211工程院校 985工程院校
【文章頁數(shù)】:73 頁
【學(xué)位級別】:碩士
【部分圖文】:
R-CNN的計(jì)算流程圖
哈爾濱工業(yè)大學(xué)工學(xué)碩士學(xué)位論文維度的特征表示?臻g金字塔池化借鑒了空間金字塔模型的思想,通過多個(gè)度的池化替換原本單一的池化,達(dá)到統(tǒng)一特征向量維度的效果。SPP-Net 的計(jì)算流程圖如圖 1-2 所示,在最后一個(gè)卷積層與其后的全連接添加了一個(gè) SPPlayer,從而避免了對候選區(qū)域進(jìn)行裁剪和扭曲。SPP-Net 針圖像只需要進(jìn)行一次 CNN 特征提取過程,避免了重復(fù)的運(yùn)算,速度可以比N 快 24~102 倍,且準(zhǔn)確率更高。由于 SPP-Net 支持不同尺寸輸入圖像,P-Net 提取得到的圖像特征具有更好的尺度不變性,降低了訓(xùn)練過程中的過能性。
哈爾濱工業(yè)大學(xué)工學(xué)碩士學(xué)位論文果選用 VGG-16 網(wǎng)絡(luò)作為特征提取網(wǎng)絡(luò),在訓(xùn)練階段,F(xiàn)ast R-CR-CNN 和 SPP-Net 可以分別提升 9 倍和 3 倍;在測試階段,F(xiàn)astR R-CNN 和 SPP-Net 可以分別提升 213 倍和 10 倍。 FastR-CNN 的速度相比于之前的網(wǎng)絡(luò)已經(jīng)有了很大的提升,但esearch 的方法來提取目標(biāo)候選區(qū)域,在時(shí)間和精度上還有很大的35]抓住了這個(gè)問題,提出了一種區(qū)域建議網(wǎng)絡(luò)(Region Proposal用 RPN 網(wǎng)絡(luò)代替 Selective search 方法提取目標(biāo)及候選區(qū)域,作絡(luò)+Fast R-CNN 網(wǎng)絡(luò)稱為 Faster R-CNN 網(wǎng)絡(luò)[39]。
【參考文獻(xiàn)】:
期刊論文
[1]圖像物體分類與檢測算法綜述[J]. 黃凱奇,任偉強(qiáng),譚鐵牛. 計(jì)算機(jī)學(xué)報(bào). 2014(06)
本文編號:2928136
【文章來源】:哈爾濱工業(yè)大學(xué)黑龍江省 211工程院校 985工程院校
【文章頁數(shù)】:73 頁
【學(xué)位級別】:碩士
【部分圖文】:
R-CNN的計(jì)算流程圖
哈爾濱工業(yè)大學(xué)工學(xué)碩士學(xué)位論文維度的特征表示?臻g金字塔池化借鑒了空間金字塔模型的思想,通過多個(gè)度的池化替換原本單一的池化,達(dá)到統(tǒng)一特征向量維度的效果。SPP-Net 的計(jì)算流程圖如圖 1-2 所示,在最后一個(gè)卷積層與其后的全連接添加了一個(gè) SPPlayer,從而避免了對候選區(qū)域進(jìn)行裁剪和扭曲。SPP-Net 針圖像只需要進(jìn)行一次 CNN 特征提取過程,避免了重復(fù)的運(yùn)算,速度可以比N 快 24~102 倍,且準(zhǔn)確率更高。由于 SPP-Net 支持不同尺寸輸入圖像,P-Net 提取得到的圖像特征具有更好的尺度不變性,降低了訓(xùn)練過程中的過能性。
哈爾濱工業(yè)大學(xué)工學(xué)碩士學(xué)位論文果選用 VGG-16 網(wǎng)絡(luò)作為特征提取網(wǎng)絡(luò),在訓(xùn)練階段,F(xiàn)ast R-CR-CNN 和 SPP-Net 可以分別提升 9 倍和 3 倍;在測試階段,F(xiàn)astR R-CNN 和 SPP-Net 可以分別提升 213 倍和 10 倍。 FastR-CNN 的速度相比于之前的網(wǎng)絡(luò)已經(jīng)有了很大的提升,但esearch 的方法來提取目標(biāo)候選區(qū)域,在時(shí)間和精度上還有很大的35]抓住了這個(gè)問題,提出了一種區(qū)域建議網(wǎng)絡(luò)(Region Proposal用 RPN 網(wǎng)絡(luò)代替 Selective search 方法提取目標(biāo)及候選區(qū)域,作絡(luò)+Fast R-CNN 網(wǎng)絡(luò)稱為 Faster R-CNN 網(wǎng)絡(luò)[39]。
【參考文獻(xiàn)】:
期刊論文
[1]圖像物體分類與檢測算法綜述[J]. 黃凱奇,任偉強(qiáng),譚鐵牛. 計(jì)算機(jī)學(xué)報(bào). 2014(06)
本文編號:2928136
本文鏈接:http://sikaile.net/kejilunwen/zidonghuakongzhilunwen/2928136.html
最近更新
教材專著