基于深度學(xué)習(xí)的目標(biāo)實(shí)時(shí)檢測(cè)模型的研究與實(shí)現(xiàn)
發(fā)布時(shí)間:2021-04-08 02:03
目標(biāo)檢測(cè)是當(dāng)前計(jì)算機(jī)視覺(jué)領(lǐng)域的一個(gè)研究熱點(diǎn),主要任務(wù)是找出圖像或視頻中所有感興趣目標(biāo)的位置,并給出每個(gè)目標(biāo)的具體類(lèi)別。近年來(lái),目標(biāo)檢測(cè)在很多計(jì)算機(jī)視覺(jué)領(lǐng)域中已經(jīng)有了很多成熟的應(yīng)用,如車(chē)輛自動(dòng)駕駛、圖像檢索、視頻監(jiān)控和信息采集等;趥鹘y(tǒng)圖像處理和機(jī)器學(xué)習(xí)的目標(biāo)檢測(cè)算法通常使用手工設(shè)計(jì)的特征,并且利用小樣本進(jìn)行訓(xùn)練,這種做法常常會(huì)受到光照、遮擋和環(huán)境變化等因素的影響,最終導(dǎo)致目標(biāo)檢測(cè)的效果不佳。與傳統(tǒng)目標(biāo)檢測(cè)算法相比,基于深度學(xué)習(xí)的目標(biāo)檢測(cè)算法擁有突出的性能優(yōu)勢(shì),然而深度學(xué)習(xí)也具有一定的缺點(diǎn)。高復(fù)雜度的深度學(xué)習(xí)模型雖然具有更好的性能,但是高額的存儲(chǔ)空間和計(jì)算資源消耗導(dǎo)致其難以有效地應(yīng)用在體積、功耗等方面受限的移動(dòng)和嵌入式設(shè)備上。龐大的計(jì)算量導(dǎo)致神經(jīng)網(wǎng)絡(luò)模型不能在移動(dòng)、嵌入式等設(shè)備上實(shí)時(shí)運(yùn)行,針對(duì)這一問(wèn)題,業(yè)界許多學(xué)者研究模型壓縮和加速算法,剔除神經(jīng)網(wǎng)絡(luò)的冗余信息。因此本文提出將模型壓縮技術(shù)應(yīng)用于SSD(Single Shot Multi Box Detector)目標(biāo)檢測(cè)模型,減少目標(biāo)檢測(cè)模型的內(nèi)存占用、加快推斷速度及節(jié)省能耗。具體工作內(nèi)容如下:1)主干網(wǎng)絡(luò)模型搭建和壓縮。本文將SSD的...
【文章來(lái)源】:東南大學(xué)江蘇省 211工程院校 985工程院校 教育部直屬院校
【文章頁(yè)數(shù)】:69 頁(yè)
【學(xué)位級(jí)別】:碩士
【部分圖文】:
傳統(tǒng)目標(biāo)檢測(cè)算法流程
東南大學(xué)碩士學(xué)位論文4針對(duì)YOLO算法對(duì)目標(biāo)的定位精度不高這一問(wèn)題,2016年12月北卡大學(xué)教堂山分校的Liu等人提出了SSD[20]目標(biāo)檢測(cè)算法,其主要從兩個(gè)方面實(shí)現(xiàn)快速且高檢測(cè)精度的目標(biāo)檢測(cè)效果:首先,SSD利用多尺度特征圖進(jìn)行檢測(cè),尺度較大的特征圖可用于檢測(cè)小目標(biāo),尺度較小的特征圖可用于檢測(cè)大目標(biāo);其次,SSD在每個(gè)尺度的特征圖上使用了具有不同尺度和寬高比的默認(rèn)框[21],可以包含具有不同大小和形狀的目標(biāo);谏疃葘W(xué)習(xí)的目標(biāo)檢測(cè)算法歸納總結(jié)如圖1-2所示:圖1-2基于深度學(xué)習(xí)的目標(biāo)檢測(cè)算法歸納總結(jié)FasterR-CNN、YOLO、SSD和YOLOv2算法的性能對(duì)比如表1-1所示,F(xiàn)asterR-CNN(VGG16)表示基于VGG16的FasterR-CNN模型。表1-1中的mAP值是各個(gè)模型在PASCALVOC2007test上的測(cè)試結(jié)果。表1-1FasterR-CNN、YOLO、SSD和YOLOv2算法的性能對(duì)比ModelInputDimensionDatamAP(%)SpeedonTitanXGPU(FPS)FasterR-CNN(VGG16)1000×600PASCALVOC07+12trainval73.27YOLO448×448PASCALVOC07+12trainval63.445SSD300×300PASCALVOC07+12trainval74.346YOLOv2288×288PASCALVOC07+12trainval69.0911.3本文的研究?jī)?nèi)容本文主要是對(duì)基于深度學(xué)習(xí)的目標(biāo)實(shí)時(shí)檢測(cè)模型進(jìn)行研究,目的是實(shí)現(xiàn)目標(biāo)檢測(cè)模型在保持準(zhǔn)確率的同時(shí),有效減小模型的參數(shù)量并且提高模型的檢測(cè)速度。主要研究?jī)?nèi)容如圖1-3所示:
第一章緒論5圖1-3本文的研究?jī)?nèi)容1)主干網(wǎng)絡(luò)模型搭建。相對(duì)于原始SSD算法使用的主干網(wǎng)絡(luò)為VGG,本文使用參數(shù)量較少的DenseNet-47,其包含一個(gè)StemBlock、四個(gè)DenseBlock、三個(gè)TransitionLayer以及一個(gè)分類(lèi)層。2)基于第一點(diǎn)工作對(duì)主干網(wǎng)絡(luò)模型進(jìn)行壓縮。本文使用結(jié)構(gòu)化剪枝方法,根據(jù)網(wǎng)絡(luò)原有的批量歸一化(BatchNormalization,BN)層的γ參數(shù)對(duì)特征圖每個(gè)通道的重要性進(jìn)行評(píng)估,然后將重要性低于某個(gè)閾值的特征圖通道剪掉,與此同時(shí)生成這些特征圖通道的對(duì)應(yīng)卷積核也被剪掉。3)將壓縮后的主干網(wǎng)絡(luò)和SSD高效結(jié)合,構(gòu)建CP-SSD模型。原始SSD算法選擇了6個(gè)尺度(38×38,19×19,10×10,5×5,3×3,1×1)的特征圖進(jìn)行預(yù)測(cè),為了減小計(jì)算量,本文舍去38×38尺度的特征圖,增加2×2尺度的特征圖進(jìn)行預(yù)測(cè),并在19×19尺度的特征圖上減少默認(rèn)框的數(shù)量。原始SSD用3×3的卷積生成附加的特征圖以及預(yù)測(cè)類(lèi)別和邊框位置,本文改用深度可分解卷積生成附加的特征圖,使用1×1的卷積核來(lái)預(yù)測(cè)類(lèi)別分?jǐn)?shù)和邊框位置,并且在預(yù)測(cè)之前構(gòu)建一個(gè)殘差塊(Resblock),此殘差塊可大幅提升算法的平均精度均值。4)CP-SSD算法性能分析。本文將壓縮后的目標(biāo)檢測(cè)模型稱(chēng)為緊湊SSD(CompactSSD),簡(jiǎn)寫(xiě)為CP-SSD,使用平均精度均值(mAP)、模型大小以及檢測(cè)速度(FPS)指標(biāo)對(duì)壓縮后的檢測(cè)模型進(jìn)行性能分析,證明本文模型壓縮方法應(yīng)用在目標(biāo)檢測(cè)算法上的有效性。1.4論文組織結(jié)構(gòu)按照上節(jié)所述的研究?jī)?nèi)容,本文共分為6章,各章的主要內(nèi)容具體如下:第一章為緒論,主要闡述了論文的研究背景及意義,總結(jié)了傳統(tǒng)目標(biāo)檢測(cè)方法和基于深度學(xué)習(xí)的目標(biāo)檢測(cè)算法,最后給出了研究的主要內(nèi)容以及本文的組織結(jié)構(gòu)。第二章介紹了相關(guān)理論和工作基礎(chǔ),首先介紹了神經(jīng)網(wǎng)絡(luò)的基本組成單
【參考文獻(xiàn)】:
期刊論文
[1]神經(jīng)網(wǎng)絡(luò)模型壓縮方法綜述[J]. 曹文龍,芮建武,李敏. 計(jì)算機(jī)應(yīng)用研究. 2019(03)
[2]基于人工神經(jīng)網(wǎng)絡(luò)的車(chē)牌識(shí)別[J]. 吳聰,殷浩,黃中勇,劉罡. 計(jì)算機(jī)技術(shù)與發(fā)展. 2016(12)
[3]深度學(xué)習(xí)研究進(jìn)展[J]. 郭麗麗,丁世飛. 計(jì)算機(jī)科學(xué). 2015(05)
博士論文
[1]智能監(jiān)控系統(tǒng)中行人重識(shí)別方法研究[D]. 劉曉凱.大連理工大學(xué) 2017
碩士論文
[1]基于目標(biāo)檢測(cè)的快消品識(shí)別研究與應(yīng)用[D]. 王振.湖南大學(xué) 2018
[2]基于深度學(xué)習(xí)的敏感人臉圖像在視頻流中的檢測(cè)與識(shí)別[D]. 袁麗萍.蘭州大學(xué) 2018
[3]基于深度學(xué)習(xí)的人臉檢測(cè)和識(shí)別方法研究[D]. 劉婧月.電子科技大學(xué) 2018
[4]基于深度學(xué)習(xí)的目標(biāo)檢測(cè)算法研究[D]. 張志豪.電子科技大學(xué) 2018
[5]基于深度學(xué)習(xí)和空間鄰域信息的極化SAR地物分類(lèi)方法研究[D]. 樊偉明.西安電子科技大學(xué) 2017
[6]基于深度學(xué)習(xí)的圖像檢索研究[D]. 馬冬梅.內(nèi)蒙古大學(xué) 2014
[7]基于卷積神經(jīng)網(wǎng)絡(luò)的深度學(xué)習(xí)算法與應(yīng)用研究[D]. 陳先昌.浙江工商大學(xué) 2014
[8]采用神經(jīng)網(wǎng)絡(luò)和壓電阻抗技術(shù)的焊接結(jié)構(gòu)健康監(jiān)測(cè)研究[D]. 朱楚為.南京航空航天大學(xué) 2012
本文編號(hào):3124630
【文章來(lái)源】:東南大學(xué)江蘇省 211工程院校 985工程院校 教育部直屬院校
【文章頁(yè)數(shù)】:69 頁(yè)
【學(xué)位級(jí)別】:碩士
【部分圖文】:
傳統(tǒng)目標(biāo)檢測(cè)算法流程
東南大學(xué)碩士學(xué)位論文4針對(duì)YOLO算法對(duì)目標(biāo)的定位精度不高這一問(wèn)題,2016年12月北卡大學(xué)教堂山分校的Liu等人提出了SSD[20]目標(biāo)檢測(cè)算法,其主要從兩個(gè)方面實(shí)現(xiàn)快速且高檢測(cè)精度的目標(biāo)檢測(cè)效果:首先,SSD利用多尺度特征圖進(jìn)行檢測(cè),尺度較大的特征圖可用于檢測(cè)小目標(biāo),尺度較小的特征圖可用于檢測(cè)大目標(biāo);其次,SSD在每個(gè)尺度的特征圖上使用了具有不同尺度和寬高比的默認(rèn)框[21],可以包含具有不同大小和形狀的目標(biāo);谏疃葘W(xué)習(xí)的目標(biāo)檢測(cè)算法歸納總結(jié)如圖1-2所示:圖1-2基于深度學(xué)習(xí)的目標(biāo)檢測(cè)算法歸納總結(jié)FasterR-CNN、YOLO、SSD和YOLOv2算法的性能對(duì)比如表1-1所示,F(xiàn)asterR-CNN(VGG16)表示基于VGG16的FasterR-CNN模型。表1-1中的mAP值是各個(gè)模型在PASCALVOC2007test上的測(cè)試結(jié)果。表1-1FasterR-CNN、YOLO、SSD和YOLOv2算法的性能對(duì)比ModelInputDimensionDatamAP(%)SpeedonTitanXGPU(FPS)FasterR-CNN(VGG16)1000×600PASCALVOC07+12trainval73.27YOLO448×448PASCALVOC07+12trainval63.445SSD300×300PASCALVOC07+12trainval74.346YOLOv2288×288PASCALVOC07+12trainval69.0911.3本文的研究?jī)?nèi)容本文主要是對(duì)基于深度學(xué)習(xí)的目標(biāo)實(shí)時(shí)檢測(cè)模型進(jìn)行研究,目的是實(shí)現(xiàn)目標(biāo)檢測(cè)模型在保持準(zhǔn)確率的同時(shí),有效減小模型的參數(shù)量并且提高模型的檢測(cè)速度。主要研究?jī)?nèi)容如圖1-3所示:
第一章緒論5圖1-3本文的研究?jī)?nèi)容1)主干網(wǎng)絡(luò)模型搭建。相對(duì)于原始SSD算法使用的主干網(wǎng)絡(luò)為VGG,本文使用參數(shù)量較少的DenseNet-47,其包含一個(gè)StemBlock、四個(gè)DenseBlock、三個(gè)TransitionLayer以及一個(gè)分類(lèi)層。2)基于第一點(diǎn)工作對(duì)主干網(wǎng)絡(luò)模型進(jìn)行壓縮。本文使用結(jié)構(gòu)化剪枝方法,根據(jù)網(wǎng)絡(luò)原有的批量歸一化(BatchNormalization,BN)層的γ參數(shù)對(duì)特征圖每個(gè)通道的重要性進(jìn)行評(píng)估,然后將重要性低于某個(gè)閾值的特征圖通道剪掉,與此同時(shí)生成這些特征圖通道的對(duì)應(yīng)卷積核也被剪掉。3)將壓縮后的主干網(wǎng)絡(luò)和SSD高效結(jié)合,構(gòu)建CP-SSD模型。原始SSD算法選擇了6個(gè)尺度(38×38,19×19,10×10,5×5,3×3,1×1)的特征圖進(jìn)行預(yù)測(cè),為了減小計(jì)算量,本文舍去38×38尺度的特征圖,增加2×2尺度的特征圖進(jìn)行預(yù)測(cè),并在19×19尺度的特征圖上減少默認(rèn)框的數(shù)量。原始SSD用3×3的卷積生成附加的特征圖以及預(yù)測(cè)類(lèi)別和邊框位置,本文改用深度可分解卷積生成附加的特征圖,使用1×1的卷積核來(lái)預(yù)測(cè)類(lèi)別分?jǐn)?shù)和邊框位置,并且在預(yù)測(cè)之前構(gòu)建一個(gè)殘差塊(Resblock),此殘差塊可大幅提升算法的平均精度均值。4)CP-SSD算法性能分析。本文將壓縮后的目標(biāo)檢測(cè)模型稱(chēng)為緊湊SSD(CompactSSD),簡(jiǎn)寫(xiě)為CP-SSD,使用平均精度均值(mAP)、模型大小以及檢測(cè)速度(FPS)指標(biāo)對(duì)壓縮后的檢測(cè)模型進(jìn)行性能分析,證明本文模型壓縮方法應(yīng)用在目標(biāo)檢測(cè)算法上的有效性。1.4論文組織結(jié)構(gòu)按照上節(jié)所述的研究?jī)?nèi)容,本文共分為6章,各章的主要內(nèi)容具體如下:第一章為緒論,主要闡述了論文的研究背景及意義,總結(jié)了傳統(tǒng)目標(biāo)檢測(cè)方法和基于深度學(xué)習(xí)的目標(biāo)檢測(cè)算法,最后給出了研究的主要內(nèi)容以及本文的組織結(jié)構(gòu)。第二章介紹了相關(guān)理論和工作基礎(chǔ),首先介紹了神經(jīng)網(wǎng)絡(luò)的基本組成單
【參考文獻(xiàn)】:
期刊論文
[1]神經(jīng)網(wǎng)絡(luò)模型壓縮方法綜述[J]. 曹文龍,芮建武,李敏. 計(jì)算機(jī)應(yīng)用研究. 2019(03)
[2]基于人工神經(jīng)網(wǎng)絡(luò)的車(chē)牌識(shí)別[J]. 吳聰,殷浩,黃中勇,劉罡. 計(jì)算機(jī)技術(shù)與發(fā)展. 2016(12)
[3]深度學(xué)習(xí)研究進(jìn)展[J]. 郭麗麗,丁世飛. 計(jì)算機(jī)科學(xué). 2015(05)
博士論文
[1]智能監(jiān)控系統(tǒng)中行人重識(shí)別方法研究[D]. 劉曉凱.大連理工大學(xué) 2017
碩士論文
[1]基于目標(biāo)檢測(cè)的快消品識(shí)別研究與應(yīng)用[D]. 王振.湖南大學(xué) 2018
[2]基于深度學(xué)習(xí)的敏感人臉圖像在視頻流中的檢測(cè)與識(shí)別[D]. 袁麗萍.蘭州大學(xué) 2018
[3]基于深度學(xué)習(xí)的人臉檢測(cè)和識(shí)別方法研究[D]. 劉婧月.電子科技大學(xué) 2018
[4]基于深度學(xué)習(xí)的目標(biāo)檢測(cè)算法研究[D]. 張志豪.電子科技大學(xué) 2018
[5]基于深度學(xué)習(xí)和空間鄰域信息的極化SAR地物分類(lèi)方法研究[D]. 樊偉明.西安電子科技大學(xué) 2017
[6]基于深度學(xué)習(xí)的圖像檢索研究[D]. 馬冬梅.內(nèi)蒙古大學(xué) 2014
[7]基于卷積神經(jīng)網(wǎng)絡(luò)的深度學(xué)習(xí)算法與應(yīng)用研究[D]. 陳先昌.浙江工商大學(xué) 2014
[8]采用神經(jīng)網(wǎng)絡(luò)和壓電阻抗技術(shù)的焊接結(jié)構(gòu)健康監(jiān)測(cè)研究[D]. 朱楚為.南京航空航天大學(xué) 2012
本文編號(hào):3124630
本文鏈接:http://sikaile.net/kejilunwen/shengwushengchang/3124630.html
最近更新
教材專(zhuān)著