天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

基于深度學習的目標實時檢測模型的研究與實現(xiàn)

發(fā)布時間:2021-04-08 02:03
  目標檢測是當前計算機視覺領(lǐng)域的一個研究熱點,主要任務是找出圖像或視頻中所有感興趣目標的位置,并給出每個目標的具體類別。近年來,目標檢測在很多計算機視覺領(lǐng)域中已經(jīng)有了很多成熟的應用,如車輛自動駕駛、圖像檢索、視頻監(jiān)控和信息采集等;趥鹘y(tǒng)圖像處理和機器學習的目標檢測算法通常使用手工設計的特征,并且利用小樣本進行訓練,這種做法常常會受到光照、遮擋和環(huán)境變化等因素的影響,最終導致目標檢測的效果不佳。與傳統(tǒng)目標檢測算法相比,基于深度學習的目標檢測算法擁有突出的性能優(yōu)勢,然而深度學習也具有一定的缺點。高復雜度的深度學習模型雖然具有更好的性能,但是高額的存儲空間和計算資源消耗導致其難以有效地應用在體積、功耗等方面受限的移動和嵌入式設備上。龐大的計算量導致神經(jīng)網(wǎng)絡模型不能在移動、嵌入式等設備上實時運行,針對這一問題,業(yè)界許多學者研究模型壓縮和加速算法,剔除神經(jīng)網(wǎng)絡的冗余信息。因此本文提出將模型壓縮技術(shù)應用于SSD(Single Shot Multi Box Detector)目標檢測模型,減少目標檢測模型的內(nèi)存占用、加快推斷速度及節(jié)省能耗。具體工作內(nèi)容如下:1)主干網(wǎng)絡模型搭建和壓縮。本文將SSD的... 

【文章來源】:東南大學江蘇省 211工程院校 985工程院校 教育部直屬院校

【文章頁數(shù)】:69 頁

【學位級別】:碩士

【部分圖文】:

基于深度學習的目標實時檢測模型的研究與實現(xiàn)


傳統(tǒng)目標檢測算法流程

特征圖,目標檢測,歸納總結(jié),算法


東南大學碩士學位論文4針對YOLO算法對目標的定位精度不高這一問題,2016年12月北卡大學教堂山分校的Liu等人提出了SSD[20]目標檢測算法,其主要從兩個方面實現(xiàn)快速且高檢測精度的目標檢測效果:首先,SSD利用多尺度特征圖進行檢測,尺度較大的特征圖可用于檢測小目標,尺度較小的特征圖可用于檢測大目標;其次,SSD在每個尺度的特征圖上使用了具有不同尺度和寬高比的默認框[21],可以包含具有不同大小和形狀的目標;谏疃葘W習的目標檢測算法歸納總結(jié)如圖1-2所示:圖1-2基于深度學習的目標檢測算法歸納總結(jié)FasterR-CNN、YOLO、SSD和YOLOv2算法的性能對比如表1-1所示,F(xiàn)asterR-CNN(VGG16)表示基于VGG16的FasterR-CNN模型。表1-1中的mAP值是各個模型在PASCALVOC2007test上的測試結(jié)果。表1-1FasterR-CNN、YOLO、SSD和YOLOv2算法的性能對比ModelInputDimensionDatamAP(%)SpeedonTitanXGPU(FPS)FasterR-CNN(VGG16)1000×600PASCALVOC07+12trainval73.27YOLO448×448PASCALVOC07+12trainval63.445SSD300×300PASCALVOC07+12trainval74.346YOLOv2288×288PASCALVOC07+12trainval69.0911.3本文的研究內(nèi)容本文主要是對基于深度學習的目標實時檢測模型進行研究,目的是實現(xiàn)目標檢測模型在保持準確率的同時,有效減小模型的參數(shù)量并且提高模型的檢測速度。主要研究內(nèi)容如圖1-3所示:

模型圖,主干網(wǎng)絡,內(nèi)容,模型


第一章緒論5圖1-3本文的研究內(nèi)容1)主干網(wǎng)絡模型搭建。相對于原始SSD算法使用的主干網(wǎng)絡為VGG,本文使用參數(shù)量較少的DenseNet-47,其包含一個StemBlock、四個DenseBlock、三個TransitionLayer以及一個分類層。2)基于第一點工作對主干網(wǎng)絡模型進行壓縮。本文使用結(jié)構(gòu)化剪枝方法,根據(jù)網(wǎng)絡原有的批量歸一化(BatchNormalization,BN)層的γ參數(shù)對特征圖每個通道的重要性進行評估,然后將重要性低于某個閾值的特征圖通道剪掉,與此同時生成這些特征圖通道的對應卷積核也被剪掉。3)將壓縮后的主干網(wǎng)絡和SSD高效結(jié)合,構(gòu)建CP-SSD模型。原始SSD算法選擇了6個尺度(38×38,19×19,10×10,5×5,3×3,1×1)的特征圖進行預測,為了減小計算量,本文舍去38×38尺度的特征圖,增加2×2尺度的特征圖進行預測,并在19×19尺度的特征圖上減少默認框的數(shù)量。原始SSD用3×3的卷積生成附加的特征圖以及預測類別和邊框位置,本文改用深度可分解卷積生成附加的特征圖,使用1×1的卷積核來預測類別分數(shù)和邊框位置,并且在預測之前構(gòu)建一個殘差塊(Resblock),此殘差塊可大幅提升算法的平均精度均值。4)CP-SSD算法性能分析。本文將壓縮后的目標檢測模型稱為緊湊SSD(CompactSSD),簡寫為CP-SSD,使用平均精度均值(mAP)、模型大小以及檢測速度(FPS)指標對壓縮后的檢測模型進行性能分析,證明本文模型壓縮方法應用在目標檢測算法上的有效性。1.4論文組織結(jié)構(gòu)按照上節(jié)所述的研究內(nèi)容,本文共分為6章,各章的主要內(nèi)容具體如下:第一章為緒論,主要闡述了論文的研究背景及意義,總結(jié)了傳統(tǒng)目標檢測方法和基于深度學習的目標檢測算法,最后給出了研究的主要內(nèi)容以及本文的組織結(jié)構(gòu)。第二章介紹了相關(guān)理論和工作基礎(chǔ),首先介紹了神經(jīng)網(wǎng)絡的基本組成單

【參考文獻】:
期刊論文
[1]神經(jīng)網(wǎng)絡模型壓縮方法綜述[J]. 曹文龍,芮建武,李敏.  計算機應用研究. 2019(03)
[2]基于人工神經(jīng)網(wǎng)絡的車牌識別[J]. 吳聰,殷浩,黃中勇,劉罡.  計算機技術(shù)與發(fā)展. 2016(12)
[3]深度學習研究進展[J]. 郭麗麗,丁世飛.  計算機科學. 2015(05)

博士論文
[1]智能監(jiān)控系統(tǒng)中行人重識別方法研究[D]. 劉曉凱.大連理工大學 2017

碩士論文
[1]基于目標檢測的快消品識別研究與應用[D]. 王振.湖南大學 2018
[2]基于深度學習的敏感人臉圖像在視頻流中的檢測與識別[D]. 袁麗萍.蘭州大學 2018
[3]基于深度學習的人臉檢測和識別方法研究[D]. 劉婧月.電子科技大學 2018
[4]基于深度學習的目標檢測算法研究[D]. 張志豪.電子科技大學 2018
[5]基于深度學習和空間鄰域信息的極化SAR地物分類方法研究[D]. 樊偉明.西安電子科技大學 2017
[6]基于深度學習的圖像檢索研究[D]. 馬冬梅.內(nèi)蒙古大學 2014
[7]基于卷積神經(jīng)網(wǎng)絡的深度學習算法與應用研究[D]. 陳先昌.浙江工商大學 2014
[8]采用神經(jīng)網(wǎng)絡和壓電阻抗技術(shù)的焊接結(jié)構(gòu)健康監(jiān)測研究[D]. 朱楚為.南京航空航天大學 2012



本文編號:3124630

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/shengwushengchang/3124630.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶10ad5***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com