天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

基于深度學(xué)習(xí)的單發(fā)多框檢測(cè)器優(yōu)化算法研究

發(fā)布時(shí)間:2022-01-15 05:00
  目標(biāo)檢測(cè)作為計(jì)算機(jī)視覺的基礎(chǔ)任務(wù)之一,為解決分割、場(chǎng)景理解和目標(biāo)跟蹤等更復(fù)雜或更高層次的計(jì)算機(jī)視覺任務(wù)奠定了基礎(chǔ),它在包括機(jī)器人視覺、人機(jī)交互和自動(dòng)駕駛等人工智能和信息技術(shù)領(lǐng)域有著廣泛的應(yīng)用。隨著深度學(xué)習(xí)技術(shù)的發(fā)展,基于深度學(xué)習(xí)的目標(biāo)檢測(cè)算法取得了較大的進(jìn)展,單發(fā)多框檢測(cè)器(Single Shot multibox Detector,SSD)是一種在簡(jiǎn)單性、快速性和準(zhǔn)確性之間提供最佳權(quán)衡的目標(biāo)檢測(cè)算法。本文選擇SSD算法作為基礎(chǔ)開展研究,考慮該算法存在小目標(biāo)檢測(cè)不夠魯棒以及訓(xùn)練過程中樣本和多任務(wù)不平衡等問題,對(duì)如何提高SSD算法的檢測(cè)性能進(jìn)行了深入研究并提出了三種有效的解決方案。本文主要工作內(nèi)容如下:首先,在詳細(xì)介紹了SSD算法的網(wǎng)絡(luò)結(jié)構(gòu)和原理的基礎(chǔ)上,針對(duì)其網(wǎng)絡(luò)結(jié)構(gòu)中檢測(cè)層單一的利用方式導(dǎo)致特征信息使用不充分的缺點(diǎn),提出了一種基于雙向特征融合改進(jìn)的單發(fā)多框檢測(cè)器算法(Two-way Feature fusion based Single Shot multibox Detector,TFSSD)。TFSSD算法利用提出的雙向特征融合模塊(Two-way Feature Fusion ... 

【文章來源】:重慶郵電大學(xué)重慶市

【文章頁(yè)數(shù)】:81 頁(yè)

【學(xué)位級(jí)別】:碩士

【部分圖文】:

基于深度學(xué)習(xí)的單發(fā)多框檢測(cè)器優(yōu)化算法研究


目標(biāo)檢測(cè)示意圖

直方圖,目標(biāo)檢測(cè),進(jìn)程,算法


重慶郵電大學(xué)碩士學(xué)位論文第1章緒論3(1).利用多個(gè)尺度的滑動(dòng)窗口來確定輸入圖像中可能包含目標(biāo)物體的候選區(qū)域;(2).從這些可能的候選區(qū)域中提取相關(guān)的視覺特征;(3).利用分類器對(duì)這些提取的視覺特征進(jìn)行分類和識(shí)別。早期對(duì)目標(biāo)檢測(cè)的研究是基于模板匹配技術(shù)和簡(jiǎn)單手工特征的模型,重點(diǎn)研究空間布局大致剛性的特定物體,如眼睛、嘴巴和人臉等。傳統(tǒng)的目標(biāo)檢測(cè)算法一般是基于手工設(shè)計(jì)的幾何特征作為輸入。常見的人工設(shè)計(jì)的特征算子有:SIFT(ScaleInvariantFeatureTransform,尺度不變特征變換)[4]、HOG(HistogramofOrientedGradient,方向梯度直方圖)[5]和SURF(SpeededUpRobustFeatures,加速魯棒特征)[6]等。隨后,利用常見的統(tǒng)計(jì)分類器,如神經(jīng)網(wǎng)絡(luò)、支持向量機(jī)(SupportVectorMachine,SVM)[7]和Adaboost[8]等將目標(biāo)進(jìn)行分類。到20世紀(jì)90年代末和21世紀(jì)初,目標(biāo)檢測(cè)的研究取得了顯著進(jìn)展;诤蜻x區(qū)域和多類外觀特征的框架不斷被提出,這使得這些由手工繪制的局部描述特征和判別分類器組成的多級(jí)檢測(cè)框架一直主導(dǎo)著計(jì)算機(jī)視覺的各個(gè)領(lǐng)域,包括目標(biāo)檢測(cè)。如圖1.2所示,直到2012年的重要轉(zhuǎn)折點(diǎn),隨著DCNN在圖像分類方面取得了破紀(jì)錄的結(jié)果[1],目標(biāo)檢測(cè)領(lǐng)域也開始進(jìn)入基于DCNN的時(shí)代。但是傳統(tǒng)領(lǐng)域提出的滑動(dòng)窗口技術(shù)和多尺度金字塔策略等仍然廣泛應(yīng)用于基于DCNN的方法中。圖1.2目標(biāo)檢測(cè)算法進(jìn)程圖1.2.2基于深度學(xué)習(xí)的目標(biāo)檢測(cè)算法研究現(xiàn)狀自從深度學(xué)習(xí)進(jìn)入目標(biāo)檢測(cè)領(lǐng)域以來,基于深度卷積神經(jīng)網(wǎng)絡(luò)的各種目標(biāo)檢測(cè)方法都取得了顯著的進(jìn)展并快速成為主流,目前主要的目標(biāo)檢測(cè)算法大致可以分為兩類:

流程圖,目標(biāo)檢測(cè),進(jìn)程,算法


重慶郵電大學(xué)碩士學(xué)位論文第1章緒論4(1).基于候選區(qū)域提議的目標(biāo)檢測(cè)算法,即兩階段檢測(cè)框架算法。該方案首先采用目標(biāo)區(qū)域生成算法產(chǎn)生一系列可能包含目標(biāo)物體的候選區(qū)域,然后通過DCNN提取目標(biāo)候選區(qū)域的視覺特征,并利用分類器對(duì)這些視覺特征進(jìn)行分類,最后對(duì)目標(biāo)進(jìn)行真實(shí)邊界框回歸;(2).基于回歸的目標(biāo)檢測(cè)算法,即一階段檢測(cè)框架算法。該方案無需生成目標(biāo)候選區(qū)域,而是通過直接對(duì)預(yù)設(shè)定的錨框進(jìn)行回歸運(yùn)算以得到物體類別的概率和位置坐標(biāo)信息。1.基于候選區(qū)域提議的目標(biāo)檢測(cè)算法(兩階段檢測(cè)框架算法)在基于候選區(qū)域提議的框架中,首先利用深度卷積神經(jīng)網(wǎng)絡(luò)從區(qū)域中提取圖像的卷積特征,然后根據(jù)這些特征結(jié)合區(qū)域提議策略對(duì)目標(biāo)進(jìn)行分類和邊界框回歸。如圖1.3所示,DetectorNet[9]、OverFeat[10]、MultiBox[11]和RCNN[12]獨(dú)立且?guī)缀跬瑫r(shí)提出了利用卷積神經(jīng)網(wǎng)絡(luò)來進(jìn)行目標(biāo)檢測(cè)。圖1.3基于深度學(xué)習(xí)的目標(biāo)檢測(cè)算法進(jìn)程圖圖1.4RCNN算法流程圖[12]2013年,R.Girshick等人[12]通過整合AlexNet和區(qū)域搜索算法(SelectiveSearch)[13]提出了具有開創(chuàng)性意義的兩階段檢測(cè)算法RCNN(Region-basedConvolutionNeuralNetworks)算法,它取得了當(dāng)時(shí)的最佳水平。如圖1.4所示,RCNN框架由多階段組成,首先選用區(qū)域搜索算法提取可能包含物體的目標(biāo)候選區(qū)域,然后每個(gè)目標(biāo)候選區(qū)域被變換到固定大小并通過AlxeNet來提取每個(gè)目標(biāo)候選區(qū)域的深度特征,隨后通過訓(xùn)練SVM分類器對(duì)這些特征進(jìn)行分類,并預(yù)測(cè)出目標(biāo)候選區(qū)域中所


本文編號(hào):3589950

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/shengwushengchang/3589950.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶ebb35***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com