基于深度全卷積網(wǎng)絡(luò)的目標檢測方法研究
發(fā)布時間:2020-04-25 02:41
【摘要】:隨著互聯(lián)網(wǎng)技術(shù)的快速發(fā)展,目標檢測任務(wù)與人們的日常生活緊密地聯(lián)系在一起,該任務(wù)在道路監(jiān)控、醫(yī)療診斷以及視頻信息檢索等諸多領(lǐng)域都有廣泛的應(yīng)用,因此,圖像目標檢測技術(shù)成為計算機視覺領(lǐng)域中的熱門研究方向。近幾年來,深度學(xué)習(xí)的出現(xiàn)使該領(lǐng)域的研究邁出了一大步,利用深度學(xué)習(xí)的目標檢測框架取得較好的檢測效果,卷積神經(jīng)網(wǎng)絡(luò)依靠其強大的特征提取能力,可以在保證較高準確率的情況下適應(yīng)更多復(fù)雜的場景,當前主流算法可以歸為兩大類:基于候選區(qū)域的目標檢測算法,該算法存在檢測速度慢、過程繁瑣等問題,而另一種基于回歸的目標檢測算法是以犧牲精度為代價的,降低了算法的實用性。因此本文針對算法中存在的問題,結(jié)合基于區(qū)域和非區(qū)域目標檢測算法的優(yōu)點,提出改進方案。論文的主要工作如下:(1)針對檢測復(fù)雜背景下的目標和小尺度目標過程中存在的易漏檢問題,在基于候選區(qū)域的全卷積網(wǎng)絡(luò)目標檢測算法RFCN的基礎(chǔ)上進行改進,提出多尺度特征融合模型。該模型采用反向連接的方式對網(wǎng)絡(luò)中的多層卷積特征進行融合,并采用目標先驗減少樣本搜索空間,最終得到融合了低層高分辨率特征和高層豐富語義信息的更有利于描述目標的卷積特征。實驗結(jié)果表明,融合卷積特征的檢測模型有效提升了對背景復(fù)雜的目標和小尺度目標的檢測能力,同時兼顧目標檢測的速度。(2)針對候選區(qū)域框的回歸定位問題,本文提出二維損失函數(shù)來減少預(yù)測候選框和真實包圍框之間的損失,以保證對目標的精準定位。實驗結(jié)果證明了該損失函數(shù)有效實現(xiàn)了對目標的準確定位,這將更有助于小目標的檢測。(3)針對訓(xùn)練過程中正負樣本的比例不平衡導(dǎo)致模型訓(xùn)練收斂速度慢、模型泛化能力不強的問題,提出采用在線難例樣本挖掘算法對網(wǎng)絡(luò)模型進行優(yōu)化訓(xùn)練。該算法能夠平衡訓(xùn)練時所用正負樣本的比例,加快模型收斂速度的同時使得網(wǎng)絡(luò)訓(xùn)練更加充分。經(jīng)過實驗驗證,改進后的網(wǎng)絡(luò)模型檢測精度有了明顯提高,在一定程度上解決了小目標易漏檢的問題。
【圖文】:
述目標檢測的研究背景及意義,然后對目前國內(nèi)外的研究現(xiàn)狀進行了分析,總結(jié)主要研究內(nèi)容,最后給出行文安排。1.1 研究背景與意義當前社會,隨著信息科技的快速發(fā)展,信息化越來越顯示出對經(jīng)濟社會發(fā)展的用,尤其是自媒體行業(yè)的異軍突起,使得媒體的傳播和交流方式產(chǎn)生了極為重大,,讓這場信息化戰(zhàn)略格局越發(fā)尖銳,而在這場戰(zhàn)略中,計算機視覺處理技術(shù)起著用。計算機視覺[2]是計算機通過攝像機或者電腦代替人眼,從外部獲取圖像信息感知,從而對目標進行識別跟蹤和定位,包括在復(fù)雜場景下的目標識別定位,即像中目標的位置和所屬類別。顯而易見,圖像的目標檢測在計算機視覺領(lǐng)域有著缺的作用,是處理視頻監(jiān)控[3]、行為分析[4]等復(fù)雜問題的基本途徑。圖像目標檢測的步驟是,對圖像進行預(yù)處理并提取圖像信息,最終判定目標的所屬類別并對其定圖 1-1 所示為圖像的目標檢測示意圖。
卷積神經(jīng)網(wǎng)絡(luò)本質(zhì)上是一個由多層網(wǎng)絡(luò)組成的感知器,擅長通多一系列方法將圖片中的特征不斷降維,從中提取圖片信息完成檢測任務(wù)。一個基本的卷積神經(jīng)網(wǎng)絡(luò)通過卷積層與池化層的配合連接,組合成多個卷積組,逐層提取圖像中的特征,在最后連接若干個全連接層完成圖像的分類,達到目標檢測的功能。網(wǎng)絡(luò)中各類層用可微函數(shù)將激活數(shù)據(jù)從前一層傳到后一層,輸出模型參數(shù)和計算復(fù)雜度會受卷積核大小、池化層策略等的影響。卷積神經(jīng)網(wǎng)絡(luò)是針對二維形狀進行識別而特殊設(shè)計的神經(jīng)網(wǎng)絡(luò),憑借獨特的局部連接和權(quán)值共享方式被成功應(yīng)用于計算機視覺的各個領(lǐng)域,除此之外,還具有良好的平移、縮放及扭曲不變性,這些特性能夠大大減少網(wǎng)絡(luò)中的訓(xùn)練參數(shù)。卷積神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu)圖如圖 2-1 所示,通過該網(wǎng)絡(luò)最終輸出 10 個尺度大小為 5×5 的特征圖。網(wǎng)絡(luò)受局部感受野概念的啟發(fā)來模擬特征區(qū)分,并通過共享權(quán)值的卷積和池化來降低網(wǎng)絡(luò)參數(shù)的數(shù)量級,最終通過傳統(tǒng)神經(jīng)網(wǎng)絡(luò)完成檢測分類等任務(wù)。
【學(xué)位授予單位】:河南大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2019
【分類號】:TP391.41;TP183
本文編號:2639700
【圖文】:
述目標檢測的研究背景及意義,然后對目前國內(nèi)外的研究現(xiàn)狀進行了分析,總結(jié)主要研究內(nèi)容,最后給出行文安排。1.1 研究背景與意義當前社會,隨著信息科技的快速發(fā)展,信息化越來越顯示出對經(jīng)濟社會發(fā)展的用,尤其是自媒體行業(yè)的異軍突起,使得媒體的傳播和交流方式產(chǎn)生了極為重大,,讓這場信息化戰(zhàn)略格局越發(fā)尖銳,而在這場戰(zhàn)略中,計算機視覺處理技術(shù)起著用。計算機視覺[2]是計算機通過攝像機或者電腦代替人眼,從外部獲取圖像信息感知,從而對目標進行識別跟蹤和定位,包括在復(fù)雜場景下的目標識別定位,即像中目標的位置和所屬類別。顯而易見,圖像的目標檢測在計算機視覺領(lǐng)域有著缺的作用,是處理視頻監(jiān)控[3]、行為分析[4]等復(fù)雜問題的基本途徑。圖像目標檢測的步驟是,對圖像進行預(yù)處理并提取圖像信息,最終判定目標的所屬類別并對其定圖 1-1 所示為圖像的目標檢測示意圖。
卷積神經(jīng)網(wǎng)絡(luò)本質(zhì)上是一個由多層網(wǎng)絡(luò)組成的感知器,擅長通多一系列方法將圖片中的特征不斷降維,從中提取圖片信息完成檢測任務(wù)。一個基本的卷積神經(jīng)網(wǎng)絡(luò)通過卷積層與池化層的配合連接,組合成多個卷積組,逐層提取圖像中的特征,在最后連接若干個全連接層完成圖像的分類,達到目標檢測的功能。網(wǎng)絡(luò)中各類層用可微函數(shù)將激活數(shù)據(jù)從前一層傳到后一層,輸出模型參數(shù)和計算復(fù)雜度會受卷積核大小、池化層策略等的影響。卷積神經(jīng)網(wǎng)絡(luò)是針對二維形狀進行識別而特殊設(shè)計的神經(jīng)網(wǎng)絡(luò),憑借獨特的局部連接和權(quán)值共享方式被成功應(yīng)用于計算機視覺的各個領(lǐng)域,除此之外,還具有良好的平移、縮放及扭曲不變性,這些特性能夠大大減少網(wǎng)絡(luò)中的訓(xùn)練參數(shù)。卷積神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu)圖如圖 2-1 所示,通過該網(wǎng)絡(luò)最終輸出 10 個尺度大小為 5×5 的特征圖。網(wǎng)絡(luò)受局部感受野概念的啟發(fā)來模擬特征區(qū)分,并通過共享權(quán)值的卷積和池化來降低網(wǎng)絡(luò)參數(shù)的數(shù)量級,最終通過傳統(tǒng)神經(jīng)網(wǎng)絡(luò)完成檢測分類等任務(wù)。
【學(xué)位授予單位】:河南大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2019
【分類號】:TP391.41;TP183
【參考文獻】
相關(guān)期刊論文 前1條
1 魏穎,佟國峰,史澤林,于海斌;一種基于多尺度分形新特征的目標檢測方法[J];東北大學(xué)學(xué)報;2005年11期
本文編號:2639700
本文鏈接:http://sikaile.net/kejilunwen/zidonghuakongzhilunwen/2639700.html
最近更新
教材專著