基于深度學(xué)習(xí)目標(biāo)檢測(cè)方法研究
發(fā)布時(shí)間:2020-12-24 14:47
我國(guó)作為人口大國(guó),隨著人們生活水平的提高,車輛的增加也越來(lái)越明顯,隨之帶來(lái)了交通的安全隱患,所以需要對(duì)出行的車輛進(jìn)行監(jiān)控。對(duì)于人類的視覺(jué)來(lái)說(shuō),我們能夠很容易的識(shí)別出一幅圖像中所包含的物體的種類和物體所在的位置,但對(duì)于計(jì)算機(jī)來(lái)說(shuō),檢測(cè)和識(shí)別出圖像中的物體與位置具有很大的挑戰(zhàn)性。本文通過(guò)以車輛圖像作為研究對(duì)象,檢測(cè)出圖像中車輛的位置信息,以達(dá)到對(duì)圖像中車輛監(jiān)控的目的。對(duì)于傳統(tǒng)的目標(biāo)檢測(cè)方法大致可以分為四個(gè)步驟:圖像預(yù)處理、目標(biāo)區(qū)域選擇、特征提取和分類器分類。對(duì)于目標(biāo)區(qū)域的選擇,傳統(tǒng)的方法是通過(guò)滑動(dòng)窗口的區(qū)域選擇策略,時(shí)間和空間復(fù)雜度都比較高,在特征提取方面,是通過(guò)人工的方式設(shè)計(jì)目標(biāo)的特征,有著工程時(shí)間長(zhǎng)且魯棒性較差等特點(diǎn)。隨著深度學(xué)習(xí)的發(fā)展,通過(guò)卷積神經(jīng)網(wǎng)絡(luò)能夠高效的提取圖像的高維特征,如今在圖像檢測(cè)與識(shí)別的方法中,深度學(xué)習(xí)已成為最流行且最實(shí)用的。本文通過(guò)分析Faster R-CNN算法和YOLOV3算法,借鑒深度學(xué)習(xí)的理論技術(shù),提出相應(yīng)的改進(jìn)策略,以實(shí)現(xiàn)對(duì)車輛圖像的識(shí)別檢測(cè),本文主要的工作如下:(1)本文通過(guò)改進(jìn)Faster R-CNN算法對(duì)建立數(shù)據(jù)庫(kù)圖像進(jìn)行學(xué)習(xí),通過(guò)采用K-Means...
【文章來(lái)源】:閩南師范大學(xué)福建省
【文章頁(yè)數(shù)】:87 頁(yè)
【學(xué)位級(jí)別】:碩士
【部分圖文】:
傳統(tǒng)目標(biāo)檢測(cè)算法四個(gè)階段
閩南師范大學(xué)工學(xué)碩士學(xué)位論文12操作中最重要的一個(gè)要素就是卷積核,在一個(gè)卷積中往往包含卷積核的個(gè)數(shù)、卷積核大小Size、卷積步長(zhǎng)Stride以及所要填充的大小Padding等重要因素。實(shí)現(xiàn)卷積操作方法如圖2.1所示:圖2.1卷積操作運(yùn)算方式在圖中使用的是一個(gè)33的卷積核,且步長(zhǎng)為1,通過(guò)SamePadding的方式,使得卷積后的大小與輸入時(shí)的大小一致,將滑窗所覆蓋的圖像數(shù)據(jù)與卷積核上對(duì)應(yīng)位置的數(shù)據(jù)首先進(jìn)行對(duì)應(yīng)的相乘然后在相加,得出卷積后的結(jié)果。使用卷積操作通常會(huì)造成圖像的一些邊界信息丟失的問(wèn)題,通過(guò)在卷積操作中使用增加Padding能夠解決信息丟失的問(wèn)題,Padding操作分為3種方式SamePadding、ValidPadding、CustomPadding。使用SamePadding進(jìn)行卷積也稱為同卷積,可以得到與輸入圖像特征大小一致的結(jié)果,通過(guò)利用卷積中卷積核大小Size來(lái)對(duì)圖像中的矩陣信息里進(jìn)行邊界填充操作。ValidPadding是直接對(duì)原始圖像數(shù)據(jù)進(jìn)行卷積,沒(méi)有進(jìn)行填充因此得到的特征圖會(huì)比原先的輸入圖像要小,自定義的Padding得到的特征圖大小由如下公式所得:1/)ker2(1/)ker2(stridenelpaddinginputoutputstridenelpaddinginputoutputwwwwhhhh(2.1)其中,output為輸出圖像矩陣信息大小,input為輸入圖像矩陣信息大小,padding為填充邊
池化層的作用是通過(guò)將圖像的特征進(jìn)行稀疏參數(shù)來(lái)減少網(wǎng)絡(luò)模型中需要學(xué)習(xí)的參數(shù),通過(guò)池化層的降維操作可以有效的降低網(wǎng)絡(luò)模型的復(fù)雜度,其中池化層的計(jì)算過(guò)程與卷積層類似。常見(jiàn)的一些池化方法包括最大池化 Max pooling、平均池化 Mean pooling和隨機(jī)池化 3 種方式。采用最大池化的方法就是將 Pooling 窗口中滑窗所覆蓋所有最大的特征值數(shù)據(jù)進(jìn)行輸出,平均池化方法是將 Pooling 窗口中滑窗所覆蓋的均值作為輸出,隨機(jī)池化則是從滑窗覆蓋的 Pooling 窗口元素中隨機(jī)選擇一個(gè)作為輸出,三種方式的計(jì)算如圖 2.2 所示:
本文編號(hào):2935841
【文章來(lái)源】:閩南師范大學(xué)福建省
【文章頁(yè)數(shù)】:87 頁(yè)
【學(xué)位級(jí)別】:碩士
【部分圖文】:
傳統(tǒng)目標(biāo)檢測(cè)算法四個(gè)階段
閩南師范大學(xué)工學(xué)碩士學(xué)位論文12操作中最重要的一個(gè)要素就是卷積核,在一個(gè)卷積中往往包含卷積核的個(gè)數(shù)、卷積核大小Size、卷積步長(zhǎng)Stride以及所要填充的大小Padding等重要因素。實(shí)現(xiàn)卷積操作方法如圖2.1所示:圖2.1卷積操作運(yùn)算方式在圖中使用的是一個(gè)33的卷積核,且步長(zhǎng)為1,通過(guò)SamePadding的方式,使得卷積后的大小與輸入時(shí)的大小一致,將滑窗所覆蓋的圖像數(shù)據(jù)與卷積核上對(duì)應(yīng)位置的數(shù)據(jù)首先進(jìn)行對(duì)應(yīng)的相乘然后在相加,得出卷積后的結(jié)果。使用卷積操作通常會(huì)造成圖像的一些邊界信息丟失的問(wèn)題,通過(guò)在卷積操作中使用增加Padding能夠解決信息丟失的問(wèn)題,Padding操作分為3種方式SamePadding、ValidPadding、CustomPadding。使用SamePadding進(jìn)行卷積也稱為同卷積,可以得到與輸入圖像特征大小一致的結(jié)果,通過(guò)利用卷積中卷積核大小Size來(lái)對(duì)圖像中的矩陣信息里進(jìn)行邊界填充操作。ValidPadding是直接對(duì)原始圖像數(shù)據(jù)進(jìn)行卷積,沒(méi)有進(jìn)行填充因此得到的特征圖會(huì)比原先的輸入圖像要小,自定義的Padding得到的特征圖大小由如下公式所得:1/)ker2(1/)ker2(stridenelpaddinginputoutputstridenelpaddinginputoutputwwwwhhhh(2.1)其中,output為輸出圖像矩陣信息大小,input為輸入圖像矩陣信息大小,padding為填充邊
池化層的作用是通過(guò)將圖像的特征進(jìn)行稀疏參數(shù)來(lái)減少網(wǎng)絡(luò)模型中需要學(xué)習(xí)的參數(shù),通過(guò)池化層的降維操作可以有效的降低網(wǎng)絡(luò)模型的復(fù)雜度,其中池化層的計(jì)算過(guò)程與卷積層類似。常見(jiàn)的一些池化方法包括最大池化 Max pooling、平均池化 Mean pooling和隨機(jī)池化 3 種方式。采用最大池化的方法就是將 Pooling 窗口中滑窗所覆蓋所有最大的特征值數(shù)據(jù)進(jìn)行輸出,平均池化方法是將 Pooling 窗口中滑窗所覆蓋的均值作為輸出,隨機(jī)池化則是從滑窗覆蓋的 Pooling 窗口元素中隨機(jī)選擇一個(gè)作為輸出,三種方式的計(jì)算如圖 2.2 所示:
本文編號(hào):2935841
本文鏈接:http://sikaile.net/kejilunwen/zidonghuakongzhilunwen/2935841.html
最近更新
教材專著