基于卷積神經(jīng)網(wǎng)絡(luò)的車輛細粒度分類算法研究
發(fā)布時間:2024-05-21 18:28
隨著智能交通系統(tǒng)的快速發(fā)展,基于圖像的車輛分類越來越受到研究人員的重視。本文主要針對自然場景中的車輛圖像進行細粒度分類研究,該類圖像的特點是背景復(fù)雜多變且拍攝角度也不固定,車輛本身存在較高的類內(nèi)差異和較低的類間差異。傳統(tǒng)的圖像特征分類方法有基于HOG特征的、有基于SIFT特征的等等,這些特征都是由人工設(shè)計的,特征的提取過程較為繁瑣,且有些圖像特征是根據(jù)特定場景設(shè)計的,不具有普適性。近年來隨著深度學(xué)習(xí)的普及,作為深度學(xué)習(xí)的一個分支,卷積神經(jīng)網(wǎng)絡(luò)因其避免了人工設(shè)計特征而在圖像分類領(lǐng)域獲得了廣泛的應(yīng)用。本文利用卷積神經(jīng)網(wǎng)絡(luò)的優(yōu)勢提出了一種基于卷積神經(jīng)網(wǎng)絡(luò)的車輛細粒度分類算法來提高自然場景下的車輛圖像的分類準(zhǔn)確率。本文首先介紹了卷積神經(jīng)網(wǎng)絡(luò)的基本理論,包括了卷積神經(jīng)網(wǎng)絡(luò)的發(fā)展歷史和卷積神經(jīng)網(wǎng)絡(luò)基本結(jié)構(gòu),并介紹了兩種常見的分類模型:Softmax分類器和SVM分類器;其次,針對傳統(tǒng)的SIFT特征在自然場景下的車輛圖像分類存在的分類精度低的問題,提出了一種融合FV-SIFT特征和深度卷積特征的車輛細粒度分類算法,該方法通過將車輛圖像的FV-SIFT特征和VGG-16深度卷積特征進行組合并采用一種基...
【文章頁數(shù)】:84 頁
【學(xué)位級別】:碩士
【部分圖文】:
本文編號:3979754
【文章頁數(shù)】:84 頁
【學(xué)位級別】:碩士
【部分圖文】:
圖2.1LeNet卷積神經(jīng)網(wǎng)絡(luò)處理手寫字符示意圖
神經(jīng)網(wǎng)絡(luò)的概念首次由國外的神經(jīng)科學(xué)家DavidH.Hubel和TorstenWiesel于上世紀(jì)60年代提出,他們在對貓的視覺系統(tǒng)進行研究時發(fā)現(xiàn)了貓的視覺系統(tǒng)具有感受野這一功能結(jié)構(gòu),即神經(jīng)網(wǎng)絡(luò)。之后,KunihikoFukushima在DavidH.Hubel和....
圖2.3二維場景下的輸入圖像和卷積核
圖2.3二維場景下的輸入圖像和卷積核次卷積操作及得到的特征(b)第二次卷積操作及得次卷積操作及得到的特征(d)第九次卷積操作及得
圖2.4二維場景下的卷積操作示意圖
10圖2.4二維場景下的卷積操作示意圖由于卷積神經(jīng)網(wǎng)絡(luò)的各個層之間輸入都是三維的,即在包含了寬度W和高度H情況下又包含了通道數(shù)C,因此對于這種三維場景下的卷積操作可以通過擴展二維場下的卷積操作得到,如式(2-3)所示:111,,,,,,,000llllD....
圖2.5平均值池化操作示意圖
特征圖i+m行第j+n列的元素值;平均值池化核的大小表示為KK×。(2)最大值池化最大值池化通過選取一定大小的池化核對卷積層輸出的特征圖的相應(yīng)位置進行取大值操作得到一個新的特征圖。具體的最大值池化操作如式(2-5)所示:,,,,01,01maxldijd....
本文編號:3979754
本文鏈接:http://sikaile.net/kejilunwen/qiche/3979754.html
最近更新
教材專著