基于Faster RCNN的道路車輛檢測(cè)算法研究
發(fā)布時(shí)間:2021-03-26 06:36
基于視覺的車輛檢測(cè),即利用某種目標(biāo)檢測(cè)算法對(duì)圖像或者視頻中潛在的車輛目標(biāo)進(jìn)行定位和識(shí)別,是視覺目標(biāo)檢測(cè)領(lǐng)域的一個(gè)重要研究課題。過往數(shù)十年的研究已經(jīng)取得了重要的進(jìn)展,然而在面對(duì)真實(shí)交通環(huán)境的各種復(fù)雜場(chǎng)景時(shí),基于視覺的行人和車輛檢測(cè)系統(tǒng)的表現(xiàn)仍然無法滿足實(shí)際的要求。近年來,深度學(xué)習(xí)領(lǐng)域有了非常大的研究進(jìn)展,尤其是深度卷積神經(jīng)網(wǎng)絡(luò)在圖像識(shí)別、目標(biāo)檢測(cè)、語義分割等計(jì)算機(jī)視覺領(lǐng)域表現(xiàn)出了遠(yuǎn)超傳統(tǒng)算法的優(yōu)勢(shì),基于深度卷積神經(jīng)網(wǎng)絡(luò)的行人和車輛檢測(cè)也逐漸成為了自動(dòng)駕駛技術(shù)、智能交通系統(tǒng)等領(lǐng)域的研究新潮流,受到了學(xué)界以及工業(yè)界的高度重視。本文基于深度卷積神經(jīng)網(wǎng)絡(luò)在相關(guān)的開源數(shù)據(jù)集上開展行人和車輛檢測(cè)的研究工作,主要內(nèi)容包括:(1)總結(jié)前人已有的車輛檢測(cè)成果,主要是傳統(tǒng)的目標(biāo)檢測(cè)算法和基于深度卷積神經(jīng)網(wǎng)絡(luò)的目標(biāo)檢測(cè)算法,并詳細(xì)分析Faster RCNN的檢測(cè)原理;(2)基于車輛標(biāo)簽中的高度屬性的統(tǒng)計(jì)結(jié)果設(shè)計(jì)了一種類似于傳統(tǒng)的K-Means聚類的錨點(diǎn)參數(shù)生成策略,每一個(gè)標(biāo)簽只統(tǒng)計(jì)與之歐氏距離最近的四個(gè)中心點(diǎn)所對(duì)應(yīng)的錨點(diǎn)的尺寸;(3)詳細(xì)對(duì)比了殘差網(wǎng)絡(luò)和谷歌網(wǎng)絡(luò)模型在特征融合環(huán)節(jié)的區(qū)別,并在殘差網(wǎng)絡(luò)的基礎(chǔ)上結(jié)...
【文章來源】:南京航空航天大學(xué)江蘇省 211工程院校
【文章頁數(shù)】:72 頁
【學(xué)位級(jí)別】:碩士
【部分圖文】:
某型自動(dòng)駕駛車輛環(huán)境感知模塊示意圖
圖 2. 1 圖像金字塔示意圖文獻(xiàn)[53]證明了除高斯核函數(shù)以外的核會(huì)對(duì)圖像造成除模糊以外的其他影響。因此,SI用了二維的高斯核函數(shù)使圖像平滑,同時(shí)免除了圖像除模糊以外其他的變化。假設(shè)一幅單圖像,SIFT 對(duì)于該圖像的尺度空間的構(gòu)建方法如公式 2.12 2 2( )/ 22( , , )2( , , ) ( , , ) ( , )x yeG x yL x y G x y I x y (2中, I ( x, y )代表降采樣后的圖像或者原始圖像, G ( x, y , )代表高斯核函數(shù), L( x, y , )代表為 時(shí)得到的特征; 的大小決定了圖像的平滑程度,也就對(duì)應(yīng)了圖像的不同的模糊程度了降低運(yùn)算量,SIFT 對(duì)于 進(jìn)行了降采樣處理作為下一個(gè)尺度的輸入圖像,同時(shí) 需要相應(yīng)地增大。2)關(guān)鍵點(diǎn)提取為了得到尺度不變性的特征,SIFT 對(duì)于上述生成的尺度空間使用了二階拉普拉斯算子求值點(diǎn),但是直接二階拉普拉斯算子處理的運(yùn)算量極大,SIFT 使用了近似處理,如公式 2.22 22G G
以期模型的性能可以再度提升者們普遍觀察到模型的性能反而出現(xiàn)了下降 等機(jī)器學(xué)習(xí)方法開展得如火如荼,開源的大沒能普及,種種因素使得卷積神經(jīng)網(wǎng)絡(luò)的發(fā)展U 等硬件設(shè)備的計(jì)算能力逐漸攀升,大規(guī)模ton 教授提出了經(jīng)典的 AlexNet 模型。的層數(shù)過深帶來的梯度消失的問題在 AlexN的 sigmoid 變成 ReLu,如公式 2.8, 00, 0x xyx 活函數(shù)改善了多個(gè) sigmoid 函數(shù)的導(dǎo)數(shù)想乘的梯度值也可以參與到網(wǎng)絡(luò)參數(shù)的調(diào)整中來函數(shù)的有效性。新的歸一化方法防止過擬合,主要包括:(1制。其中局部響應(yīng)歸一化的操作如圖 2.2 所示
【參考文獻(xiàn)】:
期刊論文
[1]基于BOOSTING框架的視覺語音多模態(tài)情感識(shí)別檢測(cè)方法[J]. 張芬. 現(xiàn)代電子技術(shù). 2017(23)
[2]運(yùn)用開端神經(jīng)網(wǎng)絡(luò)進(jìn)行人體姿態(tài)識(shí)別[J]. 柴鐸,徐誠,何杰,張少陽,段世紅,齊悅. 通信學(xué)報(bào). 2017(S2)
[3]基于BING和數(shù)據(jù)融合的行人檢測(cè)算法研究[J]. 程剛,張治國. 計(jì)算機(jī)與數(shù)字工程. 2016(01)
[4]基于后驗(yàn)HOG特征的多姿態(tài)行人檢測(cè)[J]. 劉威,段成偉,遇冰,柴麗穎,袁淮,趙宏. 電子學(xué)報(bào). 2015(02)
[5]基于DPM模型的行人檢測(cè)技術(shù)的研究[J]. 熊聰,王文武. 電子設(shè)計(jì)工程. 2014(23)
[6]基于K-means算法的行人檢測(cè)方法研究[J]. 游峰,張榮輝,李福樑,馮瓊瑩,徐建閩. 公路交通科技. 2014(07)
[7]基于支持向量機(jī)的目標(biāo)檢測(cè)算法綜述[J]. 郭明瑋,趙宇宙,項(xiàng)俊平,張陳斌,陳宗海. 控制與決策. 2014(02)
[8]基于顯著性檢測(cè)與HOG-NMF特征的快速行人檢測(cè)方法[J]. 孫銳,陳軍,高雋. 電子與信息學(xué)報(bào). 2013(08)
[9]決策樹分類算法研究[J]. 張琳,陳燕,李桃迎,牟向偉. 計(jì)算機(jī)工程. 2011(13)
[10]一種基于K-Means分類的狀態(tài)機(jī)車輛檢測(cè)算法[J]. 曹喆,聞?dòng)?潘霓,劉泓. 工業(yè)控制計(jì)算機(jī). 2010(01)
本文編號(hào):3101142
【文章來源】:南京航空航天大學(xué)江蘇省 211工程院校
【文章頁數(shù)】:72 頁
【學(xué)位級(jí)別】:碩士
【部分圖文】:
某型自動(dòng)駕駛車輛環(huán)境感知模塊示意圖
圖 2. 1 圖像金字塔示意圖文獻(xiàn)[53]證明了除高斯核函數(shù)以外的核會(huì)對(duì)圖像造成除模糊以外的其他影響。因此,SI用了二維的高斯核函數(shù)使圖像平滑,同時(shí)免除了圖像除模糊以外其他的變化。假設(shè)一幅單圖像,SIFT 對(duì)于該圖像的尺度空間的構(gòu)建方法如公式 2.12 2 2( )/ 22( , , )2( , , ) ( , , ) ( , )x yeG x yL x y G x y I x y (2中, I ( x, y )代表降采樣后的圖像或者原始圖像, G ( x, y , )代表高斯核函數(shù), L( x, y , )代表為 時(shí)得到的特征; 的大小決定了圖像的平滑程度,也就對(duì)應(yīng)了圖像的不同的模糊程度了降低運(yùn)算量,SIFT 對(duì)于 進(jìn)行了降采樣處理作為下一個(gè)尺度的輸入圖像,同時(shí) 需要相應(yīng)地增大。2)關(guān)鍵點(diǎn)提取為了得到尺度不變性的特征,SIFT 對(duì)于上述生成的尺度空間使用了二階拉普拉斯算子求值點(diǎn),但是直接二階拉普拉斯算子處理的運(yùn)算量極大,SIFT 使用了近似處理,如公式 2.22 22G G
以期模型的性能可以再度提升者們普遍觀察到模型的性能反而出現(xiàn)了下降 等機(jī)器學(xué)習(xí)方法開展得如火如荼,開源的大沒能普及,種種因素使得卷積神經(jīng)網(wǎng)絡(luò)的發(fā)展U 等硬件設(shè)備的計(jì)算能力逐漸攀升,大規(guī)模ton 教授提出了經(jīng)典的 AlexNet 模型。的層數(shù)過深帶來的梯度消失的問題在 AlexN的 sigmoid 變成 ReLu,如公式 2.8, 00, 0x xyx 活函數(shù)改善了多個(gè) sigmoid 函數(shù)的導(dǎo)數(shù)想乘的梯度值也可以參與到網(wǎng)絡(luò)參數(shù)的調(diào)整中來函數(shù)的有效性。新的歸一化方法防止過擬合,主要包括:(1制。其中局部響應(yīng)歸一化的操作如圖 2.2 所示
【參考文獻(xiàn)】:
期刊論文
[1]基于BOOSTING框架的視覺語音多模態(tài)情感識(shí)別檢測(cè)方法[J]. 張芬. 現(xiàn)代電子技術(shù). 2017(23)
[2]運(yùn)用開端神經(jīng)網(wǎng)絡(luò)進(jìn)行人體姿態(tài)識(shí)別[J]. 柴鐸,徐誠,何杰,張少陽,段世紅,齊悅. 通信學(xué)報(bào). 2017(S2)
[3]基于BING和數(shù)據(jù)融合的行人檢測(cè)算法研究[J]. 程剛,張治國. 計(jì)算機(jī)與數(shù)字工程. 2016(01)
[4]基于后驗(yàn)HOG特征的多姿態(tài)行人檢測(cè)[J]. 劉威,段成偉,遇冰,柴麗穎,袁淮,趙宏. 電子學(xué)報(bào). 2015(02)
[5]基于DPM模型的行人檢測(cè)技術(shù)的研究[J]. 熊聰,王文武. 電子設(shè)計(jì)工程. 2014(23)
[6]基于K-means算法的行人檢測(cè)方法研究[J]. 游峰,張榮輝,李福樑,馮瓊瑩,徐建閩. 公路交通科技. 2014(07)
[7]基于支持向量機(jī)的目標(biāo)檢測(cè)算法綜述[J]. 郭明瑋,趙宇宙,項(xiàng)俊平,張陳斌,陳宗海. 控制與決策. 2014(02)
[8]基于顯著性檢測(cè)與HOG-NMF特征的快速行人檢測(cè)方法[J]. 孫銳,陳軍,高雋. 電子與信息學(xué)報(bào). 2013(08)
[9]決策樹分類算法研究[J]. 張琳,陳燕,李桃迎,牟向偉. 計(jì)算機(jī)工程. 2011(13)
[10]一種基于K-Means分類的狀態(tài)機(jī)車輛檢測(cè)算法[J]. 曹喆,聞?dòng)?潘霓,劉泓. 工業(yè)控制計(jì)算機(jī). 2010(01)
本文編號(hào):3101142
本文鏈接:http://sikaile.net/kejilunwen/jiaotonggongchenglunwen/3101142.html
最近更新
教材專著