基于深度神經(jīng)網(wǎng)絡(luò)的行人車輛檢測(cè)算法研究
發(fā)布時(shí)間:2021-12-23 05:24
行人車輛檢測(cè)在自動(dòng)駕駛、增強(qiáng)現(xiàn)實(shí)、智慧安防、智能交通等諸多領(lǐng)域都有著廣泛的應(yīng)用,近年來受到學(xué)術(shù)界和工業(yè)界越來越多的關(guān)注。針對(duì)這一問題研究者們提出了很多有效的方法,但由于實(shí)際場(chǎng)景中經(jīng)常出現(xiàn)光照變化、尺度變化、部分遮擋等不可控因素,行人車輛檢測(cè)仍然是一個(gè)很有挑戰(zhàn)性的問題,在精度上還有待提升,而且現(xiàn)有的方法模型復(fù)雜度普遍較高,速度上也無法滿足實(shí)際應(yīng)用的需求。本文對(duì)行人車輛檢測(cè)進(jìn)行了系統(tǒng)的分析和研究,改進(jìn)和優(yōu)化了現(xiàn)有的模型,提升了檢測(cè)的精度和速度。本文的主要工作如下:(1)提出了一個(gè)端到端的分層全卷積神經(jīng)網(wǎng)絡(luò)——EFCN。為了降低模型前向傳播的計(jì)算量,EFCN采用輕量級(jí)的深度神經(jīng)網(wǎng)絡(luò)MobileNet作為基網(wǎng)絡(luò)。同時(shí),為了解決實(shí)際場(chǎng)景中目標(biāo)尺寸變化大的問題,EFCN使用同一個(gè)網(wǎng)絡(luò)中不同分辨率的網(wǎng)絡(luò)層對(duì)輸入圖像中不同大小的目標(biāo)進(jìn)行檢測(cè),并且在每一個(gè)預(yù)測(cè)層的頂端增加了一個(gè)優(yōu)化模塊,優(yōu)化模塊通過反卷積和跳躍連接將深度神經(jīng)網(wǎng)絡(luò)中包含目標(biāo)細(xì)節(jié)的高分辨率特征層和包含目標(biāo)高級(jí)語(yǔ)義信息的低分辨率特征層進(jìn)行調(diào)制融合,構(gòu)造出了對(duì)行人車輛具有魯棒性的特征表達(dá)。本文在KITTI數(shù)據(jù)集上評(píng)測(cè)了 EFCN算法的性能,并且...
【文章來源】:中國(guó)科學(xué)院大學(xué)(中國(guó)科學(xué)院重慶綠色智能技術(shù)研究院)重慶市
【文章頁(yè)數(shù)】:62 頁(yè)
【學(xué)位級(jí)別】:碩士
【部分圖文】:
圖1.1?DPM算法結(jié)構(gòu)示意圖間??Figure?1.1?The?schematic?diagram?of?DPM1111??隨后,研究者們開始了對(duì)于各種特征提取方法的比較,發(fā)現(xiàn)這些特征在不同的??
就是inside-network。依靠這兩個(gè)改進(jìn),ION[34]在Pascal?VOC?2007[36]數(shù)據(jù)集上的??mZP值大約提高了?5個(gè)百分點(diǎn),同時(shí)也獲得了?COCO?2015?detection^37]競(jìng)賽的Best??Student?Entry。ION[34]的網(wǎng)絡(luò)結(jié)構(gòu)如圖2.1所示。??4-dir?4-dir?context??convl?conv2?conv3?conv4?conv5?,RNN?|RNN?features??ROI?Pnolino?????QiQiQlQi?n?yf?Q?softmax??L2?nomiafeeW/4?—srUrl^〇bb〇x??concat?conv?For?each?ROI??圖2.1?ION網(wǎng)絡(luò)結(jié)構(gòu)示意圖Ml??Figure?2.1?Inside-Outside?Net?(ION)[34]??HyperNet[35]的出發(fā)點(diǎn)基于一個(gè)很重要的觀察:神經(jīng)網(wǎng)絡(luò)的高層特征具有更強(qiáng)??的語(yǔ)義信息,對(duì)于識(shí)別問題有效;而底層的特征由于分辨率較高,能夠更好地對(duì)目??標(biāo)進(jìn)行定位。由于目標(biāo)檢測(cè)既需要識(shí)別又需要定位,作者于是將神經(jīng)網(wǎng)絡(luò)的高中低??層進(jìn)行融合,然后利用融合后的特征進(jìn)行候選區(qū)域的提取和進(jìn)一步的目標(biāo)檢測(cè)。依??靠以上的改進(jìn),HyperNett?梢栽谥划a(chǎn)生大約100個(gè)候選區(qū)域的時(shí)候保證較高的??召回率,同時(shí)目標(biāo)檢測(cè)的值相對(duì)于Fast?R-CNNW也提高了大約6個(gè)百分點(diǎn)。??(2)定位準(zhǔn)確性??定位準(zhǔn)確性
需要定義網(wǎng)絡(luò)結(jié)構(gòu)、回歸方式等。最后將經(jīng)過回歸的候選框放入到Fast??R-CNN間中進(jìn)行檢測(cè),在/Ot/?=?0.5時(shí),在PascalVOC[36]數(shù)據(jù)上m處可以提升大約??5個(gè)百分點(diǎn),而/0t/?=?〇.7時(shí)可以提升13個(gè)百分點(diǎn)。LocNet[38]網(wǎng)絡(luò)結(jié)構(gòu)圖如圖2.3??所示。??為了提局定位準(zhǔn)確性,RRC[39]將?RNN?(Recurrent?Neural?Network)的一些思??想融入到了目標(biāo)檢測(cè)當(dāng)中。當(dāng)我們?cè)谀繕?biāo)位置回歸的時(shí)候,一定是需要一些有用的??底層信息的,但是并不是所有的底層信息都有用,那這些有用的底層信息如何通過??一定的方式傳遞到后面的決策層呢??RRC[39]發(fā)現(xiàn)當(dāng)利用當(dāng)前層進(jìn)行預(yù)測(cè)的時(shí)候,??實(shí)際上和它的上一層和下一層的信息都是有關(guān)的,于是提出了一個(gè)Recurrent??Rolling?Convolution來漸進(jìn)地完成尋找合適的底層信息的任務(wù)。通過這個(gè)改進(jìn)策略,??狀<:[39]在KITTI[21繳據(jù)集上的Hard水平上的檢測(cè)效果得到了明顯提升。RRC間的??網(wǎng)絡(luò)結(jié)構(gòu)圖如圖2.2所示。????^?Can-?1x1x19??、、、?Conv.?1x1x19?V、?Mas?Pooling?ccovS?2?????■'?MaxPoolms?^ ̄Coa\t?1x1x19??47?七一訓(xùn)—,??conv4?3?!?24?
本文編號(hào):3547870
【文章來源】:中國(guó)科學(xué)院大學(xué)(中國(guó)科學(xué)院重慶綠色智能技術(shù)研究院)重慶市
【文章頁(yè)數(shù)】:62 頁(yè)
【學(xué)位級(jí)別】:碩士
【部分圖文】:
圖1.1?DPM算法結(jié)構(gòu)示意圖間??Figure?1.1?The?schematic?diagram?of?DPM1111??隨后,研究者們開始了對(duì)于各種特征提取方法的比較,發(fā)現(xiàn)這些特征在不同的??
就是inside-network。依靠這兩個(gè)改進(jìn),ION[34]在Pascal?VOC?2007[36]數(shù)據(jù)集上的??mZP值大約提高了?5個(gè)百分點(diǎn),同時(shí)也獲得了?COCO?2015?detection^37]競(jìng)賽的Best??Student?Entry。ION[34]的網(wǎng)絡(luò)結(jié)構(gòu)如圖2.1所示。??4-dir?4-dir?context??convl?conv2?conv3?conv4?conv5?,RNN?|RNN?features??ROI?Pnolino?????QiQiQlQi?n?yf?Q?softmax??L2?nomiafeeW/4?—srUrl^〇bb〇x??concat?conv?For?each?ROI??圖2.1?ION網(wǎng)絡(luò)結(jié)構(gòu)示意圖Ml??Figure?2.1?Inside-Outside?Net?(ION)[34]??HyperNet[35]的出發(fā)點(diǎn)基于一個(gè)很重要的觀察:神經(jīng)網(wǎng)絡(luò)的高層特征具有更強(qiáng)??的語(yǔ)義信息,對(duì)于識(shí)別問題有效;而底層的特征由于分辨率較高,能夠更好地對(duì)目??標(biāo)進(jìn)行定位。由于目標(biāo)檢測(cè)既需要識(shí)別又需要定位,作者于是將神經(jīng)網(wǎng)絡(luò)的高中低??層進(jìn)行融合,然后利用融合后的特征進(jìn)行候選區(qū)域的提取和進(jìn)一步的目標(biāo)檢測(cè)。依??靠以上的改進(jìn),HyperNett?梢栽谥划a(chǎn)生大約100個(gè)候選區(qū)域的時(shí)候保證較高的??召回率,同時(shí)目標(biāo)檢測(cè)的值相對(duì)于Fast?R-CNNW也提高了大約6個(gè)百分點(diǎn)。??(2)定位準(zhǔn)確性??定位準(zhǔn)確性
需要定義網(wǎng)絡(luò)結(jié)構(gòu)、回歸方式等。最后將經(jīng)過回歸的候選框放入到Fast??R-CNN間中進(jìn)行檢測(cè),在/Ot/?=?0.5時(shí),在PascalVOC[36]數(shù)據(jù)上m處可以提升大約??5個(gè)百分點(diǎn),而/0t/?=?〇.7時(shí)可以提升13個(gè)百分點(diǎn)。LocNet[38]網(wǎng)絡(luò)結(jié)構(gòu)圖如圖2.3??所示。??為了提局定位準(zhǔn)確性,RRC[39]將?RNN?(Recurrent?Neural?Network)的一些思??想融入到了目標(biāo)檢測(cè)當(dāng)中。當(dāng)我們?cè)谀繕?biāo)位置回歸的時(shí)候,一定是需要一些有用的??底層信息的,但是并不是所有的底層信息都有用,那這些有用的底層信息如何通過??一定的方式傳遞到后面的決策層呢??RRC[39]發(fā)現(xiàn)當(dāng)利用當(dāng)前層進(jìn)行預(yù)測(cè)的時(shí)候,??實(shí)際上和它的上一層和下一層的信息都是有關(guān)的,于是提出了一個(gè)Recurrent??Rolling?Convolution來漸進(jìn)地完成尋找合適的底層信息的任務(wù)。通過這個(gè)改進(jìn)策略,??狀<:[39]在KITTI[21繳據(jù)集上的Hard水平上的檢測(cè)效果得到了明顯提升。RRC間的??網(wǎng)絡(luò)結(jié)構(gòu)圖如圖2.2所示。????^?Can-?1x1x19??、、、?Conv.?1x1x19?V、?Mas?Pooling?ccovS?2?????■'?MaxPoolms?^ ̄Coa\t?1x1x19??47?七一訓(xùn)—,??conv4?3?!?24?
本文編號(hào):3547870
本文鏈接:http://sikaile.net/kejilunwen/zidonghuakongzhilunwen/3547870.html
最近更新
教材專著