基于深度學(xué)習(xí)的路面障礙目標(biāo)3D檢測(cè)
發(fā)布時(shí)間:2021-08-13 03:41
本文針對(duì)無人駕駛環(huán)境中的路面障礙目標(biāo)3D檢測(cè)問題提出了兩種解決方案:基于單目相機(jī)的3D目標(biāo)檢測(cè)方案與基于單目相機(jī)與激光雷達(dá)相結(jié)合的3D目標(biāo)檢測(cè)方案。這兩種方案都是在2D目標(biāo)檢測(cè)的結(jié)果上進(jìn)行3D包圍框的預(yù)測(cè)。首先,我們以YOLOv3為基礎(chǔ)設(shè)計(jì)了一個(gè)2D目標(biāo)檢測(cè)網(wǎng)絡(luò),并對(duì)損失函數(shù)進(jìn)行改進(jìn),引入了Io U損失的概念。我們?cè)贙ITTI數(shù)據(jù)集對(duì)網(wǎng)絡(luò)進(jìn)行訓(xùn)練和測(cè)試,得到網(wǎng)絡(luò)對(duì)簡單、容易、困難三個(gè)檢測(cè)難度目標(biāo)的m AP分別為0.79、0.67和0.59,且網(wǎng)絡(luò)完成一次預(yù)測(cè)的時(shí)間只有15 ms,證明了我們?cè)O(shè)計(jì)的2D檢測(cè)網(wǎng)絡(luò)在精度與速度兩方面可以滿足后續(xù)的3D目標(biāo)檢測(cè)研究。其次,在單目檢測(cè)算法的設(shè)計(jì)中,我們以VGG16作為特征提取器,設(shè)計(jì)了一個(gè)可以預(yù)測(cè)目標(biāo)局部偏角和尺寸偏差的卷積神經(jīng)網(wǎng)絡(luò),然后通過2D box與3D box間的幾何約束來預(yù)測(cè)出完整的3D box。我們對(duì)算法在KITTI數(shù)據(jù)集上的測(cè)試結(jié)果進(jìn)行分析,提出了一種校正網(wǎng)絡(luò)來幫助網(wǎng)絡(luò)更準(zhǔn)確的定位3D box,最終得到了最大AP值27.3,最快檢測(cè)速度23 ms的優(yōu)秀成績。然后,在單目+激光雷達(dá)聯(lián)合的檢測(cè)算法的設(shè)計(jì)中,我們利用相機(jī)-雷達(dá)投影變換得到2...
【文章來源】:哈爾濱工業(yè)大學(xué)黑龍江省 211工程院校 985工程院校
【文章頁數(shù)】:70 頁
【學(xué)位級(jí)別】:碩士
【部分圖文】:
二維目標(biāo)檢測(cè)與三維目標(biāo)檢測(cè)3
第2章基于卷積神經(jīng)網(wǎng)絡(luò)的目標(biāo)檢測(cè)算法研究8第2章基于卷積神經(jīng)網(wǎng)絡(luò)的目標(biāo)檢測(cè)算法研究2.1引言在深度學(xué)習(xí)得到快速發(fā)展之前,目標(biāo)檢測(cè)大多是基于傳統(tǒng)圖像處理和機(jī)器學(xué)習(xí)算法來研究的,用來識(shí)別目標(biāo)的特征都是認(rèn)為設(shè)計(jì)的,例如SIFT(尺度不變特征),HOG(方向梯度直方圖特征),SURF(加速穩(wěn)健特征)等[21]。與傳統(tǒng)方法相比,深度學(xué)習(xí)己經(jīng)被證明在計(jì)算機(jī)視覺和語音識(shí)別方面效果更加顯著且擁有更高的普適性,已經(jīng)成為了計(jì)算機(jī)視覺和語音識(shí)別領(lǐng)域的主流算法。在目標(biāo)檢測(cè)領(lǐng)域,主要應(yīng)用到的深度神經(jīng)網(wǎng)絡(luò)模型是CNN(卷積神經(jīng)網(wǎng)絡(luò)),主要步驟是:首先對(duì)圖像進(jìn)行深度特征提取,然后基于深度神經(jīng)網(wǎng)絡(luò)完成目標(biāo)的識(shí)別與定位。本章重點(diǎn)介紹了卷積神經(jīng)網(wǎng)絡(luò)的原理、基于卷積神經(jīng)網(wǎng)絡(luò)的目標(biāo)檢測(cè)算法在2D目標(biāo)檢測(cè)領(lǐng)域和3D目標(biāo)檢測(cè)領(lǐng)域的主流算法以及研究需要用到的基礎(chǔ)知識(shí)。2.2卷積神經(jīng)網(wǎng)絡(luò)基礎(chǔ)2.2.1多層感知機(jī)原理神經(jīng)網(wǎng)絡(luò)的誕生靈感來源于對(duì)生物大腦結(jié)構(gòu)和功能的模仿,它的本質(zhì)是一種模擬人腦神經(jīng)元工作的信息處理系統(tǒng),早在1957年,Rosenblat在文章出了感知機(jī)模型,首次把人工神經(jīng)網(wǎng)絡(luò)的研究從理論探討付諸工程實(shí)踐,引發(fā)了神經(jīng)網(wǎng)絡(luò)的研究浪潮。類比來說,感知機(jī)就相當(dāng)于一個(gè)單獨(dú)的神經(jīng)元結(jié)構(gòu),模型如圖2-1所示。圖2-1感知機(jī)模型圖中xi代表來自第i個(gè)神經(jīng)元的輸入,wi代表當(dāng)前神經(jīng)元與第i個(gè)神經(jīng)元連接的權(quán)重,I是當(dāng)前神經(jīng)元的輸出。神經(jīng)元接收n個(gè)其他神經(jīng)元傳遞過來的輸入
三層感知機(jī)的結(jié)構(gòu)
本文編號(hào):3339668
【文章來源】:哈爾濱工業(yè)大學(xué)黑龍江省 211工程院校 985工程院校
【文章頁數(shù)】:70 頁
【學(xué)位級(jí)別】:碩士
【部分圖文】:
二維目標(biāo)檢測(cè)與三維目標(biāo)檢測(cè)3
第2章基于卷積神經(jīng)網(wǎng)絡(luò)的目標(biāo)檢測(cè)算法研究8第2章基于卷積神經(jīng)網(wǎng)絡(luò)的目標(biāo)檢測(cè)算法研究2.1引言在深度學(xué)習(xí)得到快速發(fā)展之前,目標(biāo)檢測(cè)大多是基于傳統(tǒng)圖像處理和機(jī)器學(xué)習(xí)算法來研究的,用來識(shí)別目標(biāo)的特征都是認(rèn)為設(shè)計(jì)的,例如SIFT(尺度不變特征),HOG(方向梯度直方圖特征),SURF(加速穩(wěn)健特征)等[21]。與傳統(tǒng)方法相比,深度學(xué)習(xí)己經(jīng)被證明在計(jì)算機(jī)視覺和語音識(shí)別方面效果更加顯著且擁有更高的普適性,已經(jīng)成為了計(jì)算機(jī)視覺和語音識(shí)別領(lǐng)域的主流算法。在目標(biāo)檢測(cè)領(lǐng)域,主要應(yīng)用到的深度神經(jīng)網(wǎng)絡(luò)模型是CNN(卷積神經(jīng)網(wǎng)絡(luò)),主要步驟是:首先對(duì)圖像進(jìn)行深度特征提取,然后基于深度神經(jīng)網(wǎng)絡(luò)完成目標(biāo)的識(shí)別與定位。本章重點(diǎn)介紹了卷積神經(jīng)網(wǎng)絡(luò)的原理、基于卷積神經(jīng)網(wǎng)絡(luò)的目標(biāo)檢測(cè)算法在2D目標(biāo)檢測(cè)領(lǐng)域和3D目標(biāo)檢測(cè)領(lǐng)域的主流算法以及研究需要用到的基礎(chǔ)知識(shí)。2.2卷積神經(jīng)網(wǎng)絡(luò)基礎(chǔ)2.2.1多層感知機(jī)原理神經(jīng)網(wǎng)絡(luò)的誕生靈感來源于對(duì)生物大腦結(jié)構(gòu)和功能的模仿,它的本質(zhì)是一種模擬人腦神經(jīng)元工作的信息處理系統(tǒng),早在1957年,Rosenblat在文章出了感知機(jī)模型,首次把人工神經(jīng)網(wǎng)絡(luò)的研究從理論探討付諸工程實(shí)踐,引發(fā)了神經(jīng)網(wǎng)絡(luò)的研究浪潮。類比來說,感知機(jī)就相當(dāng)于一個(gè)單獨(dú)的神經(jīng)元結(jié)構(gòu),模型如圖2-1所示。圖2-1感知機(jī)模型圖中xi代表來自第i個(gè)神經(jīng)元的輸入,wi代表當(dāng)前神經(jīng)元與第i個(gè)神經(jīng)元連接的權(quán)重,I是當(dāng)前神經(jīng)元的輸出。神經(jīng)元接收n個(gè)其他神經(jīng)元傳遞過來的輸入
三層感知機(jī)的結(jié)構(gòu)
本文編號(hào):3339668
本文鏈接:http://sikaile.net/kejilunwen/zidonghuakongzhilunwen/3339668.html
最近更新
教材專著