基于卷積神經(jīng)網(wǎng)絡(luò)的語義分割車道線檢測算法設(shè)計(jì)及應(yīng)用
發(fā)布時(shí)間:2022-01-04 09:58
隨著科技的迅速發(fā)展,自動(dòng)駕駛、輔助駕駛等前沿技術(shù)也離我們的生活越來越近,而車道線檢測技術(shù)是其中的基礎(chǔ)支撐和關(guān)鍵技術(shù)。只有車道線檢測系統(tǒng)能夠準(zhǔn)確而穩(wěn)定地檢測出車道線,才能給車輛的行駛提供準(zhǔn)確可靠的指引信息。因此本文對車道線檢測算法進(jìn)行了深入的研究,設(shè)計(jì)了適用于復(fù)雜行車環(huán)境下的車道線檢測算法,并將該算法應(yīng)用于車道線檢測系統(tǒng)中。本文的主要研究內(nèi)容如下:(1)基于卷積神經(jīng)網(wǎng)絡(luò)的語義分割車道線檢測算法研究。針對當(dāng)前基于卷積神經(jīng)網(wǎng)絡(luò)的車道線檢測方法中由于孤立地關(guān)注車道線信息而忽略交通場景中不同實(shí)體的關(guān)聯(lián)性,從而導(dǎo)致的復(fù)雜行車環(huán)境下車道線檢測準(zhǔn)確率和穩(wěn)定性降低的問題,設(shè)計(jì)了一種多任務(wù)特征聚合語義分割網(wǎng)絡(luò)。網(wǎng)絡(luò)通過多任務(wù)學(xué)習(xí)和特征聚合方法來挖掘車道線與車道區(qū)域之間的關(guān)聯(lián)性,并通過補(bǔ)充關(guān)聯(lián)語義信息來提升車道線分割的效果和穩(wěn)定性。針對車道線分割中存在的正負(fù)樣本不均衡問題,提出了一種邊界約束損失函數(shù),通過對車道線的輪廓邊界進(jìn)行建模,使網(wǎng)絡(luò)更關(guān)注于車道線而非背景信息。針對車道線語義分割結(jié)果中車道線細(xì)節(jié)信息不夠完善的問題,設(shè)計(jì)了一種形態(tài)學(xué)后處理方法,對網(wǎng)絡(luò)輸出的車道線分割掩碼進(jìn)行去噪和車道線實(shí)例劃分。本文設(shè)計(jì)的...
【文章來源】:華南理工大學(xué)廣東省 211工程院校 985工程院校 教育部直屬院校
【文章頁數(shù)】:69 頁
【學(xué)位級別】:碩士
【部分圖文】:
語義分割示意圖
華南理工大學(xué)碩士學(xué)位論文10數(shù)曲線如圖2-3(b)所示。它能夠?qū)⑷我鈱?shí)數(shù)映射到[-1,1]之間,因?yàn)樗橇阒行牡暮瘮?shù),因此梯度消失問題較Sigmoid函數(shù)輕,但仍存在這樣的風(fēng)險(xiǎn)。Relu函數(shù)的表達(dá)式為f(z)max(0,z),其函數(shù)曲線如圖2-3(c)所示。它在負(fù)區(qū)間輸出為0,這種單側(cè)抑制的效應(yīng)可以大大加快網(wǎng)絡(luò)收斂速度,并且在正區(qū)間的非飽和特性使得它不會(huì)出現(xiàn)梯度消失的現(xiàn)象。也正是由于單側(cè)抑制效應(yīng),它可能會(huì)出現(xiàn)神經(jīng)元“失活”的現(xiàn)象。(a)(b)(c)圖2-3Sigmoid、Tanh和Relu函數(shù)曲線池化的功能是則對輸入特征圖進(jìn)行下采樣,這樣有助于減少特征映射中的冗余信息,保留關(guān)鍵特征。同時(shí),池化使網(wǎng)絡(luò)獲得一定的不變性,即網(wǎng)絡(luò)對于輸入圖像的平移、旋轉(zhuǎn)不敏感,使網(wǎng)絡(luò)能擁有更好的泛化能力。常用的池化方法有最大池化和平均池化。在做池化時(shí),設(shè)定一個(gè)特定大小的矩形窗作為池化窗口,窗口在輸入數(shù)據(jù)上滑動(dòng)。對于最大池化而言,每次在池化窗口中取數(shù)值最大的數(shù)據(jù)作為輸出,而平均池化則是對池化窗口中所有數(shù)據(jù)取平均作為輸出。最大池化和平均池化方法的具體操作如圖2-4所示。352254121421445755473325輸入特征圖輸出特征圖MaxpoolingAveragepooling圖2-4最大池化和平均池化示意圖通過卷積、激活和池化等結(jié)構(gòu)逐層的堆疊,就構(gòu)成了一個(gè)卷積神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)。將數(shù)據(jù)輸入到網(wǎng)絡(luò),隨著數(shù)據(jù)在神經(jīng)網(wǎng)絡(luò)中的流動(dòng),卷積神經(jīng)網(wǎng)絡(luò)就可以實(shí)現(xiàn)從低維特征到高維語義的提取,最后得到網(wǎng)絡(luò)的輸出結(jié)果。這就是卷積神經(jīng)網(wǎng)絡(luò)的前向傳播(ForwardPropagation)過程。
華南理工大學(xué)碩士學(xué)位論文16模型可以在目標(biāo)任務(wù)上獲得更好的表現(xiàn),這種方法稱為多任務(wù)學(xué)習(xí)方法[39]。更具體地,多任務(wù)學(xué)習(xí)是指在一個(gè)網(wǎng)絡(luò)中同時(shí)進(jìn)行多個(gè)任務(wù)的學(xué)習(xí)訓(xùn)練,并將多個(gè)任務(wù)的預(yù)測誤差同時(shí)進(jìn)行反向傳播,它是一種歸納遷移機(jī)制。歸納遷移可以通過利用其他信息源來提高當(dāng)前任務(wù)學(xué)習(xí)的性能表現(xiàn)。從生物學(xué)的角度,多任務(wù)學(xué)習(xí)方法被視作是一種受到人類學(xué)習(xí)啟發(fā)的方法。為了學(xué)習(xí)新的任務(wù),我們經(jīng)常需要應(yīng)用從學(xué)習(xí)相關(guān)任務(wù)中獲得的知識(shí)信息。例如在檢測車道線時(shí)我們首先需要確定路面的位置,然后再從路面上獲得車道線和路面標(biāo)志等信息。圖2-12單任務(wù)學(xué)習(xí)[38]圖2-13多任務(wù)學(xué)習(xí)[38]單任務(wù)學(xué)習(xí)如圖2-12所示,四個(gè)任務(wù)分別由四個(gè)獨(dú)立的網(wǎng)絡(luò)分別進(jìn)行學(xué)習(xí),四個(gè)網(wǎng)絡(luò)之間互不關(guān)聯(lián)。而多任務(wù)學(xué)習(xí)如圖2-13所示,四個(gè)任務(wù)在同一個(gè)網(wǎng)絡(luò)中同時(shí)進(jìn)行學(xué)習(xí),且各任務(wù)之間共享一定數(shù)量的神經(jīng)元。多任務(wù)學(xué)習(xí)的有效性體現(xiàn)在以下幾個(gè)方面:(一)隱式數(shù)據(jù)增強(qiáng)神經(jīng)網(wǎng)絡(luò)模型在訓(xùn)練過程中會(huì)對噪聲和有用信息進(jìn)行判別。理想情況下,隨著訓(xùn)練的深入,網(wǎng)絡(luò)能很好的區(qū)分噪聲和有用信息。但在實(shí)際中,為了防止過擬合,網(wǎng)絡(luò)會(huì)傾向于更加保守,從而只學(xué)習(xí)更加通用的信息,此時(shí)就有可能將部分有用信息歸類為噪聲。而多個(gè)任務(wù)同時(shí)進(jìn)行訓(xùn)練時(shí),由于不同任務(wù)的有各自的噪聲模式,通過不同噪聲模式的
【參考文獻(xiàn)】:
期刊論文
[1]面向復(fù)雜環(huán)境的圖像語義分割方法綜述[J]. 王嫣然,陳清亮,吳俊君. 計(jì)算機(jī)科學(xué). 2019(09)
[2]自動(dòng)駕駛發(fā)展與關(guān)鍵技術(shù)綜述[J]. 王金強(qiáng),黃航,郅朋,申澤邦,周慶國. 電子技術(shù)應(yīng)用. 2019(06)
[3]基于深度卷積神經(jīng)網(wǎng)絡(luò)的圖像語義分割[J]. 劉希. 信息技術(shù). 2019(02)
[4]基于卡爾曼濾波的多目標(biāo)跟蹤方法[J]. 趙廣輝,卓松,徐曉龍. 計(jì)算機(jī)科學(xué). 2018(08)
[5]車道線檢測專利技術(shù)綜述[J]. 王爽. 中國新通信. 2017(24)
[6]無人車自主定位和障礙物感知的視覺主導(dǎo)多傳感器融合方法(英文)[J]. Jian-ru XUE,Di WANG,Shao-yi DU,Di-xiao CUI,Yong HUANG,Nan-ning ZHENG. Frontiers of Information Technology & Electronic Engineering. 2017(01)
[7]基于Catmull-Rom樣條曲線的彎曲車道線檢測研究[J]. 何鵬,高峰,魏厚敏. 汽車工程學(xué)報(bào). 2015(04)
[8]基于RGB空間的車道線檢測與辨識(shí)方法[J]. 楊益,何穎. 計(jì)算機(jī)與現(xiàn)代化. 2014(02)
[9]一種基于掃描線的車道線識(shí)別算法[J]. 李若皓,丁冬花. 微計(jì)算機(jī)信息. 2008(16)
[10]一種基于直線模型的道路識(shí)別算法研究[J]. 徐友春,王榮本,李克強(qiáng),趙玉凡. 中國圖象圖形學(xué)報(bào). 2004(07)
碩士論文
[1]基于激光雷達(dá)回波信號的車道線檢測方法研究[D]. 吳毅華.中國科學(xué)技術(shù)大學(xué) 2015
本文編號:3568138
【文章來源】:華南理工大學(xué)廣東省 211工程院校 985工程院校 教育部直屬院校
【文章頁數(shù)】:69 頁
【學(xué)位級別】:碩士
【部分圖文】:
語義分割示意圖
華南理工大學(xué)碩士學(xué)位論文10數(shù)曲線如圖2-3(b)所示。它能夠?qū)⑷我鈱?shí)數(shù)映射到[-1,1]之間,因?yàn)樗橇阒行牡暮瘮?shù),因此梯度消失問題較Sigmoid函數(shù)輕,但仍存在這樣的風(fēng)險(xiǎn)。Relu函數(shù)的表達(dá)式為f(z)max(0,z),其函數(shù)曲線如圖2-3(c)所示。它在負(fù)區(qū)間輸出為0,這種單側(cè)抑制的效應(yīng)可以大大加快網(wǎng)絡(luò)收斂速度,并且在正區(qū)間的非飽和特性使得它不會(huì)出現(xiàn)梯度消失的現(xiàn)象。也正是由于單側(cè)抑制效應(yīng),它可能會(huì)出現(xiàn)神經(jīng)元“失活”的現(xiàn)象。(a)(b)(c)圖2-3Sigmoid、Tanh和Relu函數(shù)曲線池化的功能是則對輸入特征圖進(jìn)行下采樣,這樣有助于減少特征映射中的冗余信息,保留關(guān)鍵特征。同時(shí),池化使網(wǎng)絡(luò)獲得一定的不變性,即網(wǎng)絡(luò)對于輸入圖像的平移、旋轉(zhuǎn)不敏感,使網(wǎng)絡(luò)能擁有更好的泛化能力。常用的池化方法有最大池化和平均池化。在做池化時(shí),設(shè)定一個(gè)特定大小的矩形窗作為池化窗口,窗口在輸入數(shù)據(jù)上滑動(dòng)。對于最大池化而言,每次在池化窗口中取數(shù)值最大的數(shù)據(jù)作為輸出,而平均池化則是對池化窗口中所有數(shù)據(jù)取平均作為輸出。最大池化和平均池化方法的具體操作如圖2-4所示。352254121421445755473325輸入特征圖輸出特征圖MaxpoolingAveragepooling圖2-4最大池化和平均池化示意圖通過卷積、激活和池化等結(jié)構(gòu)逐層的堆疊,就構(gòu)成了一個(gè)卷積神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)。將數(shù)據(jù)輸入到網(wǎng)絡(luò),隨著數(shù)據(jù)在神經(jīng)網(wǎng)絡(luò)中的流動(dòng),卷積神經(jīng)網(wǎng)絡(luò)就可以實(shí)現(xiàn)從低維特征到高維語義的提取,最后得到網(wǎng)絡(luò)的輸出結(jié)果。這就是卷積神經(jīng)網(wǎng)絡(luò)的前向傳播(ForwardPropagation)過程。
華南理工大學(xué)碩士學(xué)位論文16模型可以在目標(biāo)任務(wù)上獲得更好的表現(xiàn),這種方法稱為多任務(wù)學(xué)習(xí)方法[39]。更具體地,多任務(wù)學(xué)習(xí)是指在一個(gè)網(wǎng)絡(luò)中同時(shí)進(jìn)行多個(gè)任務(wù)的學(xué)習(xí)訓(xùn)練,并將多個(gè)任務(wù)的預(yù)測誤差同時(shí)進(jìn)行反向傳播,它是一種歸納遷移機(jī)制。歸納遷移可以通過利用其他信息源來提高當(dāng)前任務(wù)學(xué)習(xí)的性能表現(xiàn)。從生物學(xué)的角度,多任務(wù)學(xué)習(xí)方法被視作是一種受到人類學(xué)習(xí)啟發(fā)的方法。為了學(xué)習(xí)新的任務(wù),我們經(jīng)常需要應(yīng)用從學(xué)習(xí)相關(guān)任務(wù)中獲得的知識(shí)信息。例如在檢測車道線時(shí)我們首先需要確定路面的位置,然后再從路面上獲得車道線和路面標(biāo)志等信息。圖2-12單任務(wù)學(xué)習(xí)[38]圖2-13多任務(wù)學(xué)習(xí)[38]單任務(wù)學(xué)習(xí)如圖2-12所示,四個(gè)任務(wù)分別由四個(gè)獨(dú)立的網(wǎng)絡(luò)分別進(jìn)行學(xué)習(xí),四個(gè)網(wǎng)絡(luò)之間互不關(guān)聯(lián)。而多任務(wù)學(xué)習(xí)如圖2-13所示,四個(gè)任務(wù)在同一個(gè)網(wǎng)絡(luò)中同時(shí)進(jìn)行學(xué)習(xí),且各任務(wù)之間共享一定數(shù)量的神經(jīng)元。多任務(wù)學(xué)習(xí)的有效性體現(xiàn)在以下幾個(gè)方面:(一)隱式數(shù)據(jù)增強(qiáng)神經(jīng)網(wǎng)絡(luò)模型在訓(xùn)練過程中會(huì)對噪聲和有用信息進(jìn)行判別。理想情況下,隨著訓(xùn)練的深入,網(wǎng)絡(luò)能很好的區(qū)分噪聲和有用信息。但在實(shí)際中,為了防止過擬合,網(wǎng)絡(luò)會(huì)傾向于更加保守,從而只學(xué)習(xí)更加通用的信息,此時(shí)就有可能將部分有用信息歸類為噪聲。而多個(gè)任務(wù)同時(shí)進(jìn)行訓(xùn)練時(shí),由于不同任務(wù)的有各自的噪聲模式,通過不同噪聲模式的
【參考文獻(xiàn)】:
期刊論文
[1]面向復(fù)雜環(huán)境的圖像語義分割方法綜述[J]. 王嫣然,陳清亮,吳俊君. 計(jì)算機(jī)科學(xué). 2019(09)
[2]自動(dòng)駕駛發(fā)展與關(guān)鍵技術(shù)綜述[J]. 王金強(qiáng),黃航,郅朋,申澤邦,周慶國. 電子技術(shù)應(yīng)用. 2019(06)
[3]基于深度卷積神經(jīng)網(wǎng)絡(luò)的圖像語義分割[J]. 劉希. 信息技術(shù). 2019(02)
[4]基于卡爾曼濾波的多目標(biāo)跟蹤方法[J]. 趙廣輝,卓松,徐曉龍. 計(jì)算機(jī)科學(xué). 2018(08)
[5]車道線檢測專利技術(shù)綜述[J]. 王爽. 中國新通信. 2017(24)
[6]無人車自主定位和障礙物感知的視覺主導(dǎo)多傳感器融合方法(英文)[J]. Jian-ru XUE,Di WANG,Shao-yi DU,Di-xiao CUI,Yong HUANG,Nan-ning ZHENG. Frontiers of Information Technology & Electronic Engineering. 2017(01)
[7]基于Catmull-Rom樣條曲線的彎曲車道線檢測研究[J]. 何鵬,高峰,魏厚敏. 汽車工程學(xué)報(bào). 2015(04)
[8]基于RGB空間的車道線檢測與辨識(shí)方法[J]. 楊益,何穎. 計(jì)算機(jī)與現(xiàn)代化. 2014(02)
[9]一種基于掃描線的車道線識(shí)別算法[J]. 李若皓,丁冬花. 微計(jì)算機(jī)信息. 2008(16)
[10]一種基于直線模型的道路識(shí)別算法研究[J]. 徐友春,王榮本,李克強(qiáng),趙玉凡. 中國圖象圖形學(xué)報(bào). 2004(07)
碩士論文
[1]基于激光雷達(dá)回波信號的車道線檢測方法研究[D]. 吳毅華.中國科學(xué)技術(shù)大學(xué) 2015
本文編號:3568138
本文鏈接:http://sikaile.net/kejilunwen/qiche/3568138.html
最近更新
教材專著