基于輕量級神經(jīng)網(wǎng)絡(luò)的交通場景的目標(biāo)檢測方法研究
發(fā)布時間:2021-03-17 20:23
基于機器視覺的目標(biāo)檢測是自動駕駛領(lǐng)域中炙手可熱的研究方向之一,近些年不斷涌現(xiàn)出許多優(yōu)秀的基于深度學(xué)習(xí)的目標(biāo)檢測算法,其中YOLOv3目標(biāo)檢測算法是一個在檢測精度和速度方面上表現(xiàn)優(yōu)異的端到端網(wǎng)絡(luò)。YOLOv3算法可以對任何分辨率的圖片進行目標(biāo)檢測,但是在網(wǎng)絡(luò)訓(xùn)練過程和預(yù)測階段的邊界框位置回歸計算都存在精度偏差,還存在網(wǎng)絡(luò)模型占用巨大的運行內(nèi)存和存儲空間的問題。為此在復(fù)雜的交通場景下設(shè)計輕量級的YOLOv3網(wǎng)絡(luò)來準確地進行車輛目標(biāo)檢測是符合實際工程需求。以下是本文對原始的YOLOv3網(wǎng)絡(luò)進行了研究和改進的具體方法:(1)針對YOLOv3網(wǎng)絡(luò)在交通場景下長方形視野的圖像進行伸縮拉伸以后,圖像的變形會降低檢測的準確率,本文通過K-Means算法聚類得到錨框尺寸,通過計算公式設(shè)置預(yù)測特征圖上每層映射的預(yù)選框尺寸大小,有效地改進網(wǎng)絡(luò)在檢測長方形視野交通場景的精度問題,減少模型在候選框參數(shù)訓(xùn)練的過程中的冗余運算的時間消耗。(2)針對交通場景的圖像生成的預(yù)選框類別標(biāo)簽數(shù)量不均衡,容易造成誤檢和漏檢的問題,采用的方法是通過焦點損失函數(shù)解決樣本標(biāo)簽失衡問題,在Pascal VOC數(shù)據(jù)集上證實了其有效地提升...
【文章來源】:杭州電子科技大學(xué)浙江省
【文章頁數(shù)】:66 頁
【學(xué)位級別】:碩士
【部分圖文】:
自動駕駛車輛展示物流運輸過程中的自動駕駛應(yīng)用已經(jīng)帶來了許多益處和經(jīng)濟效益,比如傳統(tǒng)的人力運輸
浙江省碩士學(xué)位論文13征,具有很強的先驗性,使得特征訓(xùn)練能夠在特征提取環(huán)節(jié)里有更多的選擇性。2.2.3激活函數(shù)激活函數(shù)(activatefunction)又稱作為非線性映射(non-linearitymapping),對機器去理解數(shù)據(jù)樣本的非線性化特點具有非常重要的意義。它擺脫了網(wǎng)絡(luò)模型線性操作層的疊加只會形成線性映射的特點,使得網(wǎng)絡(luò)模型具有更廣泛性和普適性。在實際應(yīng)用中,激活函數(shù)的種類為適應(yīng)不同環(huán)境下有各種各樣的,介紹幾種典型的激活函數(shù)概念及其特點,具體有ReLU、Sigmoid和Tanh,它們各自有著自己的優(yōu)缺點,需要在不同網(wǎng)絡(luò)模型當(dāng)中針對不同情況使用不同的激活函數(shù)方能使模型達到最優(yōu)的組合[19]。ReLU函數(shù)表達式為:f(x)max{0,x}(2.6)式(2.6)中x代表像素點元素的輸入值。圖2.4ReLU函數(shù)曲線圖優(yōu)點:相比較于其他激活函數(shù)不存在飽和區(qū),故不存在梯度消失問題,能夠保持特征提取不衰減,從而減緩模型在訓(xùn)練過程中彌補梯度消失的問題。缺點:因為當(dāng)x<0時,ReLU函數(shù)處在硬飽和區(qū),隨著訓(xùn)練的迭代導(dǎo)致權(quán)重?zé)o法更新,即訓(xùn)練的神經(jīng)單元無效。Sigmoid函數(shù)表達式:1()1exp()fxx(2.7)式(2.7)中中x代表像素點元素的輸入值。
浙江省碩士學(xué)位論文14圖2.5Sigmoid函數(shù)曲線圖優(yōu)點:可以接受任意大小的輸入,并輸出在一個固定的區(qū)間(0,1)之間,經(jīng)常被用在二分類的輸入層中。缺點:函數(shù)中有很大的梯度幾乎為0的飽和區(qū)域,會導(dǎo)致神經(jīng)網(wǎng)絡(luò)反向傳播時鏈式求導(dǎo)的梯度值非常小,梯度彌散甚至梯度消失的問題隨之出現(xiàn)。再者函數(shù)不關(guān)于原點中心對稱,會使得一些反向傳播過程中網(wǎng)絡(luò)模型的所有參數(shù)的更新分向都是一樣的,增加了神經(jīng)網(wǎng)絡(luò)訓(xùn)練的難度。Tanh函數(shù)表達式:ee()eexxxxfx(2.8)式(2.8)中中x代表像素點元素的輸入值。圖2.6Tanh函數(shù)曲線圖優(yōu)點:解決了Sigmoid函數(shù)不關(guān)于原點中心對稱的問題,且Tanh函數(shù)的斜率相比于Sigmoid函數(shù)更陡,故收斂速度快缺點:依舊存在飽和區(qū),容易造成梯度彌散的問題現(xiàn)象。ReLU激活函數(shù)當(dāng)輸入為負值時,學(xué)習(xí)率可能會變得緩慢,直至神經(jīng)單元無效死亡,從而剩下的訓(xùn)練過程當(dāng)中一直保持沉默。而Sigmoid的激活函數(shù)在分類任務(wù)當(dāng)中能夠?qū)崿F(xiàn)二分類,
【參考文獻】:
期刊論文
[1]基于卷積神經(jīng)網(wǎng)絡(luò)的中國北方冬小麥遙感估產(chǎn)[J]. 周亮,慕號偉,馬海姣,陳高星. 農(nóng)業(yè)工程學(xué)報. 2019(15)
[2]Multi-scale object detection by top-down and bottom-up feature pyramid network[J]. ZHAO Baojun,ZHAO Boya,TANG Linbo,WANG Wenzheng,WU Chen. Journal of Systems Engineering and Electronics. 2019(01)
[3]智能交通沙盤中的關(guān)鍵技術(shù)研究[J]. 劉浩,李思其. 電腦知識與技術(shù). 2018(34)
[4]基于深度學(xué)習(xí)的短視頻中的物體檢測與內(nèi)容推薦系統(tǒng)研究[J]. 石殷巧,劉守印,馬超. 計算機與現(xiàn)代化. 2018(11)
[5]基于深度卷積網(wǎng)絡(luò)的目標(biāo)檢測綜述[J]. 吳帥,徐勇,趙東寧. 模式識別與人工智能. 2018(04)
[6]卷積網(wǎng)絡(luò)深度學(xué)習(xí)算法與實例[J]. 陳旭,張軍,陳文偉,李碩豪. 廣東工業(yè)大學(xué)學(xué)報. 2017(06)
[7]基于加速區(qū)域卷積神經(jīng)網(wǎng)下的人物身份屬性識別方法[J]. 周林林,胡曉君,張魯殷,賈偉光,楊陽,丁祥,張雪飛,楊東東. 電子元器件與信息技術(shù). 2017(04)
[8]卷積神經(jīng)網(wǎng)絡(luò)研究綜述[J]. 李彥冬,郝宗波,雷航. 計算機應(yīng)用. 2016(09)
[9]復(fù)雜環(huán)境下的車輛目標(biāo)檢測方法研究[J]. 趙偉,李欣,王鵬. 森林工程. 2014(03)
[10]無人駕駛汽車的發(fā)展現(xiàn)狀及方向[J]. 喬維高,徐學(xué)進. 上海汽車. 2007(07)
碩士論文
[1]基于深度學(xué)習(xí)的復(fù)雜環(huán)境下多目標(biāo)檢測方法研究[D]. 朱玉剛.杭州電子科技大學(xué) 2019
[2]Android移動平臺下基于深度學(xué)習(xí)的目標(biāo)檢測技術(shù)研究[D]. 顧帥.西安電子科技大學(xué) 2018
[3]基于TensorFlow的Android平臺實時車輛和交通標(biāo)志牌檢測的研究[D]. 張州.中國地質(zhì)大學(xué)(北京) 2018
[4]基于深度學(xué)習(xí)的車牌字符識別研究[D]. 楊志.安徽大學(xué) 2018
[5]基于深度卷積特征融合的多尺度行人檢測[D]. 郭愛心.中國科學(xué)技術(shù)大學(xué) 2018
[6]基于卷積神經(jīng)網(wǎng)絡(luò)的行人重識別算法研究[D]. 徐陽.華東師范大學(xué) 2018
本文編號:3087666
【文章來源】:杭州電子科技大學(xué)浙江省
【文章頁數(shù)】:66 頁
【學(xué)位級別】:碩士
【部分圖文】:
自動駕駛車輛展示物流運輸過程中的自動駕駛應(yīng)用已經(jīng)帶來了許多益處和經(jīng)濟效益,比如傳統(tǒng)的人力運輸
浙江省碩士學(xué)位論文13征,具有很強的先驗性,使得特征訓(xùn)練能夠在特征提取環(huán)節(jié)里有更多的選擇性。2.2.3激活函數(shù)激活函數(shù)(activatefunction)又稱作為非線性映射(non-linearitymapping),對機器去理解數(shù)據(jù)樣本的非線性化特點具有非常重要的意義。它擺脫了網(wǎng)絡(luò)模型線性操作層的疊加只會形成線性映射的特點,使得網(wǎng)絡(luò)模型具有更廣泛性和普適性。在實際應(yīng)用中,激活函數(shù)的種類為適應(yīng)不同環(huán)境下有各種各樣的,介紹幾種典型的激活函數(shù)概念及其特點,具體有ReLU、Sigmoid和Tanh,它們各自有著自己的優(yōu)缺點,需要在不同網(wǎng)絡(luò)模型當(dāng)中針對不同情況使用不同的激活函數(shù)方能使模型達到最優(yōu)的組合[19]。ReLU函數(shù)表達式為:f(x)max{0,x}(2.6)式(2.6)中x代表像素點元素的輸入值。圖2.4ReLU函數(shù)曲線圖優(yōu)點:相比較于其他激活函數(shù)不存在飽和區(qū),故不存在梯度消失問題,能夠保持特征提取不衰減,從而減緩模型在訓(xùn)練過程中彌補梯度消失的問題。缺點:因為當(dāng)x<0時,ReLU函數(shù)處在硬飽和區(qū),隨著訓(xùn)練的迭代導(dǎo)致權(quán)重?zé)o法更新,即訓(xùn)練的神經(jīng)單元無效。Sigmoid函數(shù)表達式:1()1exp()fxx(2.7)式(2.7)中中x代表像素點元素的輸入值。
浙江省碩士學(xué)位論文14圖2.5Sigmoid函數(shù)曲線圖優(yōu)點:可以接受任意大小的輸入,并輸出在一個固定的區(qū)間(0,1)之間,經(jīng)常被用在二分類的輸入層中。缺點:函數(shù)中有很大的梯度幾乎為0的飽和區(qū)域,會導(dǎo)致神經(jīng)網(wǎng)絡(luò)反向傳播時鏈式求導(dǎo)的梯度值非常小,梯度彌散甚至梯度消失的問題隨之出現(xiàn)。再者函數(shù)不關(guān)于原點中心對稱,會使得一些反向傳播過程中網(wǎng)絡(luò)模型的所有參數(shù)的更新分向都是一樣的,增加了神經(jīng)網(wǎng)絡(luò)訓(xùn)練的難度。Tanh函數(shù)表達式:ee()eexxxxfx(2.8)式(2.8)中中x代表像素點元素的輸入值。圖2.6Tanh函數(shù)曲線圖優(yōu)點:解決了Sigmoid函數(shù)不關(guān)于原點中心對稱的問題,且Tanh函數(shù)的斜率相比于Sigmoid函數(shù)更陡,故收斂速度快缺點:依舊存在飽和區(qū),容易造成梯度彌散的問題現(xiàn)象。ReLU激活函數(shù)當(dāng)輸入為負值時,學(xué)習(xí)率可能會變得緩慢,直至神經(jīng)單元無效死亡,從而剩下的訓(xùn)練過程當(dāng)中一直保持沉默。而Sigmoid的激活函數(shù)在分類任務(wù)當(dāng)中能夠?qū)崿F(xiàn)二分類,
【參考文獻】:
期刊論文
[1]基于卷積神經(jīng)網(wǎng)絡(luò)的中國北方冬小麥遙感估產(chǎn)[J]. 周亮,慕號偉,馬海姣,陳高星. 農(nóng)業(yè)工程學(xué)報. 2019(15)
[2]Multi-scale object detection by top-down and bottom-up feature pyramid network[J]. ZHAO Baojun,ZHAO Boya,TANG Linbo,WANG Wenzheng,WU Chen. Journal of Systems Engineering and Electronics. 2019(01)
[3]智能交通沙盤中的關(guān)鍵技術(shù)研究[J]. 劉浩,李思其. 電腦知識與技術(shù). 2018(34)
[4]基于深度學(xué)習(xí)的短視頻中的物體檢測與內(nèi)容推薦系統(tǒng)研究[J]. 石殷巧,劉守印,馬超. 計算機與現(xiàn)代化. 2018(11)
[5]基于深度卷積網(wǎng)絡(luò)的目標(biāo)檢測綜述[J]. 吳帥,徐勇,趙東寧. 模式識別與人工智能. 2018(04)
[6]卷積網(wǎng)絡(luò)深度學(xué)習(xí)算法與實例[J]. 陳旭,張軍,陳文偉,李碩豪. 廣東工業(yè)大學(xué)學(xué)報. 2017(06)
[7]基于加速區(qū)域卷積神經(jīng)網(wǎng)下的人物身份屬性識別方法[J]. 周林林,胡曉君,張魯殷,賈偉光,楊陽,丁祥,張雪飛,楊東東. 電子元器件與信息技術(shù). 2017(04)
[8]卷積神經(jīng)網(wǎng)絡(luò)研究綜述[J]. 李彥冬,郝宗波,雷航. 計算機應(yīng)用. 2016(09)
[9]復(fù)雜環(huán)境下的車輛目標(biāo)檢測方法研究[J]. 趙偉,李欣,王鵬. 森林工程. 2014(03)
[10]無人駕駛汽車的發(fā)展現(xiàn)狀及方向[J]. 喬維高,徐學(xué)進. 上海汽車. 2007(07)
碩士論文
[1]基于深度學(xué)習(xí)的復(fù)雜環(huán)境下多目標(biāo)檢測方法研究[D]. 朱玉剛.杭州電子科技大學(xué) 2019
[2]Android移動平臺下基于深度學(xué)習(xí)的目標(biāo)檢測技術(shù)研究[D]. 顧帥.西安電子科技大學(xué) 2018
[3]基于TensorFlow的Android平臺實時車輛和交通標(biāo)志牌檢測的研究[D]. 張州.中國地質(zhì)大學(xué)(北京) 2018
[4]基于深度學(xué)習(xí)的車牌字符識別研究[D]. 楊志.安徽大學(xué) 2018
[5]基于深度卷積特征融合的多尺度行人檢測[D]. 郭愛心.中國科學(xué)技術(shù)大學(xué) 2018
[6]基于卷積神經(jīng)網(wǎng)絡(luò)的行人重識別算法研究[D]. 徐陽.華東師范大學(xué) 2018
本文編號:3087666
本文鏈接:http://sikaile.net/kejilunwen/zidonghuakongzhilunwen/3087666.html
最近更新
教材專著