基于深度學(xué)習(xí)的輕量級目標(biāo)檢測和場景分類算法研究
發(fā)布時間:2022-01-24 20:08
隨著計算機(jī)視覺的發(fā)展,基于深度學(xué)習(xí)的各種技術(shù)已集成在高級輔助駕駛系統(tǒng)(ADAS)中。如何從算法和系統(tǒng)層面提升ADAS的性能成為當(dāng)前研究熱點之一。本文以輔助駕駛應(yīng)用中的輕量級目標(biāo)檢測和場景分類算法作為研究對象,主要研究內(nèi)容如下:提出一種基于YOLOv3-Tiny改進(jìn)的輕量級目標(biāo)檢測算法。本文在不損失精度的情況下,實現(xiàn)對目標(biāo)檢測主干網(wǎng)絡(luò)進(jìn)行輕量化壓縮,主要改進(jìn)有以下兩個方面。第一,改進(jìn)和壓縮YOLOv3-Tiny提取特征的主干網(wǎng)絡(luò)部分,使用深度可分離卷積以及倒殘差的方式減少網(wǎng)絡(luò)參數(shù)和計算量;第二,利用注意力機(jī)制對卷積層輸出的特征圖(Feature map)沿著通道和空間兩個維度依次推斷出注意力權(quán)重,并將注意力權(quán)重與原特征圖相乘實現(xiàn)對特征的自適應(yīng)調(diào)整進(jìn)而提升網(wǎng)絡(luò)的表征能力。針對以上兩點改進(jìn),本文分別在國際公開通用多目標(biāo)檢測數(shù)據(jù)集(2007+2012)、國際公開自動駕駛數(shù)據(jù)庫(KITTI)以及自行搭建車載攝像系統(tǒng)并收集的ADAS專用數(shù)據(jù)庫上進(jìn)行了驗證。實驗結(jié)果證明了本方法的有效性,在實現(xiàn)壓縮網(wǎng)絡(luò)計算量和參數(shù)量的情況下,本文改進(jìn)的新方法與原算法相比在VOC2007Test數(shù)據(jù)集上的檢測性能比當(dāng)前...
【文章來源】:南京信息工程大學(xué)江蘇省
【文章頁數(shù)】:62 頁
【學(xué)位級別】:碩士
【部分圖文】:
目標(biāo)檢測算法在輔助駕駛中的應(yīng)用示意圖
第一章緒論3基于場景感知結(jié)果的基礎(chǔ)上(圖1.2右上角給出了一個場景分類器感知結(jié)果),對目標(biāo)檢測閾值做出不同于正常情況下的調(diào)整,提高目標(biāo)檢測的準(zhǔn)確率。圖1.2場景理解與ADAS檢測可視化圖1.2是因汽車逆光行駛產(chǎn)生攝像頭成像曝光的場景圖像,這種極端場景會對輔助駕駛系統(tǒng)和駕駛員做出預(yù)警反應(yīng)會有不同程度的影響,此外高級輔助駕駛系統(tǒng)在雨雪場景、大霧天氣的極端場景與多云天氣、高速道路行車場景中進(jìn)行車速調(diào)整、防碰撞預(yù)警以及道路區(qū)域提取等參數(shù)調(diào)整也有著很大區(qū)別。因此,在汽車高級輔助駕駛系統(tǒng)中利用場景分類實現(xiàn)對道路場景語義理解,這對確保車輛行駛安全有著重要意義。1.3研究現(xiàn)狀1.3.1輕量級目標(biāo)檢測研究現(xiàn)狀目標(biāo)檢測作為計算機(jī)視覺應(yīng)用研究中的熱點和難點之一,主要可以分為基于手工特征和基于深度學(xué)習(xí)技術(shù)的方法。因目標(biāo)檢測在檢測過程中容易受物體尺度變化、目標(biāo)對象被遮擋、光照以及應(yīng)用場景變化等多種因素的影響;谑止ぬ卣鞯姆椒ㄈ菀资艿教卣鬟x擇的質(zhì)量的影響,導(dǎo)致應(yīng)用在實際場景中效果較差的問題;谏疃葘W(xué)習(xí)的方法利用卷積神經(jīng)網(wǎng)絡(luò)提取更深層次的特征,與基于手工特征的檢測方法相比,深度學(xué)習(xí)的檢測方法具有精度高、結(jié)構(gòu)靈活、特征自動提取等優(yōu)點,受到人們廣泛關(guān)注。當(dāng)前各種深度學(xué)習(xí)的檢測算法在各種競賽任務(wù)中取得了優(yōu)異的性能。從近些年在圖像分類競賽ImageNet[5]上使用的各種卷積神經(jīng)網(wǎng)絡(luò)[6]來看,CNN從擁有少量隱藏層的LeNet[7]、AlexNet[8]到深層的GoogLeNet[9]等網(wǎng)絡(luò),CNN通過不斷改進(jìn)網(wǎng)絡(luò)深度及寬度的方式逐漸提升分類效果。但是隨著網(wǎng)絡(luò)深度的增加,這些網(wǎng)絡(luò)的參數(shù)量和計算成本也在顯著的增加,往往需要依賴高算力的GPU進(jìn)行運(yùn)算。雖然卷積神經(jīng)網(wǎng)絡(luò)有稀疏連接、權(quán)重共享的優(yōu)點,使得CNN中的參數(shù)相比傳統(tǒng)網(wǎng)絡(luò)
南京信息工程大學(xué)碩士學(xué)位論文4說這些網(wǎng)絡(luò)并不能滿足任務(wù)需求。因此,如何對卷積神經(jīng)網(wǎng)絡(luò)模型的參數(shù)量及計算量進(jìn)行壓縮,使其能夠部署到低功耗、低算力的應(yīng)用平臺具有重要意義。圖1.3卷積網(wǎng)精度及參數(shù)量對比基于卷積神經(jīng)網(wǎng)絡(luò)的目標(biāo)檢測模型在部署應(yīng)用中受算力及存儲能力的制約,導(dǎo)致目標(biāo)檢測算法的研究與應(yīng)用受到一定的限制。因此,輕量級的目標(biāo)檢測模型的研究與實現(xiàn)變的越來越重要。近幾年,卷積神經(jīng)網(wǎng)絡(luò)為了進(jìn)一步提升模型的預(yù)測準(zhǔn)確率,在設(shè)計模型的實驗中多數(shù)方法是以犧牲參數(shù)量和計算量的方式實現(xiàn)。圖1.3展示了歷屆ImageNet競賽中冠軍網(wǎng)絡(luò)模型的層數(shù)以及Top1-accuracy和模型計算量對比。由圖1.3能夠看出近些年卷積神經(jīng)網(wǎng)絡(luò)在ImageNet的競賽任務(wù)中,為了提升模型精度,多數(shù)網(wǎng)絡(luò)通過擴(kuò)充深度以及網(wǎng)絡(luò)參數(shù)量的方式提升CNN性能,但是卷積神經(jīng)網(wǎng)絡(luò)模型深度及參數(shù)量的擴(kuò)充,會導(dǎo)致很多網(wǎng)絡(luò)模型很難部署到實際的硬件平臺中。以ImageNet分類競賽中使用的卷積神經(jīng)網(wǎng)絡(luò)為例,從2012年取得競賽第一的AlexNet到2014年的冠軍GoogLeNet卷積神經(jīng)網(wǎng)絡(luò),網(wǎng)絡(luò)的層數(shù)由最開始的7層逐漸增加到22層。從GoogLeNet卷積神經(jīng)網(wǎng)絡(luò)出現(xiàn)以后,以此為基礎(chǔ)衍生出一系列的Inception[10]模型,該方法通過利用多組卷積擴(kuò)寬網(wǎng)絡(luò)的方式實現(xiàn)參數(shù)量和計算量相對較少的網(wǎng)絡(luò)。Inception的網(wǎng)絡(luò)結(jié)構(gòu)設(shè)計可以維持當(dāng)前網(wǎng)絡(luò)深度的前提下實現(xiàn)低參數(shù)量計算量的卷積神經(jīng)網(wǎng)絡(luò),并取得了優(yōu)異的效果。但隨著卷積神經(jīng)網(wǎng)絡(luò)中殘差鏈接方式的出現(xiàn),2015年的冠軍模型ResNet[11]達(dá)到了驚人的
【參考文獻(xiàn)】:
期刊論文
[1]基于注意力機(jī)制和特征融合的SSD目標(biāo)檢測算法[J]. 高建瓴,孫健,王子牛,韓毓璐,馮嬌嬌. 軟件. 2020(02)
[2]基于深度學(xué)習(xí)的目標(biāo)檢測技術(shù)的研究綜述[J]. 羅元,王薄宇,陳旭. 半導(dǎo)體光電. 2020(01)
[3]一種高效的稀疏卷積神經(jīng)網(wǎng)絡(luò)加速器的設(shè)計與實現(xiàn)[J]. 余成宇,李志遠(yuǎn),毛文宇,魯華祥. 智能系統(tǒng)學(xué)報. 2020(02)
[4]結(jié)合剪枝與流合并的卷積神經(jīng)網(wǎng)絡(luò)加速壓縮方法[J]. 謝斌紅,鐘日新,潘理虎,張英俊. 計算機(jī)應(yīng)用. 2020(03)
[5]深度神經(jīng)網(wǎng)絡(luò)模型壓縮綜述[J]. 李江昀,趙義凱,薛卓爾,蔡錚,李擎. 工程科學(xué)學(xué)報. 2019(10)
[6]自動駕駛汽車離我們有多遠(yuǎn)[J]. 辛妍. 新經(jīng)濟(jì)導(dǎo)刊. 2016(Z1)
[7]場景圖像分類技術(shù)綜述[J]. 李學(xué)龍,史建華,董永生,陶大程. 中國科學(xué):信息科學(xué). 2015(07)
碩士論文
[1]基于標(biāo)簽關(guān)聯(lián)的圖像分類方法研究[D]. 陳龍.合肥工業(yè)大學(xué) 2019
[2]輔助駕駛中基于單幅圖像的復(fù)雜道路場景分類方法研究[D]. 楊景超.燕山大學(xué) 2016
[3]基于機(jī)器視覺的自主無人車道路識別研究[D]. 張博峰.西安工業(yè)大學(xué) 2014
[4]基于分塊顏色直方圖和HOG特征的粒子濾波跟蹤[D]. 陶立超.上海交通大學(xué) 2012
本文編號:3607221
【文章來源】:南京信息工程大學(xué)江蘇省
【文章頁數(shù)】:62 頁
【學(xué)位級別】:碩士
【部分圖文】:
目標(biāo)檢測算法在輔助駕駛中的應(yīng)用示意圖
第一章緒論3基于場景感知結(jié)果的基礎(chǔ)上(圖1.2右上角給出了一個場景分類器感知結(jié)果),對目標(biāo)檢測閾值做出不同于正常情況下的調(diào)整,提高目標(biāo)檢測的準(zhǔn)確率。圖1.2場景理解與ADAS檢測可視化圖1.2是因汽車逆光行駛產(chǎn)生攝像頭成像曝光的場景圖像,這種極端場景會對輔助駕駛系統(tǒng)和駕駛員做出預(yù)警反應(yīng)會有不同程度的影響,此外高級輔助駕駛系統(tǒng)在雨雪場景、大霧天氣的極端場景與多云天氣、高速道路行車場景中進(jìn)行車速調(diào)整、防碰撞預(yù)警以及道路區(qū)域提取等參數(shù)調(diào)整也有著很大區(qū)別。因此,在汽車高級輔助駕駛系統(tǒng)中利用場景分類實現(xiàn)對道路場景語義理解,這對確保車輛行駛安全有著重要意義。1.3研究現(xiàn)狀1.3.1輕量級目標(biāo)檢測研究現(xiàn)狀目標(biāo)檢測作為計算機(jī)視覺應(yīng)用研究中的熱點和難點之一,主要可以分為基于手工特征和基于深度學(xué)習(xí)技術(shù)的方法。因目標(biāo)檢測在檢測過程中容易受物體尺度變化、目標(biāo)對象被遮擋、光照以及應(yīng)用場景變化等多種因素的影響;谑止ぬ卣鞯姆椒ㄈ菀资艿教卣鬟x擇的質(zhì)量的影響,導(dǎo)致應(yīng)用在實際場景中效果較差的問題;谏疃葘W(xué)習(xí)的方法利用卷積神經(jīng)網(wǎng)絡(luò)提取更深層次的特征,與基于手工特征的檢測方法相比,深度學(xué)習(xí)的檢測方法具有精度高、結(jié)構(gòu)靈活、特征自動提取等優(yōu)點,受到人們廣泛關(guān)注。當(dāng)前各種深度學(xué)習(xí)的檢測算法在各種競賽任務(wù)中取得了優(yōu)異的性能。從近些年在圖像分類競賽ImageNet[5]上使用的各種卷積神經(jīng)網(wǎng)絡(luò)[6]來看,CNN從擁有少量隱藏層的LeNet[7]、AlexNet[8]到深層的GoogLeNet[9]等網(wǎng)絡(luò),CNN通過不斷改進(jìn)網(wǎng)絡(luò)深度及寬度的方式逐漸提升分類效果。但是隨著網(wǎng)絡(luò)深度的增加,這些網(wǎng)絡(luò)的參數(shù)量和計算成本也在顯著的增加,往往需要依賴高算力的GPU進(jìn)行運(yùn)算。雖然卷積神經(jīng)網(wǎng)絡(luò)有稀疏連接、權(quán)重共享的優(yōu)點,使得CNN中的參數(shù)相比傳統(tǒng)網(wǎng)絡(luò)
南京信息工程大學(xué)碩士學(xué)位論文4說這些網(wǎng)絡(luò)并不能滿足任務(wù)需求。因此,如何對卷積神經(jīng)網(wǎng)絡(luò)模型的參數(shù)量及計算量進(jìn)行壓縮,使其能夠部署到低功耗、低算力的應(yīng)用平臺具有重要意義。圖1.3卷積網(wǎng)精度及參數(shù)量對比基于卷積神經(jīng)網(wǎng)絡(luò)的目標(biāo)檢測模型在部署應(yīng)用中受算力及存儲能力的制約,導(dǎo)致目標(biāo)檢測算法的研究與應(yīng)用受到一定的限制。因此,輕量級的目標(biāo)檢測模型的研究與實現(xiàn)變的越來越重要。近幾年,卷積神經(jīng)網(wǎng)絡(luò)為了進(jìn)一步提升模型的預(yù)測準(zhǔn)確率,在設(shè)計模型的實驗中多數(shù)方法是以犧牲參數(shù)量和計算量的方式實現(xiàn)。圖1.3展示了歷屆ImageNet競賽中冠軍網(wǎng)絡(luò)模型的層數(shù)以及Top1-accuracy和模型計算量對比。由圖1.3能夠看出近些年卷積神經(jīng)網(wǎng)絡(luò)在ImageNet的競賽任務(wù)中,為了提升模型精度,多數(shù)網(wǎng)絡(luò)通過擴(kuò)充深度以及網(wǎng)絡(luò)參數(shù)量的方式提升CNN性能,但是卷積神經(jīng)網(wǎng)絡(luò)模型深度及參數(shù)量的擴(kuò)充,會導(dǎo)致很多網(wǎng)絡(luò)模型很難部署到實際的硬件平臺中。以ImageNet分類競賽中使用的卷積神經(jīng)網(wǎng)絡(luò)為例,從2012年取得競賽第一的AlexNet到2014年的冠軍GoogLeNet卷積神經(jīng)網(wǎng)絡(luò),網(wǎng)絡(luò)的層數(shù)由最開始的7層逐漸增加到22層。從GoogLeNet卷積神經(jīng)網(wǎng)絡(luò)出現(xiàn)以后,以此為基礎(chǔ)衍生出一系列的Inception[10]模型,該方法通過利用多組卷積擴(kuò)寬網(wǎng)絡(luò)的方式實現(xiàn)參數(shù)量和計算量相對較少的網(wǎng)絡(luò)。Inception的網(wǎng)絡(luò)結(jié)構(gòu)設(shè)計可以維持當(dāng)前網(wǎng)絡(luò)深度的前提下實現(xiàn)低參數(shù)量計算量的卷積神經(jīng)網(wǎng)絡(luò),并取得了優(yōu)異的效果。但隨著卷積神經(jīng)網(wǎng)絡(luò)中殘差鏈接方式的出現(xiàn),2015年的冠軍模型ResNet[11]達(dá)到了驚人的
【參考文獻(xiàn)】:
期刊論文
[1]基于注意力機(jī)制和特征融合的SSD目標(biāo)檢測算法[J]. 高建瓴,孫健,王子牛,韓毓璐,馮嬌嬌. 軟件. 2020(02)
[2]基于深度學(xué)習(xí)的目標(biāo)檢測技術(shù)的研究綜述[J]. 羅元,王薄宇,陳旭. 半導(dǎo)體光電. 2020(01)
[3]一種高效的稀疏卷積神經(jīng)網(wǎng)絡(luò)加速器的設(shè)計與實現(xiàn)[J]. 余成宇,李志遠(yuǎn),毛文宇,魯華祥. 智能系統(tǒng)學(xué)報. 2020(02)
[4]結(jié)合剪枝與流合并的卷積神經(jīng)網(wǎng)絡(luò)加速壓縮方法[J]. 謝斌紅,鐘日新,潘理虎,張英俊. 計算機(jī)應(yīng)用. 2020(03)
[5]深度神經(jīng)網(wǎng)絡(luò)模型壓縮綜述[J]. 李江昀,趙義凱,薛卓爾,蔡錚,李擎. 工程科學(xué)學(xué)報. 2019(10)
[6]自動駕駛汽車離我們有多遠(yuǎn)[J]. 辛妍. 新經(jīng)濟(jì)導(dǎo)刊. 2016(Z1)
[7]場景圖像分類技術(shù)綜述[J]. 李學(xué)龍,史建華,董永生,陶大程. 中國科學(xué):信息科學(xué). 2015(07)
碩士論文
[1]基于標(biāo)簽關(guān)聯(lián)的圖像分類方法研究[D]. 陳龍.合肥工業(yè)大學(xué) 2019
[2]輔助駕駛中基于單幅圖像的復(fù)雜道路場景分類方法研究[D]. 楊景超.燕山大學(xué) 2016
[3]基于機(jī)器視覺的自主無人車道路識別研究[D]. 張博峰.西安工業(yè)大學(xué) 2014
[4]基于分塊顏色直方圖和HOG特征的粒子濾波跟蹤[D]. 陶立超.上海交通大學(xué) 2012
本文編號:3607221
本文鏈接:http://sikaile.net/kejilunwen/qiche/3607221.html
最近更新
教材專著