基于深度學(xué)習(xí)的輕量級(jí)目標(biāo)檢測(cè)和場(chǎng)景分類(lèi)算法研究
發(fā)布時(shí)間:2022-01-24 20:08
隨著計(jì)算機(jī)視覺(jué)的發(fā)展,基于深度學(xué)習(xí)的各種技術(shù)已集成在高級(jí)輔助駕駛系統(tǒng)(ADAS)中。如何從算法和系統(tǒng)層面提升ADAS的性能成為當(dāng)前研究熱點(diǎn)之一。本文以輔助駕駛應(yīng)用中的輕量級(jí)目標(biāo)檢測(cè)和場(chǎng)景分類(lèi)算法作為研究對(duì)象,主要研究?jī)?nèi)容如下:提出一種基于YOLOv3-Tiny改進(jìn)的輕量級(jí)目標(biāo)檢測(cè)算法。本文在不損失精度的情況下,實(shí)現(xiàn)對(duì)目標(biāo)檢測(cè)主干網(wǎng)絡(luò)進(jìn)行輕量化壓縮,主要改進(jìn)有以下兩個(gè)方面。第一,改進(jìn)和壓縮YOLOv3-Tiny提取特征的主干網(wǎng)絡(luò)部分,使用深度可分離卷積以及倒殘差的方式減少網(wǎng)絡(luò)參數(shù)和計(jì)算量;第二,利用注意力機(jī)制對(duì)卷積層輸出的特征圖(Feature map)沿著通道和空間兩個(gè)維度依次推斷出注意力權(quán)重,并將注意力權(quán)重與原特征圖相乘實(shí)現(xiàn)對(duì)特征的自適應(yīng)調(diào)整進(jìn)而提升網(wǎng)絡(luò)的表征能力。針對(duì)以上兩點(diǎn)改進(jìn),本文分別在國(guó)際公開(kāi)通用多目標(biāo)檢測(cè)數(shù)據(jù)集(2007+2012)、國(guó)際公開(kāi)自動(dòng)駕駛數(shù)據(jù)庫(kù)(KITTI)以及自行搭建車(chē)載攝像系統(tǒng)并收集的ADAS專(zhuān)用數(shù)據(jù)庫(kù)上進(jìn)行了驗(yàn)證。實(shí)驗(yàn)結(jié)果證明了本方法的有效性,在實(shí)現(xiàn)壓縮網(wǎng)絡(luò)計(jì)算量和參數(shù)量的情況下,本文改進(jìn)的新方法與原算法相比在VOC2007Test數(shù)據(jù)集上的檢測(cè)性能比當(dāng)前...
【文章來(lái)源】:南京信息工程大學(xué)江蘇省
【文章頁(yè)數(shù)】:62 頁(yè)
【學(xué)位級(jí)別】:碩士
【部分圖文】:
目標(biāo)檢測(cè)算法在輔助駕駛中的應(yīng)用示意圖
第一章緒論3基于場(chǎng)景感知結(jié)果的基礎(chǔ)上(圖1.2右上角給出了一個(gè)場(chǎng)景分類(lèi)器感知結(jié)果),對(duì)目標(biāo)檢測(cè)閾值做出不同于正常情況下的調(diào)整,提高目標(biāo)檢測(cè)的準(zhǔn)確率。圖1.2場(chǎng)景理解與ADAS檢測(cè)可視化圖1.2是因汽車(chē)逆光行駛產(chǎn)生攝像頭成像曝光的場(chǎng)景圖像,這種極端場(chǎng)景會(huì)對(duì)輔助駕駛系統(tǒng)和駕駛員做出預(yù)警反應(yīng)會(huì)有不同程度的影響,此外高級(jí)輔助駕駛系統(tǒng)在雨雪場(chǎng)景、大霧天氣的極端場(chǎng)景與多云天氣、高速道路行車(chē)場(chǎng)景中進(jìn)行車(chē)速調(diào)整、防碰撞預(yù)警以及道路區(qū)域提取等參數(shù)調(diào)整也有著很大區(qū)別。因此,在汽車(chē)高級(jí)輔助駕駛系統(tǒng)中利用場(chǎng)景分類(lèi)實(shí)現(xiàn)對(duì)道路場(chǎng)景語(yǔ)義理解,這對(duì)確保車(chē)輛行駛安全有著重要意義。1.3研究現(xiàn)狀1.3.1輕量級(jí)目標(biāo)檢測(cè)研究現(xiàn)狀目標(biāo)檢測(cè)作為計(jì)算機(jī)視覺(jué)應(yīng)用研究中的熱點(diǎn)和難點(diǎn)之一,主要可以分為基于手工特征和基于深度學(xué)習(xí)技術(shù)的方法。因目標(biāo)檢測(cè)在檢測(cè)過(guò)程中容易受物體尺度變化、目標(biāo)對(duì)象被遮擋、光照以及應(yīng)用場(chǎng)景變化等多種因素的影響;谑止ぬ卣鞯姆椒ㄈ菀资艿教卣鬟x擇的質(zhì)量的影響,導(dǎo)致應(yīng)用在實(shí)際場(chǎng)景中效果較差的問(wèn)題;谏疃葘W(xué)習(xí)的方法利用卷積神經(jīng)網(wǎng)絡(luò)提取更深層次的特征,與基于手工特征的檢測(cè)方法相比,深度學(xué)習(xí)的檢測(cè)方法具有精度高、結(jié)構(gòu)靈活、特征自動(dòng)提取等優(yōu)點(diǎn),受到人們廣泛關(guān)注。當(dāng)前各種深度學(xué)習(xí)的檢測(cè)算法在各種競(jìng)賽任務(wù)中取得了優(yōu)異的性能。從近些年在圖像分類(lèi)競(jìng)賽ImageNet[5]上使用的各種卷積神經(jīng)網(wǎng)絡(luò)[6]來(lái)看,CNN從擁有少量隱藏層的LeNet[7]、AlexNet[8]到深層的GoogLeNet[9]等網(wǎng)絡(luò),CNN通過(guò)不斷改進(jìn)網(wǎng)絡(luò)深度及寬度的方式逐漸提升分類(lèi)效果。但是隨著網(wǎng)絡(luò)深度的增加,這些網(wǎng)絡(luò)的參數(shù)量和計(jì)算成本也在顯著的增加,往往需要依賴(lài)高算力的GPU進(jìn)行運(yùn)算。雖然卷積神經(jīng)網(wǎng)絡(luò)有稀疏連接、權(quán)重共享的優(yōu)點(diǎn),使得CNN中的參數(shù)相比傳統(tǒng)網(wǎng)絡(luò)
南京信息工程大學(xué)碩士學(xué)位論文4說(shuō)這些網(wǎng)絡(luò)并不能滿(mǎn)足任務(wù)需求。因此,如何對(duì)卷積神經(jīng)網(wǎng)絡(luò)模型的參數(shù)量及計(jì)算量進(jìn)行壓縮,使其能夠部署到低功耗、低算力的應(yīng)用平臺(tái)具有重要意義。圖1.3卷積網(wǎng)精度及參數(shù)量對(duì)比基于卷積神經(jīng)網(wǎng)絡(luò)的目標(biāo)檢測(cè)模型在部署應(yīng)用中受算力及存儲(chǔ)能力的制約,導(dǎo)致目標(biāo)檢測(cè)算法的研究與應(yīng)用受到一定的限制。因此,輕量級(jí)的目標(biāo)檢測(cè)模型的研究與實(shí)現(xiàn)變的越來(lái)越重要。近幾年,卷積神經(jīng)網(wǎng)絡(luò)為了進(jìn)一步提升模型的預(yù)測(cè)準(zhǔn)確率,在設(shè)計(jì)模型的實(shí)驗(yàn)中多數(shù)方法是以犧牲參數(shù)量和計(jì)算量的方式實(shí)現(xiàn)。圖1.3展示了歷屆ImageNet競(jìng)賽中冠軍網(wǎng)絡(luò)模型的層數(shù)以及Top1-accuracy和模型計(jì)算量對(duì)比。由圖1.3能夠看出近些年卷積神經(jīng)網(wǎng)絡(luò)在ImageNet的競(jìng)賽任務(wù)中,為了提升模型精度,多數(shù)網(wǎng)絡(luò)通過(guò)擴(kuò)充深度以及網(wǎng)絡(luò)參數(shù)量的方式提升CNN性能,但是卷積神經(jīng)網(wǎng)絡(luò)模型深度及參數(shù)量的擴(kuò)充,會(huì)導(dǎo)致很多網(wǎng)絡(luò)模型很難部署到實(shí)際的硬件平臺(tái)中。以ImageNet分類(lèi)競(jìng)賽中使用的卷積神經(jīng)網(wǎng)絡(luò)為例,從2012年取得競(jìng)賽第一的AlexNet到2014年的冠軍GoogLeNet卷積神經(jīng)網(wǎng)絡(luò),網(wǎng)絡(luò)的層數(shù)由最開(kāi)始的7層逐漸增加到22層。從GoogLeNet卷積神經(jīng)網(wǎng)絡(luò)出現(xiàn)以后,以此為基礎(chǔ)衍生出一系列的Inception[10]模型,該方法通過(guò)利用多組卷積擴(kuò)寬網(wǎng)絡(luò)的方式實(shí)現(xiàn)參數(shù)量和計(jì)算量相對(duì)較少的網(wǎng)絡(luò)。Inception的網(wǎng)絡(luò)結(jié)構(gòu)設(shè)計(jì)可以維持當(dāng)前網(wǎng)絡(luò)深度的前提下實(shí)現(xiàn)低參數(shù)量計(jì)算量的卷積神經(jīng)網(wǎng)絡(luò),并取得了優(yōu)異的效果。但隨著卷積神經(jīng)網(wǎng)絡(luò)中殘差鏈接方式的出現(xiàn),2015年的冠軍模型ResNet[11]達(dá)到了驚人的
【參考文獻(xiàn)】:
期刊論文
[1]基于注意力機(jī)制和特征融合的SSD目標(biāo)檢測(cè)算法[J]. 高建瓴,孫健,王子牛,韓毓璐,馮嬌嬌. 軟件. 2020(02)
[2]基于深度學(xué)習(xí)的目標(biāo)檢測(cè)技術(shù)的研究綜述[J]. 羅元,王薄宇,陳旭. 半導(dǎo)體光電. 2020(01)
[3]一種高效的稀疏卷積神經(jīng)網(wǎng)絡(luò)加速器的設(shè)計(jì)與實(shí)現(xiàn)[J]. 余成宇,李志遠(yuǎn),毛文宇,魯華祥. 智能系統(tǒng)學(xué)報(bào). 2020(02)
[4]結(jié)合剪枝與流合并的卷積神經(jīng)網(wǎng)絡(luò)加速壓縮方法[J]. 謝斌紅,鐘日新,潘理虎,張英俊. 計(jì)算機(jī)應(yīng)用. 2020(03)
[5]深度神經(jīng)網(wǎng)絡(luò)模型壓縮綜述[J]. 李江昀,趙義凱,薛卓爾,蔡錚,李擎. 工程科學(xué)學(xué)報(bào). 2019(10)
[6]自動(dòng)駕駛汽車(chē)離我們有多遠(yuǎn)[J]. 辛妍. 新經(jīng)濟(jì)導(dǎo)刊. 2016(Z1)
[7]場(chǎng)景圖像分類(lèi)技術(shù)綜述[J]. 李學(xué)龍,史建華,董永生,陶大程. 中國(guó)科學(xué):信息科學(xué). 2015(07)
碩士論文
[1]基于標(biāo)簽關(guān)聯(lián)的圖像分類(lèi)方法研究[D]. 陳龍.合肥工業(yè)大學(xué) 2019
[2]輔助駕駛中基于單幅圖像的復(fù)雜道路場(chǎng)景分類(lèi)方法研究[D]. 楊景超.燕山大學(xué) 2016
[3]基于機(jī)器視覺(jué)的自主無(wú)人車(chē)道路識(shí)別研究[D]. 張博峰.西安工業(yè)大學(xué) 2014
[4]基于分塊顏色直方圖和HOG特征的粒子濾波跟蹤[D]. 陶立超.上海交通大學(xué) 2012
本文編號(hào):3607221
【文章來(lái)源】:南京信息工程大學(xué)江蘇省
【文章頁(yè)數(shù)】:62 頁(yè)
【學(xué)位級(jí)別】:碩士
【部分圖文】:
目標(biāo)檢測(cè)算法在輔助駕駛中的應(yīng)用示意圖
第一章緒論3基于場(chǎng)景感知結(jié)果的基礎(chǔ)上(圖1.2右上角給出了一個(gè)場(chǎng)景分類(lèi)器感知結(jié)果),對(duì)目標(biāo)檢測(cè)閾值做出不同于正常情況下的調(diào)整,提高目標(biāo)檢測(cè)的準(zhǔn)確率。圖1.2場(chǎng)景理解與ADAS檢測(cè)可視化圖1.2是因汽車(chē)逆光行駛產(chǎn)生攝像頭成像曝光的場(chǎng)景圖像,這種極端場(chǎng)景會(huì)對(duì)輔助駕駛系統(tǒng)和駕駛員做出預(yù)警反應(yīng)會(huì)有不同程度的影響,此外高級(jí)輔助駕駛系統(tǒng)在雨雪場(chǎng)景、大霧天氣的極端場(chǎng)景與多云天氣、高速道路行車(chē)場(chǎng)景中進(jìn)行車(chē)速調(diào)整、防碰撞預(yù)警以及道路區(qū)域提取等參數(shù)調(diào)整也有著很大區(qū)別。因此,在汽車(chē)高級(jí)輔助駕駛系統(tǒng)中利用場(chǎng)景分類(lèi)實(shí)現(xiàn)對(duì)道路場(chǎng)景語(yǔ)義理解,這對(duì)確保車(chē)輛行駛安全有著重要意義。1.3研究現(xiàn)狀1.3.1輕量級(jí)目標(biāo)檢測(cè)研究現(xiàn)狀目標(biāo)檢測(cè)作為計(jì)算機(jī)視覺(jué)應(yīng)用研究中的熱點(diǎn)和難點(diǎn)之一,主要可以分為基于手工特征和基于深度學(xué)習(xí)技術(shù)的方法。因目標(biāo)檢測(cè)在檢測(cè)過(guò)程中容易受物體尺度變化、目標(biāo)對(duì)象被遮擋、光照以及應(yīng)用場(chǎng)景變化等多種因素的影響;谑止ぬ卣鞯姆椒ㄈ菀资艿教卣鬟x擇的質(zhì)量的影響,導(dǎo)致應(yīng)用在實(shí)際場(chǎng)景中效果較差的問(wèn)題;谏疃葘W(xué)習(xí)的方法利用卷積神經(jīng)網(wǎng)絡(luò)提取更深層次的特征,與基于手工特征的檢測(cè)方法相比,深度學(xué)習(xí)的檢測(cè)方法具有精度高、結(jié)構(gòu)靈活、特征自動(dòng)提取等優(yōu)點(diǎn),受到人們廣泛關(guān)注。當(dāng)前各種深度學(xué)習(xí)的檢測(cè)算法在各種競(jìng)賽任務(wù)中取得了優(yōu)異的性能。從近些年在圖像分類(lèi)競(jìng)賽ImageNet[5]上使用的各種卷積神經(jīng)網(wǎng)絡(luò)[6]來(lái)看,CNN從擁有少量隱藏層的LeNet[7]、AlexNet[8]到深層的GoogLeNet[9]等網(wǎng)絡(luò),CNN通過(guò)不斷改進(jìn)網(wǎng)絡(luò)深度及寬度的方式逐漸提升分類(lèi)效果。但是隨著網(wǎng)絡(luò)深度的增加,這些網(wǎng)絡(luò)的參數(shù)量和計(jì)算成本也在顯著的增加,往往需要依賴(lài)高算力的GPU進(jìn)行運(yùn)算。雖然卷積神經(jīng)網(wǎng)絡(luò)有稀疏連接、權(quán)重共享的優(yōu)點(diǎn),使得CNN中的參數(shù)相比傳統(tǒng)網(wǎng)絡(luò)
南京信息工程大學(xué)碩士學(xué)位論文4說(shuō)這些網(wǎng)絡(luò)并不能滿(mǎn)足任務(wù)需求。因此,如何對(duì)卷積神經(jīng)網(wǎng)絡(luò)模型的參數(shù)量及計(jì)算量進(jìn)行壓縮,使其能夠部署到低功耗、低算力的應(yīng)用平臺(tái)具有重要意義。圖1.3卷積網(wǎng)精度及參數(shù)量對(duì)比基于卷積神經(jīng)網(wǎng)絡(luò)的目標(biāo)檢測(cè)模型在部署應(yīng)用中受算力及存儲(chǔ)能力的制約,導(dǎo)致目標(biāo)檢測(cè)算法的研究與應(yīng)用受到一定的限制。因此,輕量級(jí)的目標(biāo)檢測(cè)模型的研究與實(shí)現(xiàn)變的越來(lái)越重要。近幾年,卷積神經(jīng)網(wǎng)絡(luò)為了進(jìn)一步提升模型的預(yù)測(cè)準(zhǔn)確率,在設(shè)計(jì)模型的實(shí)驗(yàn)中多數(shù)方法是以犧牲參數(shù)量和計(jì)算量的方式實(shí)現(xiàn)。圖1.3展示了歷屆ImageNet競(jìng)賽中冠軍網(wǎng)絡(luò)模型的層數(shù)以及Top1-accuracy和模型計(jì)算量對(duì)比。由圖1.3能夠看出近些年卷積神經(jīng)網(wǎng)絡(luò)在ImageNet的競(jìng)賽任務(wù)中,為了提升模型精度,多數(shù)網(wǎng)絡(luò)通過(guò)擴(kuò)充深度以及網(wǎng)絡(luò)參數(shù)量的方式提升CNN性能,但是卷積神經(jīng)網(wǎng)絡(luò)模型深度及參數(shù)量的擴(kuò)充,會(huì)導(dǎo)致很多網(wǎng)絡(luò)模型很難部署到實(shí)際的硬件平臺(tái)中。以ImageNet分類(lèi)競(jìng)賽中使用的卷積神經(jīng)網(wǎng)絡(luò)為例,從2012年取得競(jìng)賽第一的AlexNet到2014年的冠軍GoogLeNet卷積神經(jīng)網(wǎng)絡(luò),網(wǎng)絡(luò)的層數(shù)由最開(kāi)始的7層逐漸增加到22層。從GoogLeNet卷積神經(jīng)網(wǎng)絡(luò)出現(xiàn)以后,以此為基礎(chǔ)衍生出一系列的Inception[10]模型,該方法通過(guò)利用多組卷積擴(kuò)寬網(wǎng)絡(luò)的方式實(shí)現(xiàn)參數(shù)量和計(jì)算量相對(duì)較少的網(wǎng)絡(luò)。Inception的網(wǎng)絡(luò)結(jié)構(gòu)設(shè)計(jì)可以維持當(dāng)前網(wǎng)絡(luò)深度的前提下實(shí)現(xiàn)低參數(shù)量計(jì)算量的卷積神經(jīng)網(wǎng)絡(luò),并取得了優(yōu)異的效果。但隨著卷積神經(jīng)網(wǎng)絡(luò)中殘差鏈接方式的出現(xiàn),2015年的冠軍模型ResNet[11]達(dá)到了驚人的
【參考文獻(xiàn)】:
期刊論文
[1]基于注意力機(jī)制和特征融合的SSD目標(biāo)檢測(cè)算法[J]. 高建瓴,孫健,王子牛,韓毓璐,馮嬌嬌. 軟件. 2020(02)
[2]基于深度學(xué)習(xí)的目標(biāo)檢測(cè)技術(shù)的研究綜述[J]. 羅元,王薄宇,陳旭. 半導(dǎo)體光電. 2020(01)
[3]一種高效的稀疏卷積神經(jīng)網(wǎng)絡(luò)加速器的設(shè)計(jì)與實(shí)現(xiàn)[J]. 余成宇,李志遠(yuǎn),毛文宇,魯華祥. 智能系統(tǒng)學(xué)報(bào). 2020(02)
[4]結(jié)合剪枝與流合并的卷積神經(jīng)網(wǎng)絡(luò)加速壓縮方法[J]. 謝斌紅,鐘日新,潘理虎,張英俊. 計(jì)算機(jī)應(yīng)用. 2020(03)
[5]深度神經(jīng)網(wǎng)絡(luò)模型壓縮綜述[J]. 李江昀,趙義凱,薛卓爾,蔡錚,李擎. 工程科學(xué)學(xué)報(bào). 2019(10)
[6]自動(dòng)駕駛汽車(chē)離我們有多遠(yuǎn)[J]. 辛妍. 新經(jīng)濟(jì)導(dǎo)刊. 2016(Z1)
[7]場(chǎng)景圖像分類(lèi)技術(shù)綜述[J]. 李學(xué)龍,史建華,董永生,陶大程. 中國(guó)科學(xué):信息科學(xué). 2015(07)
碩士論文
[1]基于標(biāo)簽關(guān)聯(lián)的圖像分類(lèi)方法研究[D]. 陳龍.合肥工業(yè)大學(xué) 2019
[2]輔助駕駛中基于單幅圖像的復(fù)雜道路場(chǎng)景分類(lèi)方法研究[D]. 楊景超.燕山大學(xué) 2016
[3]基于機(jī)器視覺(jué)的自主無(wú)人車(chē)道路識(shí)別研究[D]. 張博峰.西安工業(yè)大學(xué) 2014
[4]基于分塊顏色直方圖和HOG特征的粒子濾波跟蹤[D]. 陶立超.上海交通大學(xué) 2012
本文編號(hào):3607221
本文鏈接:http://sikaile.net/kejilunwen/qiche/3607221.html
最近更新
教材專(zhuān)著