復(fù)雜道路場景下的行人檢測方法研究
發(fā)布時(shí)間:2022-01-05 19:55
行人檢測是自動(dòng)駕駛、機(jī)器人、智能視頻監(jiān)控等領(lǐng)域的關(guān)鍵技術(shù),也是計(jì)算機(jī)視覺任務(wù)中的重要組成部分。近十年來,從早期傳統(tǒng)手工特征方法到現(xiàn)今主流的深度學(xué)習(xí)方法,行人檢測技術(shù)取得了巨大進(jìn)步。但是由于道路環(huán)境的復(fù)雜變化,行人目標(biāo)受到遮擋、光照變化等因素的影響,要實(shí)現(xiàn)準(zhǔn)確、快速且實(shí)用的檢測方法仍存在一定困難。本文圍繞行人檢測任務(wù)面臨的遮擋、全天候檢測中的光照變化問題開展研究,同時(shí)兼顧檢測的準(zhǔn)確度和實(shí)時(shí)性。本文主要研究內(nèi)容如下:針對(duì)目前遮擋行人特征提取困難導(dǎo)致檢測準(zhǔn)確度較低的問題,提出了一種基于注意力機(jī)制的檢測方法。該方法首先采用金字塔結(jié)構(gòu)的特征提取網(wǎng)絡(luò)獲取圖像不同尺度和信息量的特征。然后基于特征通道和空間注意力機(jī)制設(shè)計(jì)了一種注意力模塊,引導(dǎo)網(wǎng)絡(luò)關(guān)注并突出遮擋目標(biāo),并將該模塊嵌入到多尺度特征融合過程中,以增強(qiáng)網(wǎng)絡(luò)對(duì)于遮擋目標(biāo)的特征表達(dá)能力。最后,不同于主流方法采用的基于先驗(yàn)框的預(yù)測方式,該方法將行人檢測問題轉(zhuǎn)化為高層語義特征檢測問題,采用激活圖的形式得到預(yù)測結(jié)果。通過在公開數(shù)據(jù)集上進(jìn)行的實(shí)驗(yàn),驗(yàn)證了該方法在遮擋行人檢測準(zhǔn)確度和實(shí)時(shí)性上具有優(yōu)勢。針對(duì)全天候行人檢測任務(wù)中存在的光照變化問題,特別是夜間低照...
【文章來源】:重慶郵電大學(xué)重慶市
【文章頁數(shù)】:73 頁
【學(xué)位級(jí)別】:碩士
【部分圖文】:
聚合通道特征算法流程[13]
重慶郵電大學(xué)碩士學(xué)位論文第2章行人檢測技術(shù)理論基礎(chǔ)122.聚合通道特征聚合通道特征是P.Dollar等人[13]提出的一種用于目標(biāo)檢測的特征提取方法,其主要特點(diǎn)在于多尺度的圖像特征可以通過從臨近尺度近似計(jì)算得到,而不用逐一顯式計(jì)算每個(gè)尺度的特征,從而減少了計(jì)算量。算法流程如圖2.2所示。圖2.2聚合通道特征算法流程[13]首先對(duì)于輸入圖像I,通過具有平移不變性的轉(zhuǎn)換函數(shù)得到多個(gè)特征通道C(I),并通過近似計(jì)算構(gòu)建特征金字塔;然后將每個(gè)特征通道分割為44的塊(block),并對(duì)每個(gè)塊求和作為通道特征;最后連接各通道特征得到ACF特征向量。ACF共使用了10個(gè)特征通道包括3個(gè)顏色通道(LUV)、1個(gè)梯度幅值通道、6個(gè)梯度方向通道。與積分通道特征ICF相比,ACF簡化了積分圖計(jì)算,使用固定大小的塊求和提取特征。同時(shí)近似計(jì)算得到的特征金字塔也進(jìn)一步加快了計(jì)算速度。3.卷積網(wǎng)絡(luò)特征卷積神經(jīng)網(wǎng)絡(luò)特征與手工特征最大的區(qū)別在于前者是通過卷積神經(jīng)網(wǎng)絡(luò)從輸入圖像中通過學(xué)習(xí)的方式自動(dòng)提取得到的,屬于數(shù)據(jù)驅(qū)動(dòng)型。得益于人工智能技術(shù)的發(fā)展,目前主流行人檢測方法多采用神經(jīng)網(wǎng)絡(luò)作為特征提取器。圖2.3LeNet-5網(wǎng)絡(luò)結(jié)構(gòu)[53]目前采用最廣泛的卷積網(wǎng)絡(luò)形式為全卷積神經(jīng)網(wǎng)絡(luò)(FullyConvolutionalNetworks,F(xiàn)CN),而經(jīng)典的CNN結(jié)構(gòu)如LeNet[53]通常由卷積層和池化層交替構(gòu)成,如圖2.3所示,輸出端則為全連接層(FullyConnection,F(xiàn)C)。相比于全連接網(wǎng)絡(luò),基于局部連接和權(quán)值共享的卷積網(wǎng)絡(luò)在計(jì)算量和泛化能力上更具有優(yōu)勢[54]。但兩者
重慶郵電大學(xué)碩士學(xué)位論文第2章行人檢測技術(shù)理論基礎(chǔ)13在訓(xùn)練優(yōu)化方面原理是一致的,可以通過誤差反向傳播算法(Back-propagation,BP)進(jìn)行學(xué)習(xí)。卷積網(wǎng)絡(luò)的特征提取能力往往由網(wǎng)絡(luò)結(jié)構(gòu)決定。目前出現(xiàn)了一大批優(yōu)秀的卷積網(wǎng)絡(luò)模型如VGG[55]、Inception[56]、ResNet[57],這些網(wǎng)絡(luò)模型通常作為檢測器的主干網(wǎng)絡(luò)用于提取高層語義特征。與傳統(tǒng)手工特征相比,基于逐層抽象的卷積網(wǎng)絡(luò)提取特征的能力更強(qiáng)但需要大量數(shù)據(jù)進(jìn)行訓(xùn)練,同時(shí)計(jì)算量也更大。如何設(shè)計(jì)小巧且表達(dá)能力強(qiáng)的網(wǎng)絡(luò)成為了該領(lǐng)域的研究熱點(diǎn)之一。2.1.2分類與回歸從輸入圖像提取到有效的特征后,將特征輸入分類器或回歸器中得到最終的檢測結(jié)構(gòu)。常用的分類器有SVM、AdaBoost、神經(jīng)網(wǎng)絡(luò)。1.SVM是一種常用于二分類任務(wù)的經(jīng)典分類算法,通過尋找一個(gè)超平面來最大化樣本到該平面的距離從而實(shí)現(xiàn)分類。如圖2.4所示,設(shè)給定的特征空間上有訓(xùn)練樣本(,)iixy,i1,2,L,N,其中Nix為第i個(gè)訓(xùn)練樣本,{1,1}iy為對(duì)應(yīng)的標(biāo)簽,并假設(shè)訓(xùn)練集線性可分。對(duì)于超平面0Twxb,容易得到分類間隔(margin)為2w,為最大化間隔僅需最小化2w,即滿足式(2.4)。2,1min2..()1,1,2,,wbTiiwstywxbiNL(2.4)上式可通過構(gòu)造拉格朗日函數(shù)求解鞍點(diǎn)獲得最優(yōu)解。圖2.4SVM超平面示例
【參考文獻(xiàn)】:
期刊論文
[1]自動(dòng)駕駛汽車測試技術(shù)與應(yīng)用進(jìn)展[J]. 余卓平,邢星宇,陳君毅. 同濟(jì)大學(xué)學(xué)報(bào)(自然科學(xué)版). 2019(04)
[2]道路交通網(wǎng)絡(luò)安全風(fēng)險(xiǎn)辨識(shí)研究進(jìn)展[J]. 陸建,程澤陽. 東南大學(xué)學(xué)報(bào)(自然科學(xué)版). 2019(02)
[3]基于深度學(xué)習(xí)的自動(dòng)駕駛技術(shù)綜述[J]. 張新鈺,高洪波,趙建輝,周沫. 清華大學(xué)學(xué)報(bào)(自然科學(xué)版). 2018(04)
[4]圖像理解中的卷積神經(jīng)網(wǎng)絡(luò)[J]. 常亮,鄧小明,周明全,武仲科,袁野,楊碩,王宏安. 自動(dòng)化學(xué)報(bào). 2016(09)
[5]面向輔助駕駛的夜間行人檢測方法[J]. 莊家俊,劉瓊. 華南理工大學(xué)學(xué)報(bào)(自然科學(xué)版). 2012(08)
[6]行人檢測技術(shù)綜述[J]. 蘇松志,李紹滋,陳淑媛,蔡國榕,吳云東. 電子學(xué)報(bào). 2012(04)
博士論文
[1]可見光與長波紅外圖像融合的行人檢測方法研究[D]. 官大衍.浙江大學(xué) 2019
本文編號(hào):3570979
【文章來源】:重慶郵電大學(xué)重慶市
【文章頁數(shù)】:73 頁
【學(xué)位級(jí)別】:碩士
【部分圖文】:
聚合通道特征算法流程[13]
重慶郵電大學(xué)碩士學(xué)位論文第2章行人檢測技術(shù)理論基礎(chǔ)122.聚合通道特征聚合通道特征是P.Dollar等人[13]提出的一種用于目標(biāo)檢測的特征提取方法,其主要特點(diǎn)在于多尺度的圖像特征可以通過從臨近尺度近似計(jì)算得到,而不用逐一顯式計(jì)算每個(gè)尺度的特征,從而減少了計(jì)算量。算法流程如圖2.2所示。圖2.2聚合通道特征算法流程[13]首先對(duì)于輸入圖像I,通過具有平移不變性的轉(zhuǎn)換函數(shù)得到多個(gè)特征通道C(I),并通過近似計(jì)算構(gòu)建特征金字塔;然后將每個(gè)特征通道分割為44的塊(block),并對(duì)每個(gè)塊求和作為通道特征;最后連接各通道特征得到ACF特征向量。ACF共使用了10個(gè)特征通道包括3個(gè)顏色通道(LUV)、1個(gè)梯度幅值通道、6個(gè)梯度方向通道。與積分通道特征ICF相比,ACF簡化了積分圖計(jì)算,使用固定大小的塊求和提取特征。同時(shí)近似計(jì)算得到的特征金字塔也進(jìn)一步加快了計(jì)算速度。3.卷積網(wǎng)絡(luò)特征卷積神經(jīng)網(wǎng)絡(luò)特征與手工特征最大的區(qū)別在于前者是通過卷積神經(jīng)網(wǎng)絡(luò)從輸入圖像中通過學(xué)習(xí)的方式自動(dòng)提取得到的,屬于數(shù)據(jù)驅(qū)動(dòng)型。得益于人工智能技術(shù)的發(fā)展,目前主流行人檢測方法多采用神經(jīng)網(wǎng)絡(luò)作為特征提取器。圖2.3LeNet-5網(wǎng)絡(luò)結(jié)構(gòu)[53]目前采用最廣泛的卷積網(wǎng)絡(luò)形式為全卷積神經(jīng)網(wǎng)絡(luò)(FullyConvolutionalNetworks,F(xiàn)CN),而經(jīng)典的CNN結(jié)構(gòu)如LeNet[53]通常由卷積層和池化層交替構(gòu)成,如圖2.3所示,輸出端則為全連接層(FullyConnection,F(xiàn)C)。相比于全連接網(wǎng)絡(luò),基于局部連接和權(quán)值共享的卷積網(wǎng)絡(luò)在計(jì)算量和泛化能力上更具有優(yōu)勢[54]。但兩者
重慶郵電大學(xué)碩士學(xué)位論文第2章行人檢測技術(shù)理論基礎(chǔ)13在訓(xùn)練優(yōu)化方面原理是一致的,可以通過誤差反向傳播算法(Back-propagation,BP)進(jìn)行學(xué)習(xí)。卷積網(wǎng)絡(luò)的特征提取能力往往由網(wǎng)絡(luò)結(jié)構(gòu)決定。目前出現(xiàn)了一大批優(yōu)秀的卷積網(wǎng)絡(luò)模型如VGG[55]、Inception[56]、ResNet[57],這些網(wǎng)絡(luò)模型通常作為檢測器的主干網(wǎng)絡(luò)用于提取高層語義特征。與傳統(tǒng)手工特征相比,基于逐層抽象的卷積網(wǎng)絡(luò)提取特征的能力更強(qiáng)但需要大量數(shù)據(jù)進(jìn)行訓(xùn)練,同時(shí)計(jì)算量也更大。如何設(shè)計(jì)小巧且表達(dá)能力強(qiáng)的網(wǎng)絡(luò)成為了該領(lǐng)域的研究熱點(diǎn)之一。2.1.2分類與回歸從輸入圖像提取到有效的特征后,將特征輸入分類器或回歸器中得到最終的檢測結(jié)構(gòu)。常用的分類器有SVM、AdaBoost、神經(jīng)網(wǎng)絡(luò)。1.SVM是一種常用于二分類任務(wù)的經(jīng)典分類算法,通過尋找一個(gè)超平面來最大化樣本到該平面的距離從而實(shí)現(xiàn)分類。如圖2.4所示,設(shè)給定的特征空間上有訓(xùn)練樣本(,)iixy,i1,2,L,N,其中Nix為第i個(gè)訓(xùn)練樣本,{1,1}iy為對(duì)應(yīng)的標(biāo)簽,并假設(shè)訓(xùn)練集線性可分。對(duì)于超平面0Twxb,容易得到分類間隔(margin)為2w,為最大化間隔僅需最小化2w,即滿足式(2.4)。2,1min2..()1,1,2,,wbTiiwstywxbiNL(2.4)上式可通過構(gòu)造拉格朗日函數(shù)求解鞍點(diǎn)獲得最優(yōu)解。圖2.4SVM超平面示例
【參考文獻(xiàn)】:
期刊論文
[1]自動(dòng)駕駛汽車測試技術(shù)與應(yīng)用進(jìn)展[J]. 余卓平,邢星宇,陳君毅. 同濟(jì)大學(xué)學(xué)報(bào)(自然科學(xué)版). 2019(04)
[2]道路交通網(wǎng)絡(luò)安全風(fēng)險(xiǎn)辨識(shí)研究進(jìn)展[J]. 陸建,程澤陽. 東南大學(xué)學(xué)報(bào)(自然科學(xué)版). 2019(02)
[3]基于深度學(xué)習(xí)的自動(dòng)駕駛技術(shù)綜述[J]. 張新鈺,高洪波,趙建輝,周沫. 清華大學(xué)學(xué)報(bào)(自然科學(xué)版). 2018(04)
[4]圖像理解中的卷積神經(jīng)網(wǎng)絡(luò)[J]. 常亮,鄧小明,周明全,武仲科,袁野,楊碩,王宏安. 自動(dòng)化學(xué)報(bào). 2016(09)
[5]面向輔助駕駛的夜間行人檢測方法[J]. 莊家俊,劉瓊. 華南理工大學(xué)學(xué)報(bào)(自然科學(xué)版). 2012(08)
[6]行人檢測技術(shù)綜述[J]. 蘇松志,李紹滋,陳淑媛,蔡國榕,吳云東. 電子學(xué)報(bào). 2012(04)
博士論文
[1]可見光與長波紅外圖像融合的行人檢測方法研究[D]. 官大衍.浙江大學(xué) 2019
本文編號(hào):3570979
本文鏈接:http://sikaile.net/kejilunwen/shengwushengchang/3570979.html
最近更新
教材專著