復(fù)雜場(chǎng)景中的行人檢測(cè)算法研究
發(fā)布時(shí)間:2021-11-18 06:54
行人檢測(cè)的任務(wù)是判斷給定的圖像中是否包含行人并給出坐標(biāo),有廣泛的應(yīng)用前景。基于人工設(shè)計(jì)特征的行人檢測(cè)算法不能有效解決復(fù)雜場(chǎng)景中的的行人檢測(cè)問題,導(dǎo)致出現(xiàn)較嚴(yán)重的誤檢和漏檢情況,而目前所用的基于深度學(xué)習(xí)的行人檢測(cè)算法不能有效利用圖像語(yǔ)義信息,針對(duì)以上問題,本文做了以下研究工作:1.針對(duì)基于人工設(shè)計(jì)特征的行人檢測(cè)算法不能有效解決復(fù)雜場(chǎng)景中的行人檢測(cè)問題,提出一種基于多級(jí)特征融合的行人檢測(cè)算法,為了增強(qiáng)卷積神經(jīng)網(wǎng)絡(luò)提取特征的魯棒性,在現(xiàn)有網(wǎng)絡(luò)結(jié)構(gòu)基礎(chǔ)上改進(jìn)得到的網(wǎng)絡(luò)模型結(jié)合卷積神經(jīng)網(wǎng)絡(luò)淺層和深層特征,實(shí)驗(yàn)表明,該算法在場(chǎng)景較復(fù)雜的數(shù)據(jù)集中也有較好的檢測(cè)性能,同時(shí)增強(qiáng)算法的魯棒性。2.針對(duì)選擇性搜索算法產(chǎn)生候選區(qū)域速度慢且冗余高的問題,提出行人候選區(qū)域去冗余算法,使用多策略融合方式產(chǎn)生質(zhì)量更高的行人候選區(qū)域以提高算法的檢測(cè)性能,通過結(jié)合二值規(guī)范化梯度和行人檢測(cè)器,降低了所生成候選區(qū)域的冗余度,實(shí)驗(yàn)表明,對(duì)于行人檢測(cè)任務(wù),所提出的行人候選區(qū)域去冗余算法能夠以很快的速度產(chǎn)生高質(zhì)量的行人候選區(qū)域。3.為了進(jìn)一步降低復(fù)雜背景對(duì)算法性能的影響同時(shí)有效利用圖像本身語(yǔ)義信息,提出基于分割語(yǔ)義優(yōu)化的行人檢測(cè)算...
【文章來源】:南京郵電大學(xué)江蘇省
【文章頁(yè)數(shù)】:64 頁(yè)
【學(xué)位級(jí)別】:碩士
【部分圖文】:
CaffeNet網(wǎng)絡(luò)結(jié)構(gòu)下的深度學(xué)習(xí)特征示例圖
南京郵電大學(xué)碩士研究生學(xué)位論文 第三章基于多級(jí)特征融合的行人檢測(cè)算法研究set06~set10 五個(gè)子集,按照每 30 幀提取一幀共得到 4024 張測(cè)試圖像,圖像大小為 640 480,分辨率普遍較低且行人尺寸較小,測(cè)試集中行人正樣本定義為高度超過 49 個(gè)像素,遮擋小于35%的行人,是所有行人檢測(cè)數(shù)據(jù)集中較難檢測(cè)的數(shù)據(jù)集。該測(cè)試集中的行人包含了遮擋、行人姿態(tài)和雜亂背景等復(fù)雜場(chǎng)景中行人檢測(cè)算法需要解決的各種技術(shù)難點(diǎn),如圖 3.6 所示為Caltech 數(shù)據(jù)集測(cè)試集圖像示例。使用選擇搜索性算法在測(cè)試集圖像上得到行人候選區(qū)域,在每張圖像上產(chǎn)生約 2000 個(gè)行人候選區(qū)并用上述訓(xùn)練得到的多級(jí)特征融合網(wǎng)絡(luò)模型做分類,判斷該區(qū)域是不是行人區(qū)域,并以 MissRate 為評(píng)價(jià)標(biāo)準(zhǔn)的前提下和其他算法做比較。
南京郵電大學(xué)碩士研究生學(xué)位論文 第三章基于多級(jí)特征融合的行人檢測(cè)算法研究卷積神經(jīng)網(wǎng)絡(luò)提取的低層特征和高層特征得到魯棒性較強(qiáng)的多級(jí)融合特征訓(xùn)練分類器,在一定程度上提高算法效果,但是距離完美解決 Caltech 行人數(shù)據(jù)集上的檢測(cè)任務(wù)還有很長(zhǎng)距離,針對(duì)其算法缺陷,分析其性能改進(jìn)可能存在于以下方面:行人候選區(qū)域產(chǎn)生步驟的優(yōu)化。上述基于多級(jí)特征融合的行人檢測(cè)算法以選擇性搜索算法作為其候選區(qū)域產(chǎn)生器,在每張圖像上產(chǎn)生約 2000 個(gè)行人候選區(qū)是不實(shí)際的,因?yàn)閱螐垐D像上不可能同時(shí)存在這么多行人,產(chǎn)生的 2000 個(gè)行人候選區(qū)域中,有將近 99%都是冗余窗口,而這些區(qū)域的存在一方面會(huì)增加后續(xù)算法的計(jì)算量,另一方面產(chǎn)生的所有候選區(qū)域中,除了行人目標(biāo)位置外,還包括汽車等非行人區(qū)域,在非行人目標(biāo)中如果存在類似于行人的區(qū)域,則也會(huì)對(duì)算法性能產(chǎn)生影響,如圖 3.8 所示為本章算法在測(cè)試集中發(fā)生的部分誤檢情況示意圖,圖 3.8(a)中將汽車尾燈誤檢為行人目標(biāo),圖 3.8(b)中將輪廓與行人類似的交通燈誤檢為行人,圖 3.8(c)中將燈柱誤檢為行人,從而影響算法整體性能。
【參考文獻(xiàn)】:
期刊論文
[1]行人檢測(cè)技術(shù)綜述[J]. 蘇松志,李紹滋,陳淑媛,蔡國(guó)榕,吳云東. 電子學(xué)報(bào). 2012(04)
本文編號(hào):3502429
【文章來源】:南京郵電大學(xué)江蘇省
【文章頁(yè)數(shù)】:64 頁(yè)
【學(xué)位級(jí)別】:碩士
【部分圖文】:
CaffeNet網(wǎng)絡(luò)結(jié)構(gòu)下的深度學(xué)習(xí)特征示例圖
南京郵電大學(xué)碩士研究生學(xué)位論文 第三章基于多級(jí)特征融合的行人檢測(cè)算法研究set06~set10 五個(gè)子集,按照每 30 幀提取一幀共得到 4024 張測(cè)試圖像,圖像大小為 640 480,分辨率普遍較低且行人尺寸較小,測(cè)試集中行人正樣本定義為高度超過 49 個(gè)像素,遮擋小于35%的行人,是所有行人檢測(cè)數(shù)據(jù)集中較難檢測(cè)的數(shù)據(jù)集。該測(cè)試集中的行人包含了遮擋、行人姿態(tài)和雜亂背景等復(fù)雜場(chǎng)景中行人檢測(cè)算法需要解決的各種技術(shù)難點(diǎn),如圖 3.6 所示為Caltech 數(shù)據(jù)集測(cè)試集圖像示例。使用選擇搜索性算法在測(cè)試集圖像上得到行人候選區(qū)域,在每張圖像上產(chǎn)生約 2000 個(gè)行人候選區(qū)并用上述訓(xùn)練得到的多級(jí)特征融合網(wǎng)絡(luò)模型做分類,判斷該區(qū)域是不是行人區(qū)域,并以 MissRate 為評(píng)價(jià)標(biāo)準(zhǔn)的前提下和其他算法做比較。
南京郵電大學(xué)碩士研究生學(xué)位論文 第三章基于多級(jí)特征融合的行人檢測(cè)算法研究卷積神經(jīng)網(wǎng)絡(luò)提取的低層特征和高層特征得到魯棒性較強(qiáng)的多級(jí)融合特征訓(xùn)練分類器,在一定程度上提高算法效果,但是距離完美解決 Caltech 行人數(shù)據(jù)集上的檢測(cè)任務(wù)還有很長(zhǎng)距離,針對(duì)其算法缺陷,分析其性能改進(jìn)可能存在于以下方面:行人候選區(qū)域產(chǎn)生步驟的優(yōu)化。上述基于多級(jí)特征融合的行人檢測(cè)算法以選擇性搜索算法作為其候選區(qū)域產(chǎn)生器,在每張圖像上產(chǎn)生約 2000 個(gè)行人候選區(qū)是不實(shí)際的,因?yàn)閱螐垐D像上不可能同時(shí)存在這么多行人,產(chǎn)生的 2000 個(gè)行人候選區(qū)域中,有將近 99%都是冗余窗口,而這些區(qū)域的存在一方面會(huì)增加后續(xù)算法的計(jì)算量,另一方面產(chǎn)生的所有候選區(qū)域中,除了行人目標(biāo)位置外,還包括汽車等非行人區(qū)域,在非行人目標(biāo)中如果存在類似于行人的區(qū)域,則也會(huì)對(duì)算法性能產(chǎn)生影響,如圖 3.8 所示為本章算法在測(cè)試集中發(fā)生的部分誤檢情況示意圖,圖 3.8(a)中將汽車尾燈誤檢為行人目標(biāo),圖 3.8(b)中將輪廓與行人類似的交通燈誤檢為行人,圖 3.8(c)中將燈柱誤檢為行人,從而影響算法整體性能。
【參考文獻(xiàn)】:
期刊論文
[1]行人檢測(cè)技術(shù)綜述[J]. 蘇松志,李紹滋,陳淑媛,蔡國(guó)榕,吳云東. 電子學(xué)報(bào). 2012(04)
本文編號(hào):3502429
本文鏈接:http://sikaile.net/kejilunwen/sousuoyinqinglunwen/3502429.html
最近更新
教材專著