復雜場景中的行人檢測算法研究
發(fā)布時間:2021-11-18 06:54
行人檢測的任務是判斷給定的圖像中是否包含行人并給出坐標,有廣泛的應用前景;谌斯ぴO計特征的行人檢測算法不能有效解決復雜場景中的的行人檢測問題,導致出現(xiàn)較嚴重的誤檢和漏檢情況,而目前所用的基于深度學習的行人檢測算法不能有效利用圖像語義信息,針對以上問題,本文做了以下研究工作:1.針對基于人工設計特征的行人檢測算法不能有效解決復雜場景中的行人檢測問題,提出一種基于多級特征融合的行人檢測算法,為了增強卷積神經(jīng)網(wǎng)絡提取特征的魯棒性,在現(xiàn)有網(wǎng)絡結構基礎上改進得到的網(wǎng)絡模型結合卷積神經(jīng)網(wǎng)絡淺層和深層特征,實驗表明,該算法在場景較復雜的數(shù)據(jù)集中也有較好的檢測性能,同時增強算法的魯棒性。2.針對選擇性搜索算法產生候選區(qū)域速度慢且冗余高的問題,提出行人候選區(qū)域去冗余算法,使用多策略融合方式產生質量更高的行人候選區(qū)域以提高算法的檢測性能,通過結合二值規(guī)范化梯度和行人檢測器,降低了所生成候選區(qū)域的冗余度,實驗表明,對于行人檢測任務,所提出的行人候選區(qū)域去冗余算法能夠以很快的速度產生高質量的行人候選區(qū)域。3.為了進一步降低復雜背景對算法性能的影響同時有效利用圖像本身語義信息,提出基于分割語義優(yōu)化的行人檢測算...
【文章來源】:南京郵電大學江蘇省
【文章頁數(shù)】:64 頁
【學位級別】:碩士
【部分圖文】:
CaffeNet網(wǎng)絡結構下的深度學習特征示例圖
南京郵電大學碩士研究生學位論文 第三章基于多級特征融合的行人檢測算法研究set06~set10 五個子集,按照每 30 幀提取一幀共得到 4024 張測試圖像,圖像大小為 640 480,分辨率普遍較低且行人尺寸較小,測試集中行人正樣本定義為高度超過 49 個像素,遮擋小于35%的行人,是所有行人檢測數(shù)據(jù)集中較難檢測的數(shù)據(jù)集。該測試集中的行人包含了遮擋、行人姿態(tài)和雜亂背景等復雜場景中行人檢測算法需要解決的各種技術難點,如圖 3.6 所示為Caltech 數(shù)據(jù)集測試集圖像示例。使用選擇搜索性算法在測試集圖像上得到行人候選區(qū)域,在每張圖像上產生約 2000 個行人候選區(qū)并用上述訓練得到的多級特征融合網(wǎng)絡模型做分類,判斷該區(qū)域是不是行人區(qū)域,并以 MissRate 為評價標準的前提下和其他算法做比較。
南京郵電大學碩士研究生學位論文 第三章基于多級特征融合的行人檢測算法研究卷積神經(jīng)網(wǎng)絡提取的低層特征和高層特征得到魯棒性較強的多級融合特征訓練分類器,在一定程度上提高算法效果,但是距離完美解決 Caltech 行人數(shù)據(jù)集上的檢測任務還有很長距離,針對其算法缺陷,分析其性能改進可能存在于以下方面:行人候選區(qū)域產生步驟的優(yōu)化。上述基于多級特征融合的行人檢測算法以選擇性搜索算法作為其候選區(qū)域產生器,在每張圖像上產生約 2000 個行人候選區(qū)是不實際的,因為單張圖像上不可能同時存在這么多行人,產生的 2000 個行人候選區(qū)域中,有將近 99%都是冗余窗口,而這些區(qū)域的存在一方面會增加后續(xù)算法的計算量,另一方面產生的所有候選區(qū)域中,除了行人目標位置外,還包括汽車等非行人區(qū)域,在非行人目標中如果存在類似于行人的區(qū)域,則也會對算法性能產生影響,如圖 3.8 所示為本章算法在測試集中發(fā)生的部分誤檢情況示意圖,圖 3.8(a)中將汽車尾燈誤檢為行人目標,圖 3.8(b)中將輪廓與行人類似的交通燈誤檢為行人,圖 3.8(c)中將燈柱誤檢為行人,從而影響算法整體性能。
【參考文獻】:
期刊論文
[1]行人檢測技術綜述[J]. 蘇松志,李紹滋,陳淑媛,蔡國榕,吳云東. 電子學報. 2012(04)
本文編號:3502429
【文章來源】:南京郵電大學江蘇省
【文章頁數(shù)】:64 頁
【學位級別】:碩士
【部分圖文】:
CaffeNet網(wǎng)絡結構下的深度學習特征示例圖
南京郵電大學碩士研究生學位論文 第三章基于多級特征融合的行人檢測算法研究set06~set10 五個子集,按照每 30 幀提取一幀共得到 4024 張測試圖像,圖像大小為 640 480,分辨率普遍較低且行人尺寸較小,測試集中行人正樣本定義為高度超過 49 個像素,遮擋小于35%的行人,是所有行人檢測數(shù)據(jù)集中較難檢測的數(shù)據(jù)集。該測試集中的行人包含了遮擋、行人姿態(tài)和雜亂背景等復雜場景中行人檢測算法需要解決的各種技術難點,如圖 3.6 所示為Caltech 數(shù)據(jù)集測試集圖像示例。使用選擇搜索性算法在測試集圖像上得到行人候選區(qū)域,在每張圖像上產生約 2000 個行人候選區(qū)并用上述訓練得到的多級特征融合網(wǎng)絡模型做分類,判斷該區(qū)域是不是行人區(qū)域,并以 MissRate 為評價標準的前提下和其他算法做比較。
南京郵電大學碩士研究生學位論文 第三章基于多級特征融合的行人檢測算法研究卷積神經(jīng)網(wǎng)絡提取的低層特征和高層特征得到魯棒性較強的多級融合特征訓練分類器,在一定程度上提高算法效果,但是距離完美解決 Caltech 行人數(shù)據(jù)集上的檢測任務還有很長距離,針對其算法缺陷,分析其性能改進可能存在于以下方面:行人候選區(qū)域產生步驟的優(yōu)化。上述基于多級特征融合的行人檢測算法以選擇性搜索算法作為其候選區(qū)域產生器,在每張圖像上產生約 2000 個行人候選區(qū)是不實際的,因為單張圖像上不可能同時存在這么多行人,產生的 2000 個行人候選區(qū)域中,有將近 99%都是冗余窗口,而這些區(qū)域的存在一方面會增加后續(xù)算法的計算量,另一方面產生的所有候選區(qū)域中,除了行人目標位置外,還包括汽車等非行人區(qū)域,在非行人目標中如果存在類似于行人的區(qū)域,則也會對算法性能產生影響,如圖 3.8 所示為本章算法在測試集中發(fā)生的部分誤檢情況示意圖,圖 3.8(a)中將汽車尾燈誤檢為行人目標,圖 3.8(b)中將輪廓與行人類似的交通燈誤檢為行人,圖 3.8(c)中將燈柱誤檢為行人,從而影響算法整體性能。
【參考文獻】:
期刊論文
[1]行人檢測技術綜述[J]. 蘇松志,李紹滋,陳淑媛,蔡國榕,吳云東. 電子學報. 2012(04)
本文編號:3502429
本文鏈接:http://sikaile.net/kejilunwen/sousuoyinqinglunwen/3502429.html
最近更新
教材專著