圖像中的行人檢測關鍵技術研究
發(fā)布時間:2022-07-29 20:02
在自動駕駛、智能視頻監(jiān)控、人機交互等現(xiàn)實應用的驅動下,利用計算機視覺技術對環(huán)境特定目標進行檢測、識別和跟蹤,已經成為學術研究的熱點需求和重要方向。而在環(huán)境目標中,行人是最受關注的類別之一,近年來行人檢測問題的研究進展十分迅速,并得到了工業(yè)界的初步應用。行人檢測的核心是一個關于背景與行人的二分類問題,其難點在于背景以及行人受尺度、遮擋等影響產生的豐富變化對行人檢測器產生了干擾;為應對這些變化,論文從特征提取與分類算法兩個方面開展研究,具體如下:第一,提出了使用線性判別分析選擇的自相似特征。以自相似特征為基礎,針對其維度與基特征維度呈平方關系,難以運用于高分辨率特征圖的問題,利用線性判別分析,從所有自相似特征中提取對背景與行人具有良好的類間區(qū)分性與類內不變性的特征,降低了自相似特征維度。該方法計算高效,易于擴展,所得特征在直觀上具有物理合理性。實驗結果表明,使用該特征訓練的行人檢測器在Caltech數(shù)據(jù)集上的對數(shù)平均漏檢率達到13.96%。第二,提出了使用尺度相關池化特征與軟決策樹的行人檢測算法。以多分辨率濾波通道為基礎,針對不同尺度行人特征感受野不對應的問題,提出尺度相關池化特征,使得特...
【文章頁數(shù)】:132 頁
【學位級別】:博士
【文章目錄】:
摘要
abstract
縮略詞表
主要數(shù)學符號表
第一章 緒論
1.1 背景與挑戰(zhàn)
1.2 主要研究內容與貢獻
1.3 論文結構及內容安排
第二章 圖像中的行人檢測關鍵技術研究現(xiàn)狀
2.1 引言
2.2 行人檢測的基本流程
2.2.1 候選區(qū)域生成
2.2.2 窗口分類
2.2.3 非極大抑制
2.3 行人檢測的特征提取
2.3.1 Haar特征
2.3.2 聚合通道特征
2.3.3 運動信息特征
2.4 行人檢測的分類算法
2.4.1 提升樹算法
2.4.2 級聯(lián)決策樹
2.5 行人檢測性能評價
2.5.1 公共數(shù)據(jù)集
2.5.2 性能評價方式
2.6 小結
第三章 自相似特征優(yōu)化與行人檢測
3.1 引言
3.2 聚集通道特征的線性變換
3.3 廣義瑞利熵準則下的特征優(yōu)化
3.3.1 自相似特征與特征投影的聯(lián)系
3.3.2 LDA,SLDA與斜分裂面
3.3.3 使用LDA的特征選擇
3.3.4 帶區(qū)域限制的FSSS特征
3.3.5 兩階段級聯(lián)決策樹
3.3.6 訓練流程
3.3.7 特征可視化
3.3.8 與其它特征選擇方法的聯(lián)系
3.4 實驗結果與分析
3.4.1 實驗細節(jié)
3.4.2 在INRIA數(shù)據(jù)集上的實驗
3.4.3 在KITTI數(shù)據(jù)集上的實驗
3.4.4 在Caltech數(shù)據(jù)集上的實驗
3.5 小結
第四章 單尺度特征通道快速行人檢測
4.1 引言
4.2 多尺度行人檢測方案
4.2.1 圖像金字塔與分類器金字塔
4.2.2 多分辨率濾波通道
4.3 尺度相關池化特征
4.3.1 多分辨率濾波通道感受野分析
4.3.2 尺度相關的池化特征
4.4 軟決策樹
4.5 滑動窗分類加速方法
4.5.1 地平線約束
4.5.2 稀疏網格檢測
4.6 實驗結果與分析
4.6.1 實驗細節(jié)
4.6.2 在KITTI數(shù)據(jù)集上的實驗
4.6.3 在Caltech數(shù)據(jù)集上的實驗
4.7 小結
第五章 分層多姿態(tài)學習與行人檢測
5.1 引言
5.2 現(xiàn)有遮擋行人檢測算法分析
5.2.1 遮擋行人檢測的基本框架
5.2.2 對于遮擋的理解
5.3 行人部件的聯(lián)合學習算法
5.3.1 行人部件的分層表示
5.3.2 多姿態(tài)學習
5.3.3 分層多姿態(tài)學習
5.3.4 實現(xiàn)細節(jié)討論
5.4 實驗結果與分析
5.4.1 實驗細節(jié)
5.4.2 在KITTI數(shù)據(jù)集上的實驗
5.4.3 在INRIA數(shù)據(jù)集上的實驗
5.4.4 在Caltech數(shù)據(jù)集上的實驗
5.5 小結
第六章 全文總結與展望
6.1 本文貢獻
6.2 后續(xù)工作展望
致謝
參考文獻
攻讀博士學位期間取得的成果
【參考文獻】:
期刊論文
[1]監(jiān)控視頻運動目標檢測減背景技術的研究現(xiàn)狀和展望[J]. 代科學,李國輝,涂丹,袁見. 中國圖象圖形學報. 2006(07)
本文編號:3667095
【文章頁數(shù)】:132 頁
【學位級別】:博士
【文章目錄】:
摘要
abstract
縮略詞表
主要數(shù)學符號表
第一章 緒論
1.1 背景與挑戰(zhàn)
1.2 主要研究內容與貢獻
1.3 論文結構及內容安排
第二章 圖像中的行人檢測關鍵技術研究現(xiàn)狀
2.1 引言
2.2 行人檢測的基本流程
2.2.1 候選區(qū)域生成
2.2.2 窗口分類
2.2.3 非極大抑制
2.3 行人檢測的特征提取
2.3.1 Haar特征
2.3.2 聚合通道特征
2.3.3 運動信息特征
2.4 行人檢測的分類算法
2.4.1 提升樹算法
2.4.2 級聯(lián)決策樹
2.5 行人檢測性能評價
2.5.1 公共數(shù)據(jù)集
2.5.2 性能評價方式
2.6 小結
第三章 自相似特征優(yōu)化與行人檢測
3.1 引言
3.2 聚集通道特征的線性變換
3.3 廣義瑞利熵準則下的特征優(yōu)化
3.3.1 自相似特征與特征投影的聯(lián)系
3.3.2 LDA,SLDA與斜分裂面
3.3.3 使用LDA的特征選擇
3.3.4 帶區(qū)域限制的FSSS特征
3.3.5 兩階段級聯(lián)決策樹
3.3.6 訓練流程
3.3.7 特征可視化
3.3.8 與其它特征選擇方法的聯(lián)系
3.4 實驗結果與分析
3.4.1 實驗細節(jié)
3.4.2 在INRIA數(shù)據(jù)集上的實驗
3.4.3 在KITTI數(shù)據(jù)集上的實驗
3.4.4 在Caltech數(shù)據(jù)集上的實驗
3.5 小結
第四章 單尺度特征通道快速行人檢測
4.1 引言
4.2 多尺度行人檢測方案
4.2.1 圖像金字塔與分類器金字塔
4.2.2 多分辨率濾波通道
4.3 尺度相關池化特征
4.3.1 多分辨率濾波通道感受野分析
4.3.2 尺度相關的池化特征
4.4 軟決策樹
4.5 滑動窗分類加速方法
4.5.1 地平線約束
4.5.2 稀疏網格檢測
4.6 實驗結果與分析
4.6.1 實驗細節(jié)
4.6.2 在KITTI數(shù)據(jù)集上的實驗
4.6.3 在Caltech數(shù)據(jù)集上的實驗
4.7 小結
第五章 分層多姿態(tài)學習與行人檢測
5.1 引言
5.2 現(xiàn)有遮擋行人檢測算法分析
5.2.1 遮擋行人檢測的基本框架
5.2.2 對于遮擋的理解
5.3 行人部件的聯(lián)合學習算法
5.3.1 行人部件的分層表示
5.3.2 多姿態(tài)學習
5.3.3 分層多姿態(tài)學習
5.3.4 實現(xiàn)細節(jié)討論
5.4 實驗結果與分析
5.4.1 實驗細節(jié)
5.4.2 在KITTI數(shù)據(jù)集上的實驗
5.4.3 在INRIA數(shù)據(jù)集上的實驗
5.4.4 在Caltech數(shù)據(jù)集上的實驗
5.5 小結
第六章 全文總結與展望
6.1 本文貢獻
6.2 后續(xù)工作展望
致謝
參考文獻
攻讀博士學位期間取得的成果
【參考文獻】:
期刊論文
[1]監(jiān)控視頻運動目標檢測減背景技術的研究現(xiàn)狀和展望[J]. 代科學,李國輝,涂丹,袁見. 中國圖象圖形學報. 2006(07)
本文編號:3667095
本文鏈接:http://sikaile.net/kejilunwen/shengwushengchang/3667095.html
最近更新
教材專著