特定場景下的可變形部件模型
發(fā)布時間:2017-10-31 01:06
本文關(guān)鍵詞:特定場景下的可變形部件模型
更多相關(guān)文章: 物體檢測 概率圖模型 可變形部件模型 場景相關(guān)特征 加速算法
【摘要】:物體檢測長期以來都是計算機視覺中的基本問題之一,是進行場景理解,行為分析的基礎(chǔ),在視頻監(jiān)控、自動駕駛系統(tǒng)、機器人制造等問題中得到了廣泛的應(yīng)用。當前主流的檢測算法采用基于滑動窗口的檢測策略:從滑動窗口中提取特征,將檢測問題轉(zhuǎn)化為二值分類問題,即判斷待檢測目標是否存在于當前窗口中。由于物體的視覺特征會隨著視角、光照、姿態(tài)等條件的變化而變化,給檢測任務(wù)帶來了很大的難度。大多數(shù)檢測算法關(guān)注的是靜態(tài)圖像的檢測,而特定場景下的物體檢測又帶來了新的挑戰(zhàn):首先,物體尺度范圍非常大,滑動窗口大小的選擇需要平衡,若窗口過大,則對小尺度目標容易產(chǎn)生漏檢;若窗口過小,則容易產(chǎn)生虛檢;其次,現(xiàn)實世界中的物體紛繁復(fù)雜,小尺度物體的視覺信息不足,極易產(chǎn)生漏檢或者與背景發(fā)生混淆。訓練時間也是檢測模型的一大瓶頸,模型的泛化能力有限,針對特定場景訓練的檢測難以遷移到新的場景。針對上述問題,我們擬利用特定場景提供的上下文信息,采用場景相關(guān)特征提高檢測精度,將可變形部件模型擴展到多尺度結(jié)構(gòu),使用概率圖模型結(jié)合檢測模型和場景相關(guān)特征進行聯(lián)合估計。本文的主要研究工作如下:1.分析了特定場景下物體檢測問題的難點:物體尺度變化及復(fù)雜背景帶來的干擾。針對特定場景,在傳統(tǒng)的基于局部圖像信息的檢測策略的基礎(chǔ)上,采用基于上下文信息的檢測思路,充分利用場景所提供的相關(guān)信息,提升檢測精度。提出了將可變形部件模型作為局部檢測器,使用概率圖模型將局部檢測器與場景相關(guān)的上下文特征結(jié)合的特定場景可變形部件模型。2.對物體檢測加速算法進行了研究。通過性能分析發(fā)現(xiàn),濾波器與圖像特征圖的卷積運算是檢測過程中耗時最長的部分,即算法性能瓶頸所在。將基于頻域加速的卷積加速算法應(yīng)用于可變形部件模型上,分析了傳統(tǒng)卷積算法和頻域加速算法的時間復(fù)雜度,并進行了實現(xiàn)。3.在兩個特定場景公共數(shù)據(jù)集CAVIAR和LISA上進行了實驗,從檢測準確率和檢測算法效率兩個角度對實驗結(jié)果進行了分析,實驗結(jié)果證明了使用場景相關(guān)信息能夠提升檢測準確率,同時頻域卷積加速算法能夠有效提升算法效率。
【關(guān)鍵詞】:物體檢測 概率圖模型 可變形部件模型 場景相關(guān)特征 加速算法
【學位授予單位】:上海交通大學
【學位級別】:碩士
【學位授予年份】:2015
【分類號】:TP391.41
【目錄】:
- 摘要3-5
- ABSTRACT5-11
- 第一章 引言11-15
- 1.1 研究背景及意義11-12
- 1.2 本文主要工作12-13
- 1.3 章節(jié)安排13-15
- 第二章 物體檢測算法綜述15-29
- 2.1 研究問題及其難點15-18
- 2.2 研究現(xiàn)狀18-22
- 2.2.1 主流物體檢測數(shù)據(jù)庫18-19
- 2.2.2 PASCAL競賽物體檢測項目優(yōu)勝算法回顧19-22
- 2.3 典型物體檢測系統(tǒng)框架22-28
- 2.3.1 特征提取23-24
- 2.3.2 機器學習算法24-28
- 2.4 本章小結(jié)28-29
- 第三章 可變形部件模型29-43
- 3.1 可變形部件模型29-31
- 3.2 物體檢測31-32
- 3.3 混合分量32-33
- 3.4 隱變量支持向量機33-37
- 3.4.1 半凸性33-34
- 3.4.2 隨機梯度下降法34
- 3.4.3 適用于SVM的困難樣本挖掘算法34-35
- 3.4.4 適用于LSVM的困難樣本挖掘算法35-37
- 3.5 模型訓練37-39
- 3.5.1 參數(shù)學習37-38
- 3.5.2 初始化38-39
- 3.6 改進的HOG特征39-41
- 3.7 后處理41-42
- 3.7.1 包圍盒預(yù)測41-42
- 3.7.2 非極大值抑制42
- 3.8 本章小結(jié)42-43
- 第四章 特定場景下的可變形部件模型43-54
- 4.1 多尺度可變形部件模型44-47
- 4.1.1 單一分辨率檢測模型44-45
- 4.1.2 多個單一分辨率檢測模型45-46
- 4.1.3 多尺度可變形部件模型46-47
- 4.2 場景相關(guān)特征47-48
- 4.2.1 地平面估計47-48
- 4.2.2 物體位置估計48
- 4.3 圖模型框架48-49
- 4.4 頻域卷積加速算法49-52
- 4.4.1 卷積運算的時間復(fù)雜度分析50
- 4.4.2 基于快速傅里葉變換的加速算法50-51
- 4.4.3 特征金字塔拼接51-52
- 4.5 本章小結(jié)52-54
- 第五章 實驗結(jié)果與分析54-63
- 5.1 實驗環(huán)境及數(shù)據(jù)集介紹54-55
- 5.1.1 實驗軟件及硬件環(huán)境54
- 5.1.2 數(shù)據(jù)集54-55
- 5.2 檢測準確率55-59
- 5.2.1 評價指標55-56
- 5.2.2 CAVIAR視頻監(jiān)控數(shù)據(jù)集檢測結(jié)果56-59
- 5.3 場景遷移能力59-61
- 5.4 卷積加速61-62
- 5.5 本章小結(jié)62-63
- 第六章 總結(jié)與展望63-66
- 6.1 本文總結(jié)63
- 6.2 今后工作和展望63-66
- 參考文獻66-71
- 致謝71-72
- 攻讀碩士學位期間已發(fā)表或錄用的論文72-74
【參考文獻】
中國期刊全文數(shù)據(jù)庫 前1條
1 黃凱奇;任偉強;譚鐵牛;;圖像物體分類與檢測算法綜述[J];計算機學報;2014年06期
,本文編號:1120092
本文鏈接:http://sikaile.net/shoufeilunwen/xixikjs/1120092.html
最近更新
教材專著